MDict 是一款用于WinCE PDA的支持多语言的电子辞典,软体本身不提供辞典数据,而是直接使用现有的辞典数据。
基本介绍
- 中文名词库
- 外文名mdict
- 开发人Rayman Zhang
- 国家中国
介绍
MDict软体是一款由中国的Rayman Zhang(张文伟)开发的、用于查看各种mdx格式词典档案的阅读器(mdx格式词典档案又被称为“词库”;mdx为此类档案的扩展名)。电脑、手机需要运行相应的MDict软体。目前,MDict软体最新正式版为MDict for PC 1.3beta 【2012年6月8日更新,适用于电脑,Windows XP或Vista系统】;MDict 3.2【2010年7月7日更新,适用于手机,有自动、手动两种安装包;又细分为多种适用于不同手机作业系统的MDict软体】。PPC、HPC、Smartphone、魅族M8、iPhone、三星Bada作业系统的智慧型手机可以运行该软体,Symbian系统作业系统的智慧型手机则暂无法运行它,Android(安卓)作业系统可以使用。
MDict软体本身并不提供“词库”,但软体作者提供了“词库”製作工具。目前由第三方为MDict製作的“词库”包括维基百科、中文百科、现代汉语词典、成语词典、唐诗鉴赏词典、牛津英汉双解词典等等,现已达两千种。
特色
优点
对个人非商业用途免费!
多语言支持
支持使用多个辞典档案,可以自己製作词库
支持词典联合和全文检索
支持线上取词
内置简/繁体转换
支持PPC/HPC/Smartphone作业系统
词库格式採用压缩算法,体积较小
运行速度较理想
支持线上取词
缺点
词库数目远超过10个时,不易在各词库之间迅速切换
查看MDict版维基百科的时候,常因简/繁体转换而产生无法跳转连结的情况(但一般可通过更改简/繁体转换设定加以解决)
安装
Smartphone版本
⒈ 自动安装版
a) 安装程式
b) 将数据档案放到记忆体或者存储卡上的任意目录里
c) 运行MDict,选Library->Search all. 程式会自动查找所有".mdx"结尾的档案,并在Library选单下显示。
d) 在Library选单里选择你需要使用的数据档案
e) 可以开始使用,用Back键可以切换到输入状态,Enter键进行查找.
⒉ 手动安装版
a) 选择对应你的机器的安装包,在存储卡上建一个MDict的目录,然后将安装包解压到那个目录下
b) 剩下的和自动安装包的步骤一样。
PPC/HPC版本
⒈ 自动安装版
a) 安装程式
b) 将数据档案放到记忆体或者存储卡上的"My Documents"目录里
c) 运行MDict,选Library->Open Library来打开档案.或者"Library->Search all" 程式会自动查找所有".mdx"结尾的档案,并在Library选单下显示。
d) 在Library选单里选择你需要使用的数据档案
e) 开始使用
⒉ 手动安装版
a) 选择对应你的机器的安装包,在存储卡上建一个MDict的目录,然后将安装包解压到那个目录下
b) 剩下的和自动安装包的步骤一样。
更新记录
MDict v1.0RC3
增加了多辞典模式下的标籤模式显示及摺叠展开。
MDict v1.0RC4
增加字型选择,文本颜色背景色设定;Ctrl+滑鼠滚轮放大缩小;选项对话框中增加展开摺叠相关选项;一些bugfix。
MDict v1.0正式版
⒈恢复旧版原有的关键字模糊查询和全文搜寻。2.单词列表窗支持Ctrl+滑鼠滚轮进行字型大小调整。3.将字型选择改为在选单中选择。4.支持将选中的条目显示在单词列表中间。5.bugfix。
MDict v1.1
⒈支持页内查找; 2. 在安装了IE7及以上版本的电脑上可以多级放大正文窗; 3.一些bugfix。
MDict v1.2
主要是bugfix
MDict v1.3beta
主要是改进了多词典模式的兼容性以及一些bugfix.
製作方法
製作常用文本格式
转换软体MdxBuilder
製作MdxBuilder转换所需的原始格式txt文本档案
最常用的是MDict的html格式
每个项目两行
第一行是关键字
第二行开始是正文,这里的正文应该包括关键字。可以使用html的标记(不要包含<html>
<body></body></html>;,这个程式会自动加上,另注意在转换时要指明源数据为html).
如果需要显示音标的话,可以利用html指定字型就可以显示了。(参见下面的例子)
正文结束后必须用一行</>;表示结束
例子: 1.txt
词条1标题Whole
词条1内容<font size=5>whole</font><br><font face="Kingsoft Phonetic Plain,Tahoma">(hol,hJl; houl)</font>
</>
词条2标题
词条2内容
</>
词条3标题
词条3内容
</>
(注意"</>"和下一个记录间不要有任何其他空行,请参考example.txt中的例子)
在html中连线到其它关键字的方法
<a href="entry://key">key</a>
其中key是关键字,
词条内部跳转方法<a href="entry://#1">目录一</a>(一定要有<a name=1></a>;相对应)
在html中嵌入图片的方法)
<img src=file:///abc.gif>其中src指向的档案名称大小写不敏感
并将所有图片档案放在一个单独的目录中(不要与词典源档案放在同一目录中). 数据目录中可以
带有子目录。在使用MdxBuilder製作词库时,将Data路径指向上面存放数据的目录,该目录中的
所有档案都会被压缩到后缀名为.mdd档案中,使用时该.mdd档案应当与.mdx档案在同一目录下。
製作常用工具
UltraEdit-32
编辑工具
UEDIT查找替换高级教程(製作电子书与MDIT辞典必看)
其实UEDIT32的搜寻替换至少有两个最明显的优点
一、执行速度非常快,是WORD的数千倍,不信你打开一个20M的TXT文档,用UEDIT替换只要3秒钟,用WORD看要不要几个钟头?
二、UEDIT的替换内容可以包括查找到的内容,这是在WORD以及更高级更专业的“微软正则表达式”所都无法支持的,不过这个套用可能大部分的朋友都不知道。
虽然许多极其複杂的文档查找与替换必须使用较专业的正则表达式来处理,但对于一般甚至比较高级的操作来说,UEDIT还是我们的不二选择。现在我来简要介绍一下UEDIT的查找与替换的高级套用。
以下的示例使用中文版UEDIT10进行讲解
⒈ UEDIT查找的快捷键是Ctrl+F(find)或ALT-F3,替换的快捷键是Ctrl+R(replace),查找的快捷键是F3。
⒉ 一般查找与替换功能
※在查找/替换框内将“正规表达式”的√给去除,并分别在查找与替换的框格内输入所需的字元,执行查找与替换即可。
※如果需要匹配回车键,在查找框中可输入^p(注意p是小写)来代替回车键
说明在unix格式中^n表示换行,而在mac的文本格式中^r 表示换行,dos格式中^p 表示换行,不过一般情况下^p 可以兼容^r 或^p
举例
将
dfdf
ss
fssdf给替换为dfdf,ss,fssdf格式可在查找中输入^p,替换中输入,(半角逗号)即可。
反之将dfdf,ss,fssdf给替换成以上三行只要在查找中输入,(半角逗号),替换中输入^p即可。
高级查找部分
⒈要记住将查找/替换框中的正规表达式给√上
⒉常用的查找/替换命令
% 匹配行头(0字元,仅是匹配一个位置)
$ 匹配行尾(0字元,仅是匹配一个位置)
? 在一行中匹配一个单字元
匹配一个或多个字元(不允许跨行匹配)
+ 匹配+左边的那个字元一或多次(不允许跨行匹配).
++ 匹配+左边的那个字元零或多次(不允许跨行匹配).
^b 匹配分页
^p 匹配DOS文本的换行符(通用)
^r 匹配MAC文本的换行符
^n 匹配UNⅨ格式文本的换行符(在wondows作业系统中一般情况下可与^p互换)
^t 匹配tab符
[ ] 匹配单字元或字元範围
^{A^}^{B^} 匹配A或匹配B
^(...^) 用于替换框中代替查找的内容
EditPlus v3.1汉化版
适合少量文本档案批处理,支持不超过50M的单个档案,拥有强大的正则表达式处理功能。
菲菲更名宝贝
支持档案批量、改名以网页标题更名、以文本档案的第一行更名,各种内码转换等等;
TextForever
编码转换,批量htm网页转txt文本
包括HTML到文本档案的转换、档案合併、档案切分、段落合併、段落切分、内码转换(只能在Win 2k/XP下用)、文本替换、HTML整理、文本抽取、正则表达式(需要IE 5.5以上版本的支持)、批量OCR、tcr档案压缩/解压等功能。
teleport pro网站网页抓取软体
Teleport Pro可以从Internet的任何地方抓回你想要的任何档案,它可以在你指定的时间自动登录到你指定的网站下载你指定的内容,你还可以用它来创建某个网站的完整的镜象,作为创建你自己的网站的参考。
wget绿色版下载工具
是一个从网路上自动下载档案的自由工具。
wget可以跟蹤HTML页面上的连结依次下载来创建远程伺服器的本地版本,完全重建原始站点的目录结构。这又常被称作"递归下载"。在递归下载的时候,wget遵循Robot Exclusion标準(/robots.txt). wget可以在下载的,将连结转换成指向本地档案,以方便离线浏览。
wget非常稳定,它在频宽很窄的情况下和不稳定网路中有很强的适应性.如果是由于网路的原因下载失败,wget会不断的尝试,直到整个档案下载完毕。如果是伺服器打断下载过程,它会联到伺服器上从停止的地方继续下载。这对从那些限定了连结时间的伺服器上下载大档案非常有用。
数据处理方法
一、MDICT文本处理软体
感谢 nbdx-mmrs 网友製作此软体以下摘自原作者说明将自己电脑上很多的文本档案集合到一个MDICT字典去,经过软体处理,製作完全正常,比较方便,所以放上来让朋友们共享 希望能方便製作MDICT字典的朋友(电脑端软体) 通过程式,我只用几分钟,就将我电脑上的几千个文本档案整合到MDX档案了,分类明确,而且无错,感觉比较方便_
注意事项每个txt文本档案的名称作为词条标题,类别处请留空(删除“AA”)。
二、处理好txt文本或者htm档案后,可以利用中的方法导入资料库然后再导出为所需格式,支持无限多文本
或者比较少的数据可以使用这个工具
简单的编辑工具,MDict词库可视化编辑器(Mdx Source File Maker) V0.3
三、html2mdx
将html档案转换为MDict格式档案的程式 重点推荐!Wncable(Bowang)大侠的巨好工具软体,可以将Html格式一次性转换成符合Mdx格式要求的Txt档案,随后便可以用MdxBuilder软体直接生成Mdx档案了!
四、其他方法
a.逐条输入→MdxBuilder支持txt→MdxBuilder生成(适用于製作自己平时日积月累的东西,可以生成漂亮的表格)
b.利用MdxBuilder支持的格式的词库转(适用于转现成的SugarDict,KDict词典)
c.其他→(excel)→文字编辑软体(用UltraEdit-32好于EmEditor好于word)→MdxBuilder支持的txt文档格式→MdxBuilder生成(适用于高效製作一切能方便转为excel文档的词典)
六、txt档案词条合併工具Combine,绿色版
Wncable(Bowang)大侠的巨作,可将多个词典的相同词条合併成1个!
4、以上方法处理后得到的档案再用mdxbuilder转换
MdxBuilder关于选项的说明:
a) Key case sensitive
关键字(标题)是否大小写敏感。多数情况下词典是大小写不敏感的,所以不要选。
b) Allow export to text
是否允许导出为文本。如果选了,就可以用MdxExport这个工具吧词典导出为文本格式。
c) Right to left text
文字的阅读顺序。中文是从左到右,阿拉伯文之类的是从右到左。
d) Strip key
是否去掉关键字中的特殊符号。例如21世纪词典里的关键字是显示成"lis.ten" 这个样子的,如果不去掉".",则用户需要输入"lis.ten"而不是”listen"来查询单词。
e) Title
这个是用来标示词典的名字,计画将来在需要显示词典名称的地方进行显示用的。但目前暂时没有用处。
f) Description
词典的详细介绍。第一次打开词典时看到的欢迎页面。
g) Build Data archive
仅进行数据档案製作。主要是用来製作图库,声音库时用。勾选后就不用填写Source路径。
h) Index block size,Record block size. 这两个是调整性能用的,用预设值就好了。
i) Encryption Key
词典加密的密匙,用于词典授权用的。可以参见MdxBuilder.zip里的LibKeygen.txt的说明
注意事项
1、图片连结最好使用 <img src=file:///1/1.jpg> 这样的格式
2、转换出错一般是标题位置有多余的空行
如
词条1标题
词条1内容
</>
词条2内容
</>
3、mdxbuilder处理转换后的mdx文档大小应在4G以下