Multiterm可以导入的字典文件

来源:百度文库 编辑:神马文学网 时间:2024/06/13 13:30:09

MultiTerm词库导入方法总汇 网站上有关如何导入的贴子已经很多了,但一些新来的译友对这个问题还是不太明白。我将网站上有关的贴子收集整理了一下,一方面自己使用时查起来方便,另一方面,发出来也希望方便大家的查用。

老西式导入法:
1. 用Excel准备双语对照文件。以英汉对照文件为例:第一列原文,第二列译文。
2、将文件复制到WORD中,将表格转换为文字
3、将^P替换为<0}^P{0>,将制表符^T替换为<}0{>,将正文最后多余的标签删除,在正文第一行原文前加{0>。
4、打开TWB,创建新的TM后,TOOLS>CLEANUP,添加文件,勾选“UPDATE TM”,开始整理。

haha式导入法:
有两种办法:
1。一个一个的导入。
2。批量导入。
这里只谈第2种
若想将术语导入MultiTerm iX 6.01,必须安装 MultiTerm 5。MultiTerm 5 包含在trados5.5中,可以从trados官方网站下载。或到西兄的trados世界下载。
将术语导入MultiTerm iX的步骤:
1。用T-Win for excel把excel的词汇转变成multiterm 5能导入的txt文件格式,注意在excel首行标上English和Chinese。
2。新建MultiTerm 5词库,导入该txt文件。生成了mtw文件。
3。利用Multiterm migration tool 将此mtw文件转换成xml文件。注意:xml文件必须是英文名称。
4。利用Ultra Edit之类的编辑软件将“”替换为空格。即删除所有的“”。
5。新建MultiTerm IX的termbase,注意在step 1时 选择用 “Load an existing termbase definition file (XDT)”。<---关键。。。在step 3选择 Field Label 为汉语或者英语。<---关键。。。
否则不能正常显示!~
6。import entries. 选择好需要导入的xml文件,一步步地确定,就可以了。


解决中文和英文单词之间没有符号的问题:
我是用word和WPS office 结合着来做的。
用word可以将所有的英文字母替换为空格,然后每两个空格替换为回车。重复此操作。
删除其它一些无用符号。

WPS office 可以将所有的汉字符替换为空格,然后每两个空格替换为回车。重复此操作。
删除其它一些无用符号。
然后将两部分内容粘贴到excel当中,进行对照。
对照无误后,复制到word中把 表格换成 制表符,然后再将制表符替换成“||”。
复制到notepad中,保存即可。
各位在创建新库时 languages选项应在 avaliables index fields 添加english 和 chinese
我就是这么作的没有问题

这个“通配符”在word中“编辑”-->“替换”的“高级”中。我实在愚昧,不知如何用“通配符”来实现。
但是无意中发现了另一种替换方法,方法如下:
1。“编辑”-->“替换”。查找内容处填“^$”,或者:选择“高级”---“特殊字符”--“所有字母”
2。 替换为处为“”空。
3。 全部替换。
这样替换下来,就只剩下了汉语单词了。

但是无意中发现了另一种替换方法,方法如下:
1。“编辑”-->“替换”。查找内容处填“^$”,或者:选择“高级”---“特殊字符”--“所有字母”
2。 替换为处为“”空。
3。 全部替换。
这样替换下来,就只剩下了汉语单词了。

忘记加空格键了,应该是 [!][a-z,A-Z, ] 后面有一个空格,要不然就变成了字符窜了。

有没有选上 “通配符”这个复选筐。我用的是word2003。 [!][a-z,A-Z, ]这个表达式的意思式,非小写的字母,非大写的字母,及空格,替换为空。也就式说后面的方括号内是要保留的字符串。 上面同志出现的问题可能是由于每行结束是回车符,解决方法:1,把回车符(^p)全替换为换行符(^l) (不用勾通配符选项),然后再替换[!][a-z,A-Z, ,^l] (勾上通配符选项).应该可以了。

1,把文档转换成表格:全选—表格—转换—文本转换成表格:可避免替换后所有英文凑到一起的问题
2,查找:[!][a-z,A-z]替换为:“空格”,再选上“使用通配符”,这样,就不会变成字符串
本人用的是Office XP,其他版本应该也能适用

选使^p替换^l,同时选通配符,再使用[!][a-z,A-Z,,^l]替换处不写,不选能配符,这样出来是全英文,并且英文位置未动。

我制作的词汇对照表:
lodger || 房客与房东合住
boarder || 房客与房东同膳宿
tenant || 房客不与房东合住
landlady || 房东太太女房东
landlord || 房东大地主
是这样做的:
1. 去掉文中的“|”,“[]”,段落标记等;
2.把[!][a-z, A-Z, ', /, &, -]换成*, 得到英文;
3.在1的基础上,把“空白区域”换成“什么都没有”。
所以成了现在这样:“房东大地主”, 什么空格都没有了。
如果不做步骤3,去掉英文时在房东和大地主之间就会出现星号*。

Excel导入法
Excel表中建以下各列:
第一列:
第二列是序号,从1开始,用EXCEL的序列填充功能:
第三列:

第四列是使用者的名字,任意字母便可,如:haha
第五列:

第六列日期格式如: 2004-9-13
第七列:
    lang="EN"/>
第八列,英文:
第九列:
lang="ZH"/>
第十列汉语:
第十一列:

其中:第二列,按,1,2,3...填充。八和九列空起来。鼠标一拉几千个空白格式的excel表就出来了。保存好,做为模板。当然,按haha和老西他们的经验,最好少一点,比如建一千条的空白格式。以后你只要有了要填的词语,就直接在条八列中加入英语,九列中加入汉语,如果不足一千条,自然就将多余的空白格式条删除。(这个格式也可以保存为MS Word格式,加入词条方式是一样的,这样就省了后面保存为WORD格式这一步)。加好之后你就将其保存为WORD格式。
在WORD中,使用将表格转化为文字的命令,转化格式可以选“使用段落符”。
在查找替换中,查找“段落符”,替换为“无”(就是在替换中什么也不填)。
最后保存为TXT文件,纯文本格式。
之后你还得加上头尾:就是在最前面加上这句:
最后(尾部)加上标记:

大功告成,你只需要将扩展名改成xml就可以导入了。

当然,在使用过程中,有几次导入不成功的经验,其中有论坛其他贴子所提到的,文件名不能为中文,不仅如此,你的文件的上一级也不应是中文名。

雅信转换法:
Trados记忆库(TM)的导入方法
1. 用Excel准备双语对照文件。以英汉对照文件为例:第一列英语,第二列汉语(第一行分别标出English和Chinese).
2. 用YX3.5的库管理员创建一个空的记忆库。
3. 导入Excel 双语文件,然后再用TMX格式导出。
4. 用Trados创建一个空的记忆库,再把TMX格式的文件导入即可。



1。用Systran Premium 6试试,先导入Systran的用户词典,然后再导出为MultiTerm可以导入的文件格式
  令人困惑的Multiterm 7.0 术语导入问题
下载了Multiterm 7.0以后,也知道它有许多优点,例如,可以同时选择多个术语库,等等。但是,由于其术语导入问题始终解决不了,我一直还是在使用Multiterm iX版。最近,我重装了系统,又在Trados 中国组网站上下载了免注册版TmMaker,参考了它的帮助文件,终于解决了这个问题。在多家网站,我看到网友们和我有同样的困惑,在此将我的体会贡献出来,让更多的人能够使用Trados的这一Multiterm新版本。
1. Multiterm 7.0 导入术语的过程:
Multiterm 7.0 在导入术语时会产生一个*.LOG文件:

Import log information

General information:
Import definition name: Default import definition
Termbase name: 计算机术语
Import file: D:\新建文件夹\计算机\计算机技术专有名词.xml
Import log file: D:\新建文件夹\计算机\计算机技术专有名词.log
Exclusion file: D:\新建文件夹\计算机\c1.xcl
Allow over-complete entries: false
Allow incomplete entries: true
Ignore sub-languages: true
Fast import: false

Import Options:
Import all entries: Add import entry as new

Original Entry Number Action Entry Number in Termbase
1 Added 1
2 Added 2
3 Added 3
4 Added 4



498 Added 498
499 Added 499
500 Added 500

Total entries processed: 500
Total entries added: 500
Total entries merged: 0
Total entries omitted: 0
Total entries written to the output file: 0

Import process started: 03/04/2006 09:07:55
Import process ended: 03/04/2006 09:08:58
如果出现“Total entries processed:”到“Import process ended: 03/04/2006 09:08:58“,则导入的术语库是成功的。一般人往往在导入进程到95%时失败,这时产生的*.LOG文件到“500 Added 500“就停止了。是什么原因呢?根据我的体会,可能有以下几个原因。

2. 导入进程到95%时失败的原因
(1)术语库定义问题
根据我的体会,在将术语库导入Multiterm 7.0 时,不要使用Multiterm iX版留下的*.xdt文件,即不要使用Termbase Wizard 的第3项“Load an exsisting termbase definication file”,而要使用第1项”Create a new termbase definication from stratch”。当然,如果是Multiterm 7.0产生的*.xdt文件,则又当别论。在Install Multiterm 7.0 时,系统会要求你删除已有的Multiterm iX 文件。也许,两个版本之间不兼容。用Multiterm iX版留下的*.xdt文件比较复杂,而用”Create a new termbase definication from stratch”则比较简单。出错往往出在这里。
(2)不要在使用Multiterm Convert时转换5.5版本的术语库
跟着而来的问题是,用Multiterm Convert转换产生的*.xml和*.xdt文件,也往往是出错的原因之一。根据我的体会,转换Excel格式的术语库能顺利转换,而用前者产生的则不能。
(3)如果转换发生了问题,在转换新的术语库以前,请删除原有的*.LOG文件。因为新转换不能自动删除原来的*.LOG文件。
(4)在Trados 中国组网站上下载免注册版TmMaker,使用它直接将*.txt格式的术语文件转换为*.xml文件。
(5)在导入时尽可能关闭其它Windows程序,因为Multiterm 7.0 使用的内存较多。
(6)最后一点,在进度达95%,出现重新组织术语库时,要耐心等待。不要看到进程不动了,就急着去关闭程序。稍等一段时间(在这段时间内,不要做其它事情,以免发生死机),就会出现进程达到100%的提示。
我的经验可能有片面性,请各位高手把自己的体会贡献出来。
 

在已经建立的库下批量加单词,则先建立XML文件,然后用process。 process很重要。