转百度前辈的Trados使用心得
我用Trados的时间不长,可以说是一个新手。但我在较短的时间内就已经初步掌握这个工具,说明它并不是那么神秘,并不是那么深不可测。这里,我说一说学习它的一点体会。在我转发的文章中有的内容,我就少讲一些。别人没有提到,或者没有强调的部分,我就多说一说。
1.Trados不是一种机器翻译软件,而是一种翻译记忆软件
提起翻译软件,不少人就会联想到金山快译、东方快车等翻译软件。尽管这些软件有一定的市场,也有人把它们吹得神乎其神,但我对它们并不看好。这些翻译软件的特点是将英语或者汉语输进它的输入界面,马上就能得到它的译文。可是,这只能蒙外行。懂一点外语知识的人都能看出它的译文是驴头不对马嘴。有一次我用金山快译翻译一段计算机方面的资料,它将Library译为图书馆,还有许多莫名其妙的错误。我就再也不用这种软件了。即使偶尔用用,也只是作为一种翻译的参考。
Trados是一种计算机辅助翻译(CAT:Computer Aided Translation)软件,它也称为翻译记忆(TM:Translation Memory)软件。什么是翻译记忆?简言之,就是将译员做过的工作,用Trados提供的工具存储起来,放到两个主要的数据库(记忆库)中,一个是句料库(用WinAlign工具制作),另一个是术语库(即Multiterm)。在进行翻译工作的时候,只要是句料库和术语库中有的,Trados就会提醒你,帮助你,完全相同的句子,在Trados中称为100%完全匹配,自动插入译文,不再要你译第二次。类似的句子,它用一种称为模糊匹配的方法,给出参考译文,让译员去选择、修改。对数字、缩写、日期、时间和度量单位等等,Trados能够自动替换,比如已有的句料库中有2004年4月20日,到译文中出现日期(May 3,2005)时就会自动替换为2005年5月3日。
2.用Trados工作,必须要有句料库和术语库
有的人光知道用Trados,以为有了Trados,就能够提高工作效率和译文的准确程度。他不知道,如果没有句料库和术语库,用它是既不可能提高工作效率,也不可能做到译文准确的。这是因为翻译记忆软件在国内还没有广泛为人们所了解,以为有了它,就一通百通了。这是一种模糊认识,笔者必须加以澄清。
在国外,许多翻译公司和企业都使用Trados(在德国,还有一种应用较广的称为Transit的翻译记忆软件),在他们要求你使用Trados翻译的同时,还会提供给你参考文本(即句料库)和术语库。使用翻译记忆软件的最大好处还在于可以让许多译员通过网络同时工作,他们在网上可以共享术语库,某一译员的译文可以给其它人做参考,做到多人同步高效工作。
Trados还有一个优点,即在翻译较长的资料时,在后面碰到和前面译过的相同或者类似的部分,你就可以用相关搜索(Concordance)查找已在记忆库中已译过的术语和句子。这个工作不要你去做,Trados是自动完成的。你在翻译的过程中,它已经将你译过的单词、术语和句子自动存储起来了。
3.句料库的制作
使用Trados有两大重要工具,其中之一就是WinAlign。许多介绍Trados的文章忽视了工具WinAlign,光是介绍Trados和Multiterm。其实,在我看来,WinAlign在Trados中是比Multiterm还要重要的工具。它的作用就是制作句料库。你译了一些资料以后,千万不要束之高阁,而是要花点时间,用WinAlign作成句料库。这项工作看起来简单,其实很重要。
用WinAlign制作句料库需要一篇原文和一篇较准确的译文。如果你在翻译的时候比较匆忙,有些译文部分不够准确,我建议你在有空的时候,将这些译文推敲推敲。在WinAlign中有两列,一列是原文,一列是相应的译文。WinAlign的任务就是分别对齐相应的原文和译文。原文和经过推敲的译文应存储为Word文档的RTF格式。Word允许用户输入和输出一种RTF特殊格式的文件,只需选择“另存为”命令,在“保存类型”中选择“RTF格式”即可。RTF是Rich Text Format的缩写,并将它作为该格式文件的扩展名。RTF文件格式是由Microsoft Word创建的。它是为在不同程序间传递数据而设计的。其优点之一就是文件的格式信息不会丢失或破坏。RTF格式用在WinAlign中,就是通过对这些格式的识别,进行句料之间的对齐。
有时用自动对齐并不能得到好的效果,这时就需要手工对齐。手工对齐主要用到以下几个菜单项:在WinAlign的Edit菜单下有一个Split Segment项、一个Edit Segment项和一个Join Segments项,在WinAlign的Alignment菜单下有一个File Pair Statistics项和一个Commit项、一个Mark Finished项。在自动对齐以后用File Pair Statistics菜单检查文件对(File Pairs)的对齐结果,你可能发现有几个High Quality Units的匹配,有几个 Medium Quality Units的匹配和几个Low Quality Units的匹配。根据我的经验,有少量的Low Quality Units匹配,并不影响最终使用效果。当然High Quality Units匹配的数量越多越好。其中还有一个Number of 1:2 and 2:1 Units的项,其意义为原文和译文之间的句子有 1:2 和 2:1 对应的。按照我的经验,原文和译文之间的句子的 1:2 和 2:1 对应最好不要有。其方法就是用上面提到的Split Segment项将句料分割开或者用Join Segments将句料合并。最后在统计结果中最好完全是1:1对应的句子。Edit Segment项是用来在进行Align时修改译文用的。如果对Align的结果比较满意,别忘了用Commit进行确认。如果没有进行确认,在用Trados进行翻译时,在Trados Workbench的有关栏中会出现乱码或者出现中文竖排。
以上说的有人可能觉得太噜苏了,请不要感到厌烦,这些正是容易出问题之所在。
4.术语库的制作
Trados的另一个重要工具就是Multiterm。术语库的制作方法许多文章都有介绍,我不多说了。我要说的有几个问题:
(1)术语的来源
网上可以找到金山快译的24本字典,这些字典完全是用制表符格式排列的,可以根据各人的需要制成英汉/汉英术语库。
(2)术语库的大小
根据我的经验,术语库不能做得太大,也不要做得太小。有人曾向我提出是不是将所有的术语都放在一起,我的答案是不妥。因为如果太大,运行速度减慢;但如果太小,不方便使用,在术语库之间转换,也要花不少时间。一般来说,近似的专业可以放在一起,例如机械专业和汽车专业。
(3)Multiterm 5术语库的导入
除了转引的文章中介绍的方法而外,还可以在网上找到一个名称为Trados字典制作的软件,用它可以非常方便地将以逗号、制表符、空格或对照文本格式排列的术语文本制成可以直接输入Multiterm 5.5的格式,作成Multiterm 5术语库。
(4)Multiterm iX术语库的制作
然后用迁移工具(Migration Tool)迁移转为XML格式的Multiterm iX术语库。不过我在Windows XP下Import迁移后的XML文件失败了。用和在Windows 98 下完全相同的方法却无法将文件Import进Multiterm iX术语库,最后只好仍在Windows 98下花了一整天时间输入了20余万条词汇。如有哪位高手在Windows XP下Import成功的,请指教一下。
————转自百度前辈
转百度前辈的Trados使用心得的更多相关文章
- 百度BAE的一些使用心得
休眠会释放单元资源停止收费,那就不用被百度收费了
- 百度api使用心得体会
最近项目中在使用百度地图api,对于其中的一些有用的点做一些归纳整理,如有不对的地方,欢迎各位大神纠正指出. 一定要学会查找百度地图api提供的类参考网站:http://lbsyun.baidu.co ...
- hexo摸爬滚打之进阶教程
本文首发在我的个人博客:http://muyunyun.cn/ 写博客有三个层次,第一层次是借鉴居多的博文,第二层次是借鉴后经过消化后有一定量产出的博文,第三层次是原创好文居多的博文.在参考了大量前辈 ...
- 【原】Go语言及Web框架Beego环境无脑搭建
本文涉及软件均以截至到2013年10月12日的最新版本为准 1. 相关软件准备: 1) go1.2rc1.windows-386.msi,对应32位windows系统安装使用 下载地址: https: ...
- Effective Java阅读笔记——引言
“我很希望10年前就拥有这本书.可能有人认为我不需要任何Java方面的书籍,但是我需要这本书.” ——Java之父 James Gosling 在图书馆找到这本java著作时,首先看到了这句话. ...
- cas sso单点登录系列5_cas单点登录增加验证码功能完整步骤
转:http://blog.csdn.net/ae6623/article/details/8919718 本篇教程cas-server端下载地址:解压后,直接放到tomcat的webapp目录下就能 ...
- Go语言及Web框架Beego环境无脑搭建
[原]Go语言及Web框架Beego环境无脑搭建 本文涉及软件均以截至到2013年10月12日的最新版本为准 1. 相关软件准备: 1) go1.2rc1.windows-386.msi,对应32位w ...
- Go语言及Web框架Beego环境
Go语言及Web框架Beego环境无脑搭建 [原]Go语言及Web框架Beego环境无脑搭建 本文涉及软件均以截至到2013年10月12日的最新版本为准 1. 相关软件准备: 1) go1.2rc1. ...
- 自学传说中的php接口编写
一个前端学php,感觉不可思议,但实际上面试中都会问你后台会不会.这时候php就派上用场了. 下面的是我自己百度研究的一个些心得分享一下: html代码 <!DOCTYPE html> & ...
随机推荐
- CentOS修改IP
编辑 /etc/sysconfig/network-scripts/ifcfg-eth0 然后 service network restart DEVICE=eth0BOOTPROTO=noneNM_ ...
- 帝国cms修改[!--show.listpage--]分页页码所生成的html标签
在使用帝国cms系统时,我们用[!--show.page--]和[!--show.listpage--]来生成页码 其中[!--show.listpage--]所生成的html页码代码为: <a ...
- FMX相当于在界面上自己又做了一个小操作系统
FMX的自画界面我也不看好,比如复制粘贴,太丑了,系统做得很好很精细的复制粘贴界面,就是无法调出,比如MIUI,复制粘贴还能有个放大镜,可以选择到屏幕边缘的文字,可以选择剪贴板内多个可粘贴的文字:还有 ...
- C#使用WinAPI 修改电源设置,临时禁止笔记本合上盖子时睡眠
原文 http://www.cnblogs.com/h46incon/archive/2013/09/03/3299138.html 在 阻止系统自动睡眠的小软件,附C#制作过程 ,弄了一个防止系统睡 ...
- SQVI和SAP查询QUERY的区别和使用注意事项
SQVI.SAP查询QUERY都适用于简单的表连接数据查询,但都不能打包传输到PRD,不同环境需要重复创建.可以生成报表程序供T-CODE调用,用se93指定事务码和程序名称. 区别1-权限: SQV ...
- flex正则表达式
正则表达式是一种通用的标准,大部分计算机语言都支持正则表达式,包括as3,这里收集了一些常用的正则表达式语句,大家用到的时候就不用自己写了 ^\d+$ //匹配非负整数(正整数 + 0) ^[0-9] ...
- 取代奶瓶Minidwep-gtk 破 WPA 全攻略
目录 1. CDlinux 下使用 minidwepgtk 获取握手包并使用自带的字典破解 2. 自带的字典破解不出密码时使用 U 盘外挂字典继续暴力破解密码 3. 将握手包拷贝到 Windows ...
- Intersection(poj)
Intersection Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 13140 Accepted: 3424 Des ...
- Java_java多线程下载-断点下载-超详细
基本原理:利用URLConnection获取要下载文件的长度.头部等相关信息,并设置响应的头部信息.并且通过URLConnection获取输入流,将文件分成指定的块,每一块单独开辟一个线程完成数据的读 ...
- C++使用之常量的定义
在介绍C++的常前,先看下下面的代码. for (int i = 0; i < 512; ++i) { …; } 512是什么,它具有什么含义?在代码中若直接使用类似512这些“魔数”(magi ...