计算机辅助翻译流程(台胞所编)

上传人:kms****20 文档编号:40382658 上传时间:2018-05-26 格式:DOC 页数:17 大小:1.47MB
返回 下载 相关 举报
计算机辅助翻译流程(台胞所编)_第1页
第1页 / 共17页
计算机辅助翻译流程(台胞所编)_第2页
第2页 / 共17页
计算机辅助翻译流程(台胞所编)_第3页
第3页 / 共17页
计算机辅助翻译流程(台胞所编)_第4页
第4页 / 共17页
计算机辅助翻译流程(台胞所编)_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《计算机辅助翻译流程(台胞所编)》由会员分享,可在线阅读,更多相关《计算机辅助翻译流程(台胞所编)(17页珍藏版)》请在金锄头文库上搜索。

1、Trados Word/RTF 翻译流程概要翻译流程概要0. 大纲大纲1. 分析稿件 (4/13 写作)1-1 稿件类型分析1-2 字数计算与工期估算1-3 准备字汇库1-3-1 搜寻相关字库1-3-2 使用 ExtraTerm 制作字汇库1-3-3 MultiTerm 字汇汇入与整理1-4 准备参考 TM1-4-1 搜寻相关 资料1-4-2 使用 WinAlign 制作 TM1-4-3 整理档案并汇入 TM2. 前置处理稿件2-1 转换格式成 RTF 或 Word2-1-1 使用格式转换工具 (如 Acrobat,用于 pdf 文件转化)2-1-2 转换时图形处理方式2-2 在 Word 中

2、自动格式化文件2-3 检查与编修文件3. 翻译稿件3-1 建立新 TM (参照到旧 TM)3-1-1 选项设定3-1-2 字体与样式3-2 设定后 clean-up3-3 开始翻译 (Word 或 TagEditor)3-3-1 翻译桌面配置3-3-2 翻译中新增字汇3-4 断句、并句动作处理3-5 误删、变动时修复处理4. 后置处理稿件4-1 开启隐藏文字4-2 一致性检查4-3 最后的搜寻/取代动作4-4 清除标记时更新 TM5. TM 维护与重复使用5-1 TM 的格式5-2 TM 的维护与编修5-2-1 Workbench 环境5-2-2 纯文字环境1. 分析稿件分析稿件1-1 稿件类

3、型分析稿件类型分析说起稿件的类型千百种,但是目前遇到的不外乎以下几种原始格式:1. Word/RTF 檔2. PDF 檔3. 白纸档 (咳,也就是只给原文 Hardcopy 的意思)4. HTML/XML 檔5. 传说中的 PageMaker 与 FrameMaker 檔 (等有资本买 Trados 整个 solution 后看有没有公司要给 case 吧)这整个 Stage 是我自己定义的,任何 Trados 或是其它翻译软件的文件里都没有提到。为什么要提这个?由经验上我知道进入很多个领域时,首要之务就是先做功课。先做功课可以在几个小时内就让你掌握状况,具备基本 know-how 跟 sen

4、se,是很有用的投资。做功课的方法也很重要,不过基本上就要看你求学时搜寻数据的方式了。印象中大学时有门课作业研究,提供一些信息领域研究与分析的理论跟简介,不过很多东西都是自己出社会后逐渐由经验得来的。此时推荐的工具有 google 跟各原厂或产品的相关中英文网页。真的不行的时候直接找产品的 HELP 或 bbs 也可以。这个阶段有几个重要目的:有多少既有东西能重复使用?有多少参考数据能使用?有多少东西是能力所及/不及的?成本因素上是否要接单?1-2 字数计算与工时估算字数计算与工时估算说到算字数,应该是爬格子的同行们最兴奋也最怕受伤害的时刻了。Word 里面 字数统计 的功能可以好好利用,只是

5、别错把字符数当成字数,那就真的糗大。此外,专业一点的方式就是由 Translators Workbench 里,利用 Analysis 分析功能得到。不过吊诡的事情来了。明明都是字数统计的功能,怎么算出来有略为不同?目前为止我也没抓到原因,要不就是有些 Word 里自己用的标识符被 Trados 也算进去了。在Translationzone (Trados Freelancer 的网站) 上建议以下的报价方式:100% Match: charge 30% of base rate per word99%-85% Fuzzy matches: charge 60% of base rate pe

6、r word84%-No Match: charge 100% of base rate per word这个只是建议的报价方式。台湾这边的业主要求使用 Trados 的量还不是很多 (以整体翻译市场来看),而且也没有明确的规范。举例来说,我遇过业主希望结案的时候 TM 跟MultiTerm 都一并交出,但由于它是属于 白纸档 型的 case,因此我会要求这些智慧财要charge;其它业主直接给予 TM 的 case 是最棒的了,结案后我们自己也能得到一份业主那边的 TM,有助于我们建立更丰富的 TM 数据库。 在时间的估算方面,建议用你每天所能翻译字数加上一定程度的容许值。例如我一天的水准约

7、在 4,000 字,在稿件很难的状况下,我会使用下列公式:所需工期所需工期= (总字数总字数 / (4,000*0.9) * 1) *1.20.9 是困难度的参数,后面 1 解为一个人翻译,最后的 1.2 表示容许值。前半公式算出来若是 10 天,那么乘上 1.2 就是 12 天。凡人并非金刚不坏之身,总也有累、烦、病、痛、婚丧喜庆、公司加班等不可抗拒之因素,这个值算是蛮可靠的。上面字数的部分都以 84% fuzzy match 以下估计。跟业主就先这样回报好了,因为后续还有很多一致性、格式的相关动作,快也快不了多少。1-3 准备字汇库准备字汇库1-3-1 搜寻相关字库搜寻相关字库在我几个月使

8、用下来,MultiTerm 事实上对 Freelancer 来说不是甚有用的工具。基本上具规模的业主都有自己格式的 glossary 供译者参考,如 Microsoft 的 GIAA、CISCO 网络相关的 glossary 等。我也曾经花过苦工,将 GIAA 中 60 几万句筛选到约 2 万句汇入MultiTerm,可惜还是不好用。MultiTerm 的部分再找篇幅谈使用心得。在这个阶段,基本上就是先找好届时可以查技术单字、技术定义的地方,好用的工具还是 google,译点通也勉强可以。印象中网络上也有很多定义技术字汇的地方,资策会等机构跟一些大专院校的教授网页有时也会有不错的发现。1-3-

9、2 使用使用 ExtraTerm 制作数据库制作数据库ExtraTerm 是完整 Trados 解决方案中的一个工具,在我浏览 Trados 官方网页时找到了试用版。虽然比对分析的结果无法储存,但是还是能得到高出现率的字汇列表 (最多先抄下来再开 MultiTerm 手动加上去)。其实 ExtraTerm 还有许多强大的功能,不过限于手上版本只有旧版的试用版,还是先找能用的部分好了。这些结果就是汇入文稿中最常出现的字汇,当然,先将一一加入 MultiTerm 数据库以绝后患。在我翻阅多本使用手册后,对 MultiTerm 的用法还是有点不踏实。根据我看到的信息,整个智能翻译的流程应该是这样的:

10、Original Texts TM 85% fuzzy match 先取代先取代 这些取代的句子中,有出入的部分这些取代的句子中,有出入的部分援用援用 MultiTerm 内的对应意义内的对应意义所以 MultiTerm 真的要上场的时间 (除却将它纯当为字典使用的功能),得要句子达到 85%的 fuzzy match,而且还要是有出入的那 15%才有可能直接填上 MultiTerm 中的译词。综合以上,所以我放弃了几天晚上努力筛选的 GIAA 精简版,重新建立一个单字数在 15个之间的 MultiTerm 数据库,里面放的大多是惯用语或俚语,专有名词加减放。毕竟各原厂几乎每季每月都会更新自己

11、的字汇库,频率跟数量都不是下游的译者所能相比的。Trados 的业务代表怎么没有去拜访 Microsoft 呢?1-3-3 MultiTerm 字汇汇入与整理字汇汇入与整理MultiTerm 最新的版本是 MultiTerm iX (隔几天 4/17 就会出新版),附在 Trados 5.5 Freelance 上的是 MultiTerm 5.5。基本上两者各有利弊:MultiTerm 5.5 支持直接汇入.txt文件的功能,能将格式化的双语对照 txt 档直接汇入,成为新的数据库;MultiTerm iX 能够在线直接编辑,亦即在 Word 环境中能直接在线加入新的 term,非常方便。我个

12、人先将大量文字转换成.txt,汇入 MultiTerm 5.5 后再转汇出成 MultiTerm iX 所支持的 XML 格式,以便在翻译过程中使用 MultiTerm iX。解开谜题!汇入成 MultiTerm 5.5 的.txt 档格式就是这样。这是 MultiTerm iX 的画面,调整过后我在里面仅放入常用的俚语跟技术名词备用。事实上 MultiTerm iX 还有个极佳的用法,那就是用来当为我骨灰游戏的数据库。MultiTerm iX 的单本记录支持图片、甚至是声音,格式也能自订,又支持 XML,保留将来可以直接取用的弹性。日后再来将我那几百套骨灰游戏制成 MultiTerm 的数据

13、库吧,目前的 Access 格式还是难用了点。1-4 准备参考准备参考 TM1-4-1 搜寻相关资料搜寻相关资料以下以举例的方式来说明,事实上这些内容来自于我先前的一个 case,也算是 real thing。(不过最后案子因为合约之故没有结案,业主失约让我的小小工作室损失快 200K,所以最后没签约放掉)案子:翻译Introducing Microsoft Windows Server 2003分析:这本书是 Microsoft Press 的书,里面相关 Microsoft 的技术。对我的 sense 来说,在产品整个行销流程上,书籍的出版都尽量压在跟产品同步面世 (产品未出书有用吗?)。

14、但是在行销动作上网页文章与杂志 DM 却是几个月前就发动了,于是乎我连到台湾跟美国的 Microsoft 网站,几分钟后发现了下列有用的东西:Introducing the Windows Server 2003 Family.htm的中文版网页就是 介绍Windows Server 2003 系列.htm,其它也都是一对一对照的情况。如何,免费就能拿到Microsoft 官方的翻译资料,不错吧。比尔说过了:Information at your finger tips,我们当然也能从他家借点东西出来用用。1-4-2 使用使用 WinAlign 制作制作 TMWinAlign 是随附在 Tra

15、dos 5.5 Freelance 中的工具,专门处理旧有数据去芜存菁的工作。我们可以利用它来将前面找到的资料对应一番:将对照出来的结果储存汇出,就能得到干净的 TM (对应时要注意选用 Plain Text,可以得到更干净的对照文字)。1-4-3 整理档案并汇入整理档案并汇入 TM最后,将纯文字文件汇入 Translators Workbench 即可。我们可以由 Maintenance 功能上查看汇入的成果:大功告成!至此我们在实际进行翻译前,已经有了一些 term 的名单,更重要的是也有了初步的 TM 了。只要分析的动作与步骤实在,可能就会得到下面这种漂亮的数据。在还没动手前,我们就有约 30%的部分高于 85%的命中率,翻译的时间跟品质都能更上层楼!2. 前置处理稿件2-1 了解格式接下来是处理原始稿件。客户端取得的稿件型式很多,对软件中文化 (Software Localization,亦即直接对软件上显示的文字进行中文化) 的案子来说常是 .rc (资源档)、.rtf/.doc (软件的在线说明,会 build 成 .chm) 或 .htm (.xml) 等。 2-1-1 使用格式转换工具 (如 Acrobat)2-1-2 转换时图形处理方式2-2 在 Word 中自动格式化文件2-3 检查与编修文件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号