语料库在改善中国旅游资料翻译可接受性差方面的创新性作用.doc

上传人:pu****.1 文档编号:542450558 上传时间:2023-06-27 格式:DOC 页数:10 大小:41.01KB
返回 下载 相关 举报
语料库在改善中国旅游资料翻译可接受性差方面的创新性作用.doc_第1页
第1页 / 共10页
语料库在改善中国旅游资料翻译可接受性差方面的创新性作用.doc_第2页
第2页 / 共10页
语料库在改善中国旅游资料翻译可接受性差方面的创新性作用.doc_第3页
第3页 / 共10页
语料库在改善中国旅游资料翻译可接受性差方面的创新性作用.doc_第4页
第4页 / 共10页
语料库在改善中国旅游资料翻译可接受性差方面的创新性作用.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《语料库在改善中国旅游资料翻译可接受性差方面的创新性作用.doc》由会员分享,可在线阅读,更多相关《语料库在改善中国旅游资料翻译可接受性差方面的创新性作用.doc(10页珍藏版)》请在金锄头文库上搜索。

1、 论语料库在改善中国旅游资料翻译可接受性差方面的创新性作用摘 要:20世纪80年代以来,随着计算机科学的不断发展,语料库语言学取得了丰硕的成果。语料库在语言学研究以及自然语言处理中显现出的优势也日益吸引更多的各国的语言学家及信息科学家对其进行更深入的探索。结合现有的语料库成果以及中国旅游资料翻译的现状,笔者论证了建立文史英汉双语对齐语料库的可行性以其在改善中国旅游资料翻译可接受性方面的创新性作用。关键词:语料库 双语对齐 分布模型 创新性1、语料库发展简介“语料库 (corpus)是语料的仓库或者语料的集合”(何,2003)gmeme kennedy在他的an introduction to

2、corpus linguistics中将语料库的发展分为两个阶段:20世纪80年代以前的第一代语料库,以brown语料库为代表,规模一般不超过100万字;以及20世纪80年代以来的第二代语料库,以cobuild语料库为代表,规模庞大,设计更加科学。在此发展期间,虽然单一语种语料库得到了长足的发展,但双语对齐平衡语料库也得到很大的发展,并逐渐成为语料库语言学的新焦点。如:英国birmingham大学英语系语料库语言学中正在建设的chinese english translation base就是通过建设英汉双语对齐的语料库来提取翻译单元的;英法双语语料库hansard corpus则是以加拿大大

3、会辩论英法双语稿为基础而建立的。此外,国内的双语对齐语料库也如雨后春笋,相继问世,如:由北京外国语大学建立的规模约2000万字的大型句对齐英汉平行语料库,又如由中科院计算所软件研究室开发的双语句对齐数据库(http:/ 旅游资料译文可接受性问题可接受性一直是对翻译作品进行评价的重要标准。著名学者范仲英(1994)就指出:“译文的可接受性(accept ability)是指译文读者(接受者)对译文能否完全理解,译文是否明白易懂。可接受性的高低。即读者对译文的理解程度,将会直接影响翻译的效果。”旅游资料的翻译作为旅游景点文化传播的重要途径,人们对其译文的可接受性有更高的要求。然后旅游资料的翻译者往

4、往忽略了其译作的可接受性。例如,墓塔林是我国很多旅游胜地中常有的一个景点,曾有人译为forest of tomb-pagodas或memorial grave。但由于这些译文看上去正确,实际上却没有触及景点的本质,使得外国游客无法理解,或者联想到先贤祠之类的地方,那就加重了翻译造成的误解。在英语中收录了一个词为stupa,而现在的很多书籍类翻译中多用此词。又如:东昌湖风景区的 “沙滩浴场”译成了bathing beach,然而国外的沙滩浴场则多说做swimming beach。又如,绍兴是越瓷的产地。早些时候,不少译文都会翻译成shaoxing is the home of yue porce

5、lain. 然而外国游客却对越国没有一点了解,又怎么会了解这句翻译呢。再如,苏州的留园在苏州的宣传小册子中就被一笔带过的译为了liuyuan garden。这种译文丝毫不能吸引游客的兴趣。诸如上述类的翻译还有很多,旅游资料译文可接受性差已经是普遍现象。有的是因为地方投入有限、翻译者水平有限造成的;有的是因为翻译者懒惰或者过于刻板造成的;有的是因为缺少翻译对照的规范造成的。2.2现有的对可接受性的解决办法及翻译理论增添法,即对旅游资料中的存在容易产生可接受性问题的地方做出一些补充性的解释,提供一些人文历史、风土人情等方面背景知识,以帮助外国读者理解进而唤起他们的兴趣。改写法,即对那些不容易被接受

6、的内容进行改写,比如说诗句或者古文中的双关类的表达等。其他的解决办法,比如删节法和类比法等。这些从翻译理论出发而提出的解决办法。都为保证译文的可接受性指明了方向。但是使用这些方法,有一个共通的要求,即翻译者必须具备深厚的历史文化功底或者愿意花大量的时间去查阅典籍寻求更优的译法,但往往只有部分的翻译者才会注意在翻译旅游资料的时候有意识地使用这些技巧,而其他的翻译者在翻译的时候则不会去翻阅典籍,查证历史。因此,构建一个更加方便、更加简洁、更加具有可得性的平台来帮助旅游资料的翻译则更不失为一个有效的解决方案。3、应用语料库改善中国旅游资料翻译可接受性的可行性经过一个多世纪的发展,语言学家以及计算机科

7、学家已经建立了一套科学的数据库建设方法以及程序。每个语料库的建立都有其自身的用途,如字典编纂、语言统计、语言监控、语言教学,以及方言研究等方面。本文中笔者建议构建的语料库则将用作中国旅游资料翻译查询。3.1 中英文旅游资料语料库语料易得性“语料库工程的生命周期可以划分为7个阶段:语料库规划阶段、需求分析阶段、语料库设计阶段、语料采集阶段、语料库实现阶段、语料库标注阶段、语料库使用和维护阶段。”(何,2003)其中语料的采集是最重要的一项工作。一方面,中英文双语对齐旅游资料语料库的语料则较容易取得。作为旅游资料的翻译对照语料库,其语料资源应该主要来自于中英文对照的文史类刊物或者中国文史题材的英文

8、作品。目前,此类作品正朝着系统性的、全面性的方面发展。如,由中华大百科全书出版社出版的中华文明史话系列丛书,涵盖了饮食、古塔、体育、杂技、瓷器、服饰、小说、诗歌、绘画、武术、园林、饮酒、中医、丝绸、敦煌、西藏宫殿、文明起源、节日、民居、孔庙、陶器、长江、黄河、长城、书法、科技以及七大古都共27个方面的中华文明及其历史,并以中英文双语作为编写语言;又如,由大连理工大学出版社出版的每天读点中国文化系列丛书,涵盖了建筑艺术、城镇魅力、自然景观、民俗风情以及饮食五个大方面的中华文明,同时也是以中英文双语作为编写语言;与此同时还有诸如图语中国文化、中国历史地理全貌等大量的以中英文双语作为编写语言、以介绍

9、中国文化为主题的刊物。另一方面,除了有中国学者编纂的中英文双语书籍,还有大量的有外国人以英文为语言编纂的中国文明历史类书籍同样也是中英文双语旅游资料语料库中的重要语料来源。如:由中国社会科学出版社出版的剑桥中国史包含了自秦汉至新中国的各个朝代的历史,涉及政府活动、法律、经济、宗教、教育、哲学以及历史人物等各个方面;又如,由英国人崔瑞德(denis twitchett)编写的诸如史家、读者与时间历程等书籍对唐宋社会进行了比较广泛的研究,其内容涉及到盐运使、寺院地产、货币制度、商业税收、印刷术、农业灌溉等,以及剑桥中国百科全书中对中国历史和文明各方面的介绍。首先,这些刊物的作者多半是比较资深的学者

10、,他们治学严谨,文化底蕴深厚,因此他们的作品具有比较高的科学性及可靠性。其次,由于这些作品含有大量的双语作品,它们是建设双语对齐语料库的最优语料,也是最易得的语料;再次,这些中英文双语作品覆盖题材以及内容广泛,基本上可以涉及到中国文明历史的各个方面,能够构建一套完整的中英文旅游资料语料库。最后,由于这些语料都具有其自身的版权,所以可以采用联合开发等方式获取其版权,保证语料库的合法性。3.2语料库的运行方式3.2.1 语料的平行对齐在对语料进行诸如格式统一,杂质清楚以及中英文语料分存之类的预处理之后,语料库的建设者可以使用如:paraconc和wordsmith以及中国科学院计算机技术研究所开发

11、的ictclas等软件对中英文语料进行处理,然后对句子和词语以及关键词等进行标注,然后再利用自动对齐并协助以人工对齐。由于目前在双语对齐语料库的建设方面已经有了较成熟的技术,这里并不过多的对细节进行阐述。类似的语料库的建设可以参考莎士比亚戏剧英汉平行语料库的创建与应用(胡,2002)、小型英汉平行语料库的建立与运用(谢,2004)、汉英/英汉平行翻译语料库的设计及其在翻译中的应用(钱,2005)等。3.2.2分布模型(distributional model)在建立中英文对照语料的对齐的基础上,同时建立中英文对照的典籍中的英文资料与纯英文典籍中的英文资料的对接。运用现在计算机语言学中常用的一个

12、理论,即分布模型理论,可以实现此类对接。firth曾提出一个词通常和一串与它联系密切的词一起出现。分布模型假设指出相同意义的词语通常在相同的语境中出现。peirsman和他的同事已经通过他们在the automatic identication of lexical variation between language varieties中的实验证明了使用分布模型寻找意义相近的词的可行性。以这一理论为基础,笔者认为可以使两种处处的英文文本以关键词的形式对接起来,使得语料库的使用者在搜索该关键词的时候可以同时链接入诸如剑桥中国百科全书这样的典籍中,从而为英汉对齐提供更多的英语资源。由于这种自动识

13、别的概率在目前的计算机技术中还不能做到100%识别(peirsman, 2010),所以有必要将每次搜索结果设定为关键词所在的句子或者段落,进而能够更好的为使用该语料库的翻译者提供更多的参考。3.2.3监控语料库模式笔者认为该语料库还应该是一个监控语料库,随着潜在语料的不断增加,语料库可以将这些新的语料以语料流的形式吸收进来,不断的完善语料库,直至形成个类似于中国旅游双语百科全书查询的语料库。3.3中英文旅游资料语料库的作用基于目前中国旅游资料译文可接受性差的现实,以及改革开放以来中国旅游市场日益膨胀的强烈文化传播需求,建立一套作为旅游资料翻译的语言依据的语料库具有现实意义和长期意义。短期来看

14、:一方面,该资料库对全国个地方旅游机关开放,可以克服由于地方投入有限和资料翻译者水平低,而造成的胡翻乱翻的问题;另一方面,该资料库可以节约旅游资料翻译者的时间,并提供较为统一的翻译方法,能够帮助中国旅游资料翻译实现逐步的全国范围内的统一。长期来看,由于语料库是一个动态的模式,可以不断的实现自身的完善,终将形成一个较为完善的,在旅游资料方面覆盖极其广泛的语料库,它将不仅仅服务于旅游资料的翻译,还能够能为编纂中英文中国文史书籍的重要参考语料库。4、结语语料库语言学是21世纪最热门的语言学话题之一。笔者在本文中论证了将语料库应用于改善中国旅游资料翻译可接受性的可行性和科学性,是对语料库的创新性运用。然而,还需要更多的实践性探索才能够将本文所论证的理论发挥实际的作用。参考文献:1jeff mithchell, and mirella lapata. “composition in distributional models of semantics”. cognitive science. 2010.2kilgarriff, a. “comparing corpora”. international journal of corpus linguistics 2001 (6): 97133.3peirsman, y., geeraerts, and speelman.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号