2011.09.09机器翻译概论

上传人:j****9 文档编号:54469134 上传时间:2018-09-13 格式:PPT 页数:65 大小:747.50KB
返回 下载 相关 举报
2011.09.09机器翻译概论_第1页
第1页 / 共65页
2011.09.09机器翻译概论_第2页
第2页 / 共65页
2011.09.09机器翻译概论_第3页
第3页 / 共65页
2011.09.09机器翻译概论_第4页
第4页 / 共65页
2011.09.09机器翻译概论_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《2011.09.09机器翻译概论》由会员分享,可在线阅读,更多相关《2011.09.09机器翻译概论(65页珍藏版)》请在金锄头文库上搜索。

1、机器翻译概论宗成庆 中国科学院自动化研究所 模式识别国家重点实验室,内容提要,1、概述 2、机器翻译的产生与发展 3、机器翻译的困难 4、机器翻译研究现状 5、机器翻译基本方法,有关专家已经指出,语言障碍是21世纪国际社会全球化面临的主要困难之一; 机器翻译涉及语言学、计算语言学、认知科学和数学等多种学科,具有重要的科学意义; 具有巨大的社会需求,以欧洲为例,有380多种语言,2004年5月1日以前欧盟有11种官方语言,每年为这11种语言翻译、转录文件耗费的人力费用大约 549M 欧元。目前欧盟20多种工作语言; 汉语已经不再仅仅是中国人关注的语言。,1 概述,(Million),1 概述,(

2、Million),汉英两大强势语言的自动翻译问题是人类语言技术中最具挑战性的研究课题!,1 概述,少数民族语言信息处理意义重大 - 经济、文化、教育、体育、旅游 - 国家安全 - 民族团结,1 概述,2、机器翻译的产生与发展,2 机器翻译的产生与发展,概念:机器翻译 (machine translation, MT) 是用计算机把一种语言(源语言, source language) 翻译成另一种语言(目标语言, target language) 的一门学科和技术。,2 机器翻译的产生与发展,古希腊时期 17世纪:笛卡儿(Descartes)莱布尼兹(Leibniz)试图用统一的数字代码编写词典

3、;17世纪中页贝克(Cave Beck)等人出版类似的词典。 1930s:亚美尼亚法国工程师阿尔楚尼(G. B. Arsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫做机器脑 (mechanical brain)。,1933年,前苏联发明家特洛扬斯基设计了用机械方法把一种语言翻译成为另一种语言的机器。 1946年,世界上第一台电子计算机 ENIAC 诞生以后,英国工程师 A. D. Booth 和美国洛克菲勒基金会 (Rockefeller Foundation) 副总裁 W. Weaver 提出了利用计算机进行机器翻译的设想。,2 机器翻译

4、的产生与发展,1947年3月, W. Weaver 给 N. Wiener 写信,讨论机器翻译问题,但遭到了 N. Wiener 的反对。 1949年,W. Weaver 发表了以 Translation为题目的备忘录,正式提出机器翻译问题。,2 机器翻译的产生与发展,Weaver 的两个基本观点:(1) 翻译类似于解读密码的过程:当我阅读一篇用俄语写的文章时,我可以说这篇文章实际上是用英文写的,只不过它用另外一种奇怪的符号编了码,当我阅读时,我是在进行解码;,2 机器翻译的产生与发展,(2) 原文和译文“说的是同样的事情”,因此,当把语言A 翻译为语言B 时,就意味着,从语言A 出发,经过某

5、一“通用语言(universal language)” 或“中间语言 (interlingua)”,然后转换为语言B,这种“通用语言”或“中间语言”可以假定是全人类共同的。,2 机器翻译的产生与发展,美国和英国的学术界对机器翻译产生了浓厚的兴趣,并得到了实业界的支持。 1954年 Georgetown 大学在 IBM 协助下,用IBM-701计算机实现了世界上第一个 MT 系统,实现俄译英翻译,1954年1月该系统在纽约公开演示。系统只有250条俄语词汇,6 条语法规则,可以翻译简单的俄语句子。 随后10 多年里,MT研究在国际上出现热潮。,2 机器翻译的产生与发展,1964年,美国科学院成立

6、语言自动处理咨询委员会(Automatic Language Processing Advisory Committee, ALPAC),调查机器翻译的研究情况,并于1966年11月公布了一个题为“语言与机器”的报告,简称 ALPAC 报告,宣称:“在目前给机器翻译以大力支持还没有多少理由”,“机器翻译遇到了难以克服的语义障碍 (semantic barrier)”。从此,机器翻译研究在世界范围内进入低迷状态。,2 机器翻译的产生与发展,1970 1976年,法国、日本、加拿大等国,仍坚持机器翻译研究,而且,在这一阶段语法与算法分开,机器翻译研究开始复苏。代表系统:法国 GETA, IMAG-

7、CLIPS 开发的 ARIANE-78 系统。,2 机器翻译的产生与发展,1976至今,繁荣时期: 加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发的实用机器翻译系统 TAUM-METEO,用于天气预报翻译。每小时可以翻译6 30万个词;每天翻译15002000篇天气预报资料,并通过电视、报纸等立即公布 1978年欧共体启动多语言机器翻译计划,2 机器翻译的产生与发展,1982 1986,日本在提出第五代机的同时,研究日英双向机器翻译系统 Mu 和亚洲多语言机器翻译(日语、汉语、印尼语、马来西亚语、泰国语) 1990年,IBM 提出统计机器翻译模型,机器翻译研究进入了一个空前辉煌的繁荣时期,2

8、 机器翻译的产生与发展,概括为三个阶段: 1954 1970 (ALPAC):草创时期; 1970 1976:复苏阶段; 1976 现在:繁荣时期。,2 机器翻译的产生与发展,3 机器翻译的困难,自然语言中普遍存在的歧义和未知现象 句法结构歧义/词汇歧义/语用歧义 新的词汇、术语、结构、语义 机器翻译不仅仅是字符串的转换 不同语言之间文化的差异 现有方法无法表示和利用世界知识和常识 机器翻译的解不唯一,而且始终存在的人为的标准,3 机器翻译的困难,自然语言中普遍存在的歧义和未知现象 句法结构歧义/词汇歧义/语用歧义 新的词汇、术语、结构、语义 机器翻译不仅仅是字符串的转换 不同语言之间文化的差

9、异 现有方法无法表示和利用世界知识和常识 机器翻译的解不唯一,而且始终存在的人为的标准,3 机器翻译的困难,几乎自然语言处理中的所有问题在机器翻译中都会遇到。,困难之一:大量歧义(ambiguity)现象词法歧义 例如: (1) Ill see Prof. Zhang home.,(2) 自动化研究所取得的成就。,3 机器翻译的困难,(4) 打扫平板罚款10元。,打扫平板罚款10元。,(3) 门把手弄坏了。,3 机器翻译的困难,3 机器翻译的困难,其他实例:(1) 上大学子烛光追思钱伟长 (新浪网:http:/ 2010.8.8)(2)“动物保护警察”明年上岗(环球时报2010年9月25日,第

10、10版)(3) 教育部长跑活动负责人与商家总经理被曝系师生(科学网:http:/ 今天中午吃馒头。 (4) 今天中午吃食堂。 (5) 今天中午吃大碗。,(1) 喜欢乡下的孩子。 (2) 关于鲁迅的文章。,(6) 今天中午吃了闭门羹。,3 机器翻译的困难,(7) 这座碑是为纪念者叛乱中牺牲的英雄而建立的。, 者叛乱 , 反对共产主义者叛乱 ,3 机器翻译的困难,(10) I saw a man with a telescope., I saw a man with a telescope. I saw a man with a telescope., I saw a man with a tel

11、escope in the park. ?,(8) Who has seen John? (9) Who has John seen?,3 机器翻译的困难,n 为句子中介词短语的个数。,其中:,我们将歧义组合数称为凯塔兰数(Catalan Numbers),记作 Cn:,3 机器翻译的困难,语义歧义他说:“她这个人真有意思(funny)”。她说:“他这个人怪有意思的(funny)”。于是人们以为他们有了意思(wish),并让他向她意思意思(express)。他火了:“我根本没有那个意思(thought)”!她也生气了:“你们这么说是什么意思(intention)”?事后有人说:“真有意思(fu

12、nny)”。也有人说:“真没意思(nonsense)”。生活报1994. 11. 13. 第六版,3 机器翻译的困难,困难之二:大量未知语言现象 新词、人名、地名、术语等,如: 裸退、蜗居、夏天、高山、温馨、不来梅、非典、甲流 新含义如:窗口、奔腾、农民、同志、小姐,楼歪歪等 新用法和新句型等,尤其在口语中或部分网络语言中,不断出现一些“非规范的”新的语句结构。如:被长工资,很中国,布莱尔,3 机器翻译的困难,(2)夫妻肺片:,Husband and wifes lung slices,(3)童子鸡:,(1)馒头:,steamed bread,3 机器翻译的困难,奇怪的翻译:,We do ch

13、icken right.,3 机器翻译的困难,(1) 我们做鸡是对的。 (2) 我们做鸡正点耶。 (3) 我们就是做鸡的。 (4) 我们有做鸡的权利。 (5) 我们只做鸡的右边。 (6) 我们可以做鸡,对吧! (7) 我们行使了鸡的权利。 (8) 我们只做右边的鸡。 (9) 我们主张鸡权。 (10)我们公正地做鸡!,(11) 我们要把鸡打成右派。 (12) 我们做鸡肉权利。 (13) 我们还是做鸡好。 (14) 我们用正确的方法炸鸡。 (15) 我们做鸡有理! (16) 我们让鸡向右看齐. (17) 我们肯定是鸡,对! (18) 我们做的鸡才是正宗。 几十种翻译!,4 机器翻译研究现状,若干翻

14、译系统已实用化或接近实用化Systran (http:/)TAUM-METEO / Google translator华建翻译系统/ 有道翻译系统/金山词霸 等,4 机器翻译研究现状,仍面临若干问题理论模型与方法实现技术问题用户认识问题,应尽快消除对机器翻译的误解让机器翻译系统翻译诗歌、散文和小说等高难度文艺作品是不现实的,也是不可能的。,4 机器翻译研究现状,4 机器翻译研究现状,黛玉自在枕上感念宝钗又听见窗外竹梢焦叶之上,雨声淅沥,消寒透幕,不觉又滴下泪来。 (红楼梦第45回 ) As she lay there alone, Dai-Yus thoughts turned to Bao-

15、chai Then she listened to the insistent rustle of the rain on the bamboos and plantains outside her window. The coldness penetrated the curtains of her bed. Almost without noticing it she bad begun to cry. 文学翻译家 David Hawkes摘自冯志伟著机器翻译研究, 2004,4 机器翻译研究现状,Google翻译系统 (http:/ The departments should conduct strict payment-related inspections to ensure migrant workers pay is not delayed, said Yin Weimin, the Minister of Human Resources and Social Security.(http:/ 各部门要进行严格的支付相关的检查,以确保民工工资不拖延,尹蔚民说,人力资源和社会保障部部长。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 初中教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号