刘群机器翻译原理与方法义概论

上传人:ji****72 文档编号:45586494 上传时间:2018-06-17 格式:PDF 页数:64 大小:390.79KB
返回 下载 相关 举报
刘群机器翻译原理与方法义概论_第1页
第1页 / 共64页
刘群机器翻译原理与方法义概论_第2页
第2页 / 共64页
刘群机器翻译原理与方法义概论_第3页
第3页 / 共64页
刘群机器翻译原理与方法义概论_第4页
第4页 / 共64页
刘群机器翻译原理与方法义概论_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《刘群机器翻译原理与方法义概论》由会员分享,可在线阅读,更多相关《刘群机器翻译原理与方法义概论(64页珍藏版)》请在金锄头文库上搜索。

1、机器翻译原理与方法第一讲 概论刘群 中国科学院计算技术研究所 中国科学院计算技术研究所 2010 年秋季课程2机器翻译原理与方法 (01) 概论内容提要 机器翻译定义机器翻译定义 课程目的与特点 课程概况 机器翻译历史 机器翻译现状 机器翻译应用系统类型3机器翻译原理与方法 (01) 概论什么是机器翻译English中文4机器翻译原理与方法 (01) 概论什么是机器翻译 机器翻译 (machine translation) 是使用电子计算机把一种 自然语言 ( 源语言 ,source language) 翻译成另外一种自然 语言 ( 目标语言 ,target language) 的一门学科 这

2、门新学科同时也是一种新技术 . 它涉及到语言学、计算机 科学、数学等许多部门 , 是非常典型的多边缘的交叉学科 在语言学中 , 机器翻译是计算语言学的一个研究领域 在计算机科学中 , 机器翻译是人工智能的一个研究领域 在数学中 , 机器翻译是数理逻辑和形式化方法的一个研究领域 .以上定义引自冯志伟澄清对机器翻译的一些误解澄清对机器翻译的一些误解 ( 论文提论文提 要要 ) ,现代语文(语言研究), 2005.1 ,更改了个别子 句5机器翻译原理与方法 (01) 概论内容提要 机器翻译定义 课程目的与特点课程目的与特点 课程概况 机器翻译历史 机器翻译现状 机器翻译应用系统类型6机器翻译原理与方

3、法 (01) 概论课程目的 讨论:为什么要学习机器翻译? 直接目的:学会机器翻译 了解机器翻译基本原理 掌握机器翻译实践技能: 能够编写一个简单的机器翻译系统 间接目的:学会做研究 学会分析问题和解决问题 学会发现问题和提出问题: 问题是嵌套的,尽量探究最原始、最本质的问题!7机器翻译原理与方法 (01) 概论课程特点 目标驱动 目标:解决机器翻译问题 目标驱动: 不是为学习而学习,为方法而方法 学习任何问题都要跟目的联系起来,多想想为什么 注重实践:知行合一(王阳明) 学不懂的时候,去编程实现! 编程效果不好的时候,去看书、看论文!8机器翻译原理与方法 (01) 概论内容提要 机器翻译定义

4、课程目的与特点 课程概况课程概况 机器翻译历史 机器翻译现状 机器翻译应用系统类型9机器翻译原理与方法 (01) 概论课程概况 教师介绍 学生情况 时间安排 课程内容 作业安排 网络资源 学术会议 学术刊物 参考文献10机器翻译原理与方法 (01) 概论教师介绍 主讲教师:刘群 中国科学院计算技术研究所 研究员 办公电话: 010-62600642 办公地点:计算所 642 室 电子邮件: liuqun at 个人主页: http:/ 课件可在个人主页下载(教学工作机器翻译) 课代表:姜广 手机: 15001399149 邮件: jiangg_11机器翻译原理与方法 (01) 概论课程邮件列

5、表 邮件列表地址:mt-course-at-ict- (待开通) 邮件列表网址:http:/ 选课或旁听的同学同学都可以访问邮件列表网站并申请加 入邮件列表,申请时请注明你的姓名和单位 申请邮件列表需要先注册一个 Google Account ,最好是用 Gmail 信箱注册,也可以用非 Gmail 信箱注册,但有可能 会丢失邮件 所有课程通知、作业相关资料都通过邮件列表发放12机器翻译原理与方法 (01) 概论时间安排 (1)周周月月一一二二三三四四五五六六日日1十月十月111213141516172181920212223243252627282930314十一月十一月1234567589

6、10111213146151617181920217222324252627288十一月十一月 / 十二月十二月2930123459十二月十二月67891011121013141516171819112021222324252612十二月十二月 / 一月一月27282930311213 一月一月34567891410111213141516授课讲座作业考试13机器翻译原理与方法 (01) 概论时间安排 (2) 上课时间( 12 次共 48 学时): 每周四晚上: 18:30-21:30 课堂讲授 7 次(含 2 次讲座) 项目报告 4 次 考试时间( 1 次 2 小时): 12 月 16 日晚

7、上: 18:30-20:3014机器翻译原理与方法 (01) 概论课程内容讲课 28 学时(每一次课 4 学时) 第一讲:机器翻译概述 第二讲:机器翻译方法综述 第三讲:基于词的统计机器翻译方法 第四讲:基于短语的统计机器翻译方法 第五讲:基于句法的统计机器翻译方法 第六讲:讲座 第七讲:讲座 课堂讨论 16 学时。 答疑 2 学时,考试 2 学时。15机器翻译原理与方法 (01) 概论作业安排项目 (1) 目标: 利用开源的统计机器翻译工具 Moses (摩西),实现两 个英汉机器翻译系统 自己实现一个统计机器翻译解码器 资源: 开源的统计机器翻译系统 Moses (摩西) 开源的汉语词法分

8、析系统 ICTCLAS 开源的语言模型工具 SRILM 英汉双语语料库16机器翻译原理与方法 (01) 概论作业安排项目 (2) 第一阶段: 能够掌握 Moses ,并在给定的数据上跑完完整的统计 机器翻译训练和解码流程 第二阶段: 在 silkRoad 的基础上,自己实现一个解码器,要求达 到跟 Moses 接近的 BLEU 值 完成方式:每人独立完成 考核: 第 5 、第 7 、第 7 次、第 11 次为课堂报告,每位选课 学生都要做一个报告,介绍项目作业的进展 最终要在给定的测试数据上测试并考察结果 BLEU 值17机器翻译原理与方法 (01) 概论开源统计机器翻译系统“摩西”简介 ht

9、tp:/www.statmt.org/moses 目前最有影响的开源统计机器翻译系统 代码经过大量优化,性能很高,已成为这一领域研究最主 要的 Baseline 系统 开发单位:英国爱丁堡大学、德国亚琛工业大学、意大利 ITC-IRST 研究所、美国卡内基梅隆大学、美国麻省理工 学院、捷克查尔斯大学在美国和欧盟的一些资助下完成 基本特点: 基于短语的统计机器翻译方法( Phrase-based Approach ) 基于混合网络的解码( Confusion Network Decoding ) 基于要素的翻译模型( Factored Translation Model ) 柱搜索算法( Bea

10、m Search Algorithm )18机器翻译原理与方法 (01) 概论网络资源 ACL主页( ACL Anthology) NLP新闻组 Machine Translation Archive LDC( Language Data Consortium ) ChineseLDC 中文自然语言处理开放平台 中科院计算所自然语言处理研究组 北京大学计算语言学研究所19机器翻译原理与方法 (01) 概论国际会议 ACL (NAACL, EACL, AFNLP) EMNLP COLING MT Summit AMTA TMI JSCL (全国计算语言学联合学术会议) CWMT (统计机器翻译研

11、讨会) 相关领域会议:计算机、人工智能、互联网、语音20机器翻译原理与方法 (01) 概论学术刊物 Computational Linguistics Machine Translation 中文信息学报 相关领域刊物: 计算机 人工智能 语音 互联网21机器翻译原理与方法 (01) 概论参考书目冯志伟( 1995 )自然语言机器翻译新论,语文出版社 1995 年版 翁富良、王野翊( 1998 )计算语言学导论,中国社会科学 陈小荷( 2000 )现代汉语自动分析,北京语言文化大学出版社 赵铁军( 2000 )机器翻译原理,哈尔滨工业大学出版社 杨沐昀( 2000 )机器翻译系统,哈尔滨工业大

12、学出版社 姚天顺等( 2002 )自然语言理解 一种让机器懂得人类语言的 研究(第二版),清华大学出版社、广西科学技术出版社 俞士汶 主编( 2003 )计算语言学概论,商务印书馆 冯志伟( 2005 )机器翻译研究,中国对外翻译出版公司 宗成庆( 2008 )统计自然语言处理,清华大学出版社 刘群( 2008 )汉英机器翻译若干关键技术研究,清华大学出版社22机器翻译原理与方法 (01) 概论参考书目James Allen (1995), Natural Language Understanding (Second Edition), The Benjamin / Cummings Publ

13、ishing Company, Inc. ,中译本:刘群等 译,自然语言理解(第二版),电子工业出版社, 2005Christopher D. Manning and Hinrich Schutze (1999), Foundations of Statistical Natural Language Processing, The MIT Press, Cambridge, Massachusetts ,中译本:苑春法等译,统计自然语言处理基 础,电子工业出版社, 2005Daniel Jurafsky, James H. Martin, Speech and Language Proces

14、sing: an Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice Hall, US Ed edition, January 26, 2000, 中译本:冯志伟,孙乐译,自然语言处理综 论,电子工业出版社, 2005Philipp Koehn, Statistical Machine Translation, textbook, Cambridge University Press, August 200923机器翻译原理与方法 (01

15、) 概论参考文献 Top 10 SMT papers (2007 By Yang Liu) Bibliography for SMT (2007 By Yang Liu) 其他 A highly selective MT bibliography (1996 by Adam Berger) Bibliography for Machine Translation Evaluation (2003 by Florence Reeder et al.) Bibliography for Statistical Alignment and Machine Translation(2003 by Adri de Gispert 第二阶段:把源语的结构标志转换为译语的结构标志 ; 第三阶段:构成译语的输出文句。34机器翻译原理与方法 (01) 概论机器翻译的复苏期 (3) 这个时期

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号