第一章自然语言处理概论资料

上传人:w****i 文档编号:95637725 上传时间:2019-08-21 格式:PPT 页数:64 大小:357.55KB
返回 下载 相关 举报
第一章自然语言处理概论资料_第1页
第1页 / 共64页
第一章自然语言处理概论资料_第2页
第2页 / 共64页
第一章自然语言处理概论资料_第3页
第3页 / 共64页
第一章自然语言处理概论资料_第4页
第4页 / 共64页
第一章自然语言处理概论资料_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《第一章自然语言处理概论资料》由会员分享,可在线阅读,更多相关《第一章自然语言处理概论资料(64页珍藏版)》请在金锄头文库上搜索。

1、关毅 ,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,第一章 自然语言处理概论,1、开场白 2、自然语言处理概论 3、学习方法,主要内容,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,欢迎大家加入可能是世界上人数最多的自然语言处理团队!,1、开场白,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014HIT.

2、All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,哈尔滨工业大学计算机学院的自然语言处理团队,起源 80年代初 王开铸教授,俄汉机器翻译 李生教授,汉英机器翻译,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,哈尔滨工业大学计算机学院的自然语言处理团队(续),主要研究室 语言技术研究中心 社会计算与信息检索研究中心 智能接口与人机交互研究中心 ,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT.

3、 All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,个人简介,关毅 1992年开始进入自然语言处理领域 主要工程项目 微软拼音输入法 BOPOMOFO汉字输入系统 Weniwen搜索引擎 主要科学贡献 关于相似的研究-提出系统相似度测度理论 现为哈工大计算机学院语言技术研究中心教授,博士生导师,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,课程概貌,研究生专业必修课:自然语言处理 学时:32学时+16学时 授课方式:课堂讲授+课后上机

4、练习 考察方式:闭卷考试 实验课,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几个时间段,二十多年 崛起于80年代初的统计自然语言处理技术,已经成为自然语言处理的主流技术 本课程重点介绍统计语言处理技术,特别是基于统计的汉语词法分析技术,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几个时间段(续),六十多年 自然语言处理技术起源于人们

5、对机器翻译技术的研究,从1946年算起至今,已有60多年的历史了 “目前一些试用过的用户表示,改进后的翻译服务在质量方面令人惊讶。对于那些从未使用机器翻译的用户来说,他们完全可以通过翻译后的文本理解原文的意思,一些细微的错误并不会引起太大的麻烦。” -Franz Josef Och,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几个时间段(续),还需要多少年才能实现计算机与人类无障碍地沟通? 1968年的美国影片2001太空奥德赛 机器人HAL和Dave进行了如下对

6、话: Dave Bownman: Open the pod bay doors, HAL. (Dave Bownman:HAL, 请你打开太空舱的分离门。) HAL: Im sorry Dave, I am afraid I cant do that. (HAL:对不起,Dave,我恐怕不能这样做。),研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几个时间段(续),自然语言处理是一个“AI complete”问题 自然语言与(分子)生物学有着深刻的渊源 生物学中有着

7、至少500年也解决不完的有趣问题 Donald E. Knuth,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题,在自然语言处理的各个阶段广泛大量地存在着形形色色的歧义问题,这是自然语言与人工语言的根本差别之一,也是自然语言处理的难点所在,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题(续)

8、,词法分析歧义 分词 严守一把手机关了 严守/ 一把手/ 机关/ 了 严守一/ 把/ 手机/ 关/ 了 词性标注 我/pro 计划/v 考/v 研/n 我/pro 完成/v 了/aux 计划/n 命名实体识别 秦兵坑杀赵军40万于长平,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题(续),语法分析歧义 咬死了猎人的狗 那只狼咬死了猎人的狗 咬死了猎人的狗失踪了,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014

9、 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题(续),语义分析歧义 At last, a computer that understands you like your mother. 1985 McDonnell-Douglas ad 含义1:计算机会象你的母亲那样很好地理解你(的语言) 含义2:计算机理解你喜欢你的母亲 含义3:计算机会象很好地理解你的母亲那样理解你,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机

10、学院语言技术研究中心,自然语言处理中的歧义问题(续),语用分析歧义 “你真坏”至少有如下三种理解: 当人们对干了坏事的成年人说时,是一种严厉的斥责 当妈妈对淘气的儿子说时,实际表达的是对儿子的一种疼爱 当恋爱中的女孩对男友说这句话时,则是女孩在男友面前撒娇的一种表现 ,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,自然语言处理中的歧义问题(续),自然语言处理应用中的歧义问题 音字转换例 ji qi fan yi ji qi ying yong ji qi le re

11、n men ji qi nong hou de xing qu,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几点感性认识,有点繁琐枯燥 “从繁体词库到简体词库” 要求同学们一丝不苟的认真精神 充满乐趣 “机器翻译及其应用激起了人们极其浓厚的兴趣” 要求同学们有愚公移山,坚持到底的精神,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,几点感

12、性认识(续),团队合作 “128个字节的偏移量” 要求同学们善于协作,有团队精神 独创精神 “一只美丽的小花猫” 要求同学们勇于创新,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,本人印象深刻的至理名言,取法其上,仅得其中;取法其中,仅得其下;取法其众,得其上。 -中国古代思想家 Every important idea is simple -列夫.托尔斯泰,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rig

13、hts Reserved,哈尔滨工业大学计算机学院语言技术研究中心,本人印象深刻的至理名言,The grand aim of all science is to cover the greatest number of empirical facts by logical deduction from the smallest number of hypotheses or axioms -爱因斯坦,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,两件宝贝,Mindj

14、et MindManager Endnote/Mendeley/NoteExpress,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心 哈工大-阿里巴巴联合实验室,教材,Christopher Manning and Hinrich Schutze: Foundations of Statistical Language Processing, MIT press, 1999(有中译本,译者 苑春法 等) 自然语言处理综论 Daniel Jurafsky &James

15、 H. Martin著 冯志伟 孙乐 译 王晓龙、关毅 计算机自然语言处理 清华大学出版社 2005年,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014 HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014. HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,2、自然语言处理概论,什么是自然语言处理,定义1:自然语言处理可以定义为研究在人与人交际中以及在人与计算机交际中的语言问题的一门学科。自然语言

16、处理要研制表示语言能力(linguistic competence)和语言应用(linguistic performance)的模型,建立计算框架来实现这样的语言模型,提出相应的方法来不断地完善这样的语言模型,根据这样的语言模型设计各种实用系统,并探讨这些实用系统的评测技术。 -Bill Manaris, 1999,研究生专业必修课 自然语言处理 , 2014年秋季 Copyrights 2014. HIT. All Rights Reserved,哈尔滨工业大学计算机学院语言技术研究中心,解题,本学科的主题与背景:“自然语言处理可以定义为研究在人与人交际中以及在人与计算机交际中的语言问题的一门学科。” 人人交际中的语言问题 例如语言不通的问题,促进了机器翻译这一语言处理中最重要的应用之一的发展 人机交际中的语言问题 例如语言文字的输入输出问题,促进了智能化人机接口技术的研究,研究生专业必修课 自然语言处理 , 2

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号