自然语言处理综论

上传人:子 文档编号:46825887 上传时间:2018-06-28 格式:PDF 页数:9 大小:144.45KB
返回 下载 相关 举报
自然语言处理综论_第1页
第1页 / 共9页
自然语言处理综论_第2页
第2页 / 共9页
自然语言处理综论_第3页
第3页 / 共9页
自然语言处理综论_第4页
第4页 / 共9页
自然语言处理综论_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《自然语言处理综论》由会员分享,可在线阅读,更多相关《自然语言处理综论(9页珍藏版)》请在金锄头文库上搜索。

1、自然语言处理综论自然语言处理综论 Speech and Language Processing An Introduction to Natural language Processing, Computational Linguistics and Speech Recognition Daniel Jurafsky, James H. Martin 著 冯志伟 孙乐 译 详细目录 详细目录 序序 前言前言 1 导论 1.1 语音与语言处理中的知识 1.2 歧义 1.3 模型和算法 1.4 语言、思维和理解 1.5 学科现状与近期发展 1.6 语音和语言处理简史 1.6.1 基础研究:20世

2、纪40年代和50年代 1.6.2 两个阵营:19571970 1.6.3 四个范例:19701983 1.6.4 经验主义和有限状态模型的复苏:19831993 1.6.5 不同领域的合流:19941999 1.6.6 多重发现 1.6.7 心理学的简要注记 1.7 小结 1.8 文献和历史说明 词汇的计算机处理 词汇的计算机处理 2 正则表达式与自动机 2.1 正则表达式 2.1.1 基本正则表达式模式 2.1.2 析取、组合与优先关系 2.1.3 一个简单的例子 2.1.4 一个比较复杂的例子 2.1.5 高级算符 2.1.6 则表达式中的替换,存储器与ELIZA 2.2 有限状态自动机

3、2.2.1 用FSA来识别羊的语言 2.2.2 形式语言 2.2.3 另外的例子 2.2.4 非确定FSA 2.2.5 使用NFSA接收符号串 2.2.6 识别就是搜索 2.2.7 确定自动机与非确定自动机的关系 2.3 正则语言与 FSA 2.4 小结 2.5 文献与历史说明 3 形态学与有限状态转录机 3.1 英语形态学概观 3.1.1 屈折形态学 3.1.2 派生形态学 3.2 有限状态形态剖析 3.2.1 词表和形态顺序规则 3.2.2 用有限状态转录机进行形态剖析 3.2.3 正词法规则和有限状态转录机 3.3 把FST词表与规则相结合 3.4 与词表无关的FST: PORTER词干

4、处理器 3.5 人是怎样进行形态处理的 3.6 小结 3.7 文献和历史说明 4 计算音系学与文本语音转换 4.1 言语语音和语音标音法 4.1.1 发音器官 4.1.2 辅音:发音部位 4.1.3 辅音:发音方法 4.1.4 元音 4.1.5 音节 4.2 音位和音位规则 4.3 音位和转录机 4.4 计算音系学中的一些高级问题 4.4.1 元音和谐 4.4.2 模板式形态学 4.4.3 优选理论 4.5 音位规则的机器学习 4.6 TTS中从文本映射到语音 4.6.1 发音词典 4.6.2 词典之外的查找:文本分析 4.6.3 基于有限状态转录机(FST)的发音词典 4.7 文本-语音转换

5、中的韵律 4.7.1 韵律的音系学性质 4.7.2 韵律的语音和声学性质 4.7.3 语音合成中的韵律 4.8 人处理语音和形态的过程 4.9 小结 4.10 文献和历史说明 5 发音与拼写的概率模型 5.1 关于拼写错误 5.2 拼写错误模式 5.3 非词错误的检查 5.4 概率模型 5.5 把Bayes方法应用于拼写 5.6 最小编辑距离 5.7 英语的发音变异 5.8 发音研究中的Bayes方法 5.8.1 发音变异的决策树模型 5.9 加权自动机 5.9.1 从加权自动机计算似然度:向前算法 5.9.2 解码:Viterbi算法 5.9.3 加权自动机和切分 5.9.4 用切分来进行词

6、表的自动归纳 5.10 人类发音研究 5.11 小结 5.12 文献和历史说明 6 N-元语法 6.1 语料库中单词数目的计算 6.2 简单的(非平滑的)N元语法 6.2.1 N元语法及其对训练语料库的敏感性 6.3 平滑 6.3.1 加一平滑 6.3.2 Witten-Bell打折法 6.3.3 Good-Turing打折法 6.4 回退 6.4.1 回退与打折相结合 6.5 删除插值法 6.6 拼音和发音的N元语法 6.6.1 上下文有关的错拼更正 6.6.2 发音模型的N元语法 6.7 熵 6.7.1 用于比较模型的交叉熵 6.7.2 英语的熵 6.8 小结 6.9 文献和历史说明 7

7、HMM模型与语音识别 7.1 语音识别的总体结构 7.2 隐Markov模型概述 7.3 再谈Viterbi算法 7.4 先进的解码方法 7.4.1 A*解码 7.5 语音的声学处理 7.5.1 声波 7.5.2 怎样解释波形 7.5.3 声谱 7.5.4 特征抽取 7.6 声学概率的计算 7.7 语音识别系统的训练 7.8 用于语音合成的波形生成 7.8.1 音高和音延的修正 7.8.2 单元选择 7.9 人的语音识别 7.10 小结 7.11 文献和历史说明 句法的计算机处理 句法的计算机处理 8 词的分类与词类标注 8.1 大多数英语词的分类 8.2 英语的标记集 8.3 词类标注 8.

8、4 基于规则的词类标注 8.5 随机词类标注 8.5.1 一个为了说明问题的例子 8.5.2 实际的HMM标注算法 8.6 基于转换的标注 8.6.1 怎样应用TBL规则 8.6.2 怎样学习TBL规则 8.7 其他问题 8.7.1 多重标记和多项词 8.7.2 未知词 8.7.3 基于类的N元语法 8.8 小结 8.9 文献和历史说明 9 英语的上下文无关文法 9.1 组成性 9.2 上下文无关规则和树 9.3 句子级的结构 9.4 名词短语 9.4.1 在中心名词前的成分 9.4.2 名词后的成分 9.5 并列关系 9.6 一致关系 9.7 动词短语和次范畴化 9.8 助动词 9.9 口语

9、的句法 9.9.1 不流畅现象 9.10 语法等价与范式 9.11 有限状态语法和上下文无关语法 9.12 语法和人的语言处理 9.13 小结 9.14 文献和历史说明 10 基于上下文无关文法的剖析 10.1 剖析就是搜索 10.1.1 自顶向下剖析 10.1.2 自底向上剖析 10.1.3 自顶向下剖析与自底向上剖析比较 10.2 基本的自顶向下剖析 10.2.1 增加自底向上过滤 10.3 基本的自顶向下剖析的问题 10.3.1 左递归 10.3.2 歧义 10.3.3 子树的重复剖析 10.4 Earley算法 10.4.1 预测 10.4.2 扫描 10.4.3 完成 10.4.4

10、示例 10.4.5 从线图中检索剖析树 10.5 有限状态剖析方法 10.6 小结 10.7 文献和历史说明 11 特征与合一 11.1 特征结构 11.2 特征结构的合一 11.3 语法中的特征结构 11.3.1 一致关系 11.3.2 中心语特征 11.3.3 次范畴化 11.3.4 其他词类的次范畴化 11.3.5 长距离依存关系 11.4 合一的实现 11.4.1 合一数据结构 11.4.2 合一算法 11.5 带有合一约束的剖析 11.5.1 把合一结合到Earley剖析中 11.5.2 复制的必要性 11.5.3 合一剖析 11.6 类型与继承关系 11.6.1 类型的扩充 11.

11、6.2 合一的其他扩充 11.7 小结 11.8 文献和历史说明 12 词汇化剖析与概率剖析 12.1 概率上下文无关语法 12.1.1 PCFG的概率CYK剖析 12.1.2 PCFG概率的学习 12.2 PCFG的问题 12.3 概率词汇化的CFG 12.4 依存语法 12.4.1 范畴语法 12.5 人的剖析 12.6 小结 12.7 文献和历史说明 13 语言与复杂性 13.1 Chomsky层级 13.2 怎么判断一种语言是不是正则的? 13.2.1 抽吸引理 13.2.2 英语和其他自然语言是正则语言吗? 13.3 自然语言是上下文无关的吗? 13.4 计算复杂性和人的语言处理 1

12、3.5 小结 13.6 文献和历史说明 语义的计算机处理 语义的计算机处理 14 意义的表示法 14.1 表达的计算要求 14.1.1 核实 14.1.2 无歧义的表达 14.1.3 规范形式 14.1.4 推论与变元 14.1.5 表达性 14.2 语言的意义结构 14.2.1 谓词-论元结构 14.3 一阶谓词演算 14.3.1 FOPC基础 14.3.2 FOPC的语义 14.3.3 变元和逻辑量词 14.3.4 推理 14.4 某些与语言学相关的概念 14.4.1 范畴 14.4.2 事件 14.4.3 时间表示 14.4.4 体 14.4.5 信念表示 14.4.6 缺陷 14.5

13、有关的表示方法 14.6 意义的其他表示方法 14.6.1 意义就是行动 14.6.2 意义就是真值 14.7 小结 14.8 文献和历史说明 15 语义分析 15.1 句法驱动的语义分析 15.1.1 给上下文无关语法规则扩充语义 15.1.2 量词辖域和复杂项的转译 15.2 给英语的片段附加语义分析 15.2.1 句子 15.2.2 名词短语 15.2.3 动词短语 15.2.4 介词短语 15.3 把语义分析结合到Earley剖析中 15.4 惯用语和组成性 15.5 鲁棒的语义分析 15.5.1 语义语法 15.5.2 信息抽取 15.6 小结 15.7 文献和历史说明 16 词汇语

14、义学 16.1 词位及其涵义之间的关系 16.1.1 同形关系 16.1.2 多义关系 16.1.3 同义关系 16.1.4 上下位关系 16.2 WORDNET:词汇关系信息库 16.3 词的内部结构 16.3.1 题元角色 16.3.2 选择限制 16.3.3 基元分解 16.3.4 语义场 16.4 语言的创造性与词库 16.4.1 隐喻 16.4.2 换喻 16.4.3 隐喻和换喻的计算方法 16.5 小结 16.6 文献和历史说明 17 词义排岐与信息检索 17.1 基于选择限制的排歧 17.1.1 选择限制的局限性 17.2 鲁棒的词义排岐 17.2.1 机器学习方法 17.2.2 基于词典的方法 17.3 信息检索 17.3.1 向量空间模型 17.3.2 项目加权 17.3.3 项目的选择和创造 17.3.4 同形、多义和同义 17.3.5 改进用户的提问 17.4 信息检索的其他任务

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号