基于连续隐马尔科夫模型的语音识别

上传人:liy****000 文档编号:117274142 上传时间:2019-12-05 格式:DOC 页数:89 大小:542.50KB
返回 下载 相关 举报
基于连续隐马尔科夫模型的语音识别_第1页
第1页 / 共89页
基于连续隐马尔科夫模型的语音识别_第2页
第2页 / 共89页
基于连续隐马尔科夫模型的语音识别_第3页
第3页 / 共89页
基于连续隐马尔科夫模型的语音识别_第4页
第4页 / 共89页
基于连续隐马尔科夫模型的语音识别_第5页
第5页 / 共89页
点击查看更多>>
资源描述

《基于连续隐马尔科夫模型的语音识别》由会员分享,可在线阅读,更多相关《基于连续隐马尔科夫模型的语音识别(89页珍藏版)》请在金锄头文库上搜索。

1、毕业设计(论文)UNDERGRADUATE PROJECT (THESIS)论文题 目基于连续隐马尔科夫模型的语音识别学 院 专 业 学 号 学生姓名 指导教师 起讫日 目 录摘要 -2ABSTRACT -2绪论 -3第一章 语音知识基础-6第一节 语音识别的基本内容-6第二节 语音识别的实现难点-9第二章 HMM的理论基础-10第一节 HMM的定义-10第二节 隐马尔科夫模型的数学描述-10第三节 HMM的类型-12第四节 HMM的三个基本问题和解决的方 -15第三章HMM算法实现的问题 -21第一节HMM状态类型及参数B的 选择-21第二节HMM训练时需要解决的问题 -23第四章 语音识别

2、系统的设计 -32 第一节 语音识别系统的开发环境-32 第二节 基于HMM的语音识别系统的设计-32 第三节 实验结果-49第五章 结束语 -67致谢 -68参考文献 -69 摘要语音识别系统中最重要的部分就是声学模型的建立,隐马尔可夫模型作为语音信号的一种统计模型,由于它能够很好地描述语音信号的非平稳性和时变性,因此在语音识别领域有着广泛的应用。隐马尔可夫过程是一个双重随机过程:一重随机过程用于描述非平稳信号中短时平稳段的统计特征;另一重随机过程描述了每个短时平稳段如何转变到下一个短时平稳段,即短时统计特征的动态特性。为了能够对HMM有一个全面的认识并能够将其应用于解决实际问题当中,本文介

3、绍了HMM的基本理论以及其如何将其应用于语音识别中,在解决HMM的三个基本问题以后,还谈论了在具体应用时需要考虑的其他问题,如初始模型参数的选取、数据下溢、HMM之间距离的度量等等,并给出了相应的解决方法。这个语音识别系统是用HMM模型来实现的,用HMM来做语音识别的识别率是很高的,其中用到了HMM的三个算法。 关键词:语音识别,HMMABSTRACTThe most important part of a recognition system is the acoustic model construction. As a statistic model for signal, HMM ca

4、n describe the pronunciation signal non-stability and the variability well.For the sake of understand HMM systematically and apply it to solve real-world problem, this paper introduces the basic theory of HMM and how to use it in the speech recognition. After three basic problem solved,some other im

5、portant issues in the application, for instance, selecting parameters of the initial model, data over-fitting and the distance degree between HMM, are discussed, then methods for settling those issues are put forward. In addition, it also explains design of the topology and its parameters optimizati

6、on ways.This recognition system use HMM models come true. It is easier recognizable to use HMM recognize.In this system I use the three arithmetic of HMM. Keyword: Speech recognition,HMM 绪论计算机技术的飞速发展,使人与机器用自然语言进行对话的梦想逐渐接近现实。人类的语言在人类的的智能组成中充当着极其重要的角色,人与人之间的交流和沟通70%意商是通过语言的方式有效的完成。作为人与人之间交流最方便、自然、快捷的手

7、段,人们自然希望它成为人与计算机交流的媒介。语音识别就是研究计算机听懂人类语言的一门科学。也是人机交互最重要的一步。进入九十年代之后,出现了诸多实用化的研究方向。语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能满足通常应用的要求。由于大规模集成电路技术的发展,这下复杂的语音识别系统也已经完全可以制成芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些电话机、手机已经包含了语音识别拨号的功能,是有语音记事本、语音智能玩具等产品也包括了语音识别与语音合成的功能。人们可以通过电话网络用

8、语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。调查统计表明多达85%意商的人对语音识别信息查询服务系统的性能表示满意。可以预测在近五十年内,语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统,我们只能朝着改进语音识别系统的方向逐渐地前进。我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,在汉语语音识别技术上还有自己的特点与优势

9、,并达到国际先进水平。第一章 语音识别基础第一节 语音识别的基本内容语音识别是一种集声学、语音学、计算机、信息处理、人工智能等于一身的综合技术,可广泛的应用在信息处理、通信与电子系统、自动控制等领域。语音识别主要包括语音单元的选取,特征提取技术,模式匹配准则及模型训练技术三方面内容。语音识别的原理框图如图1-1所示: 图1-1 语音识别的原理框图一、识别单元的选取选择识别单元是语音识别研究的第一步。语音识别单元有单词、音节和音素三种,具体选哪种,由具体的研究任务决定。单词单元广泛应用于中小词汇语音识别系统,但不是和大词汇系统,原因在于模型库规模太庞大,训练模型任务繁重,模型匹配算法复杂,难以满

10、足实时性要求。音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而英语是多音节,数量相对较少,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少。因此,对于大、中词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的;音素单元以前多见于英语语音识别系统的研究中,但目前大、中词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母和韵母构成,且声韵母的声学特性相差很大。实际应用中常把声母的不通而构成细化声母。由于协同发音的影响,音素单元的不稳定,所以如何获得稳定的音素单元,还有待研究。 二、特征参数提取技术语音信号中含有丰富的信息,但如何从

11、中提取出对语音识别有用的信息是由特征提取完成的。特征参数提取的目的是对语音信号进行分析处理,提取对语音识别有用的信息,同时对语音信号进行压缩。在实际应用中,语音信号的压缩率介于10-100之间。语音信号包含了大量各种不同的信息,提取哪些信息,用哪种方式提取,需要综合考虑个方面的因素,如成本、性能、响应时间、计算量等。非特定人语音识别系统一般侧重提取反应语义的特征参数,尽量去除说话人的个人信息;而特定人语音识别系统则希望在提取反映语义的特征参数的同时,尽量也包含说话人的个人信息。线性预测分析技术是目前应用广泛的特征参数提取技术,许多成功的应用系统都采用基于LP技术提取的倒谱参数。但线性预测模型是

12、纯数学模型没有考虑人类听觉系统对语音的处理特点;Mel参数和基于感知线性预测分析提取的感知线性预测倒谱,在一定程度上模拟了人耳对语音的处理特点,应用了人耳听觉感知方面的一些研究成果。实验证明采用这种技术语音识别系统的性能有一定提高。三、模式匹配和模型训练技术模型训练是按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔科夫模型(HMM)和人工神经元网络(ANN)。DTW是较早的一种模式匹配和模型训练技术,它应用动态归划方法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统,目前

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号