基于基音周期模型的语音识别毕业设计论文

上传人:cl****1 文档编号:494794254 上传时间:2022-10-29 格式:DOC 页数:42 大小:1.09MB
返回 下载 相关 举报
基于基音周期模型的语音识别毕业设计论文_第1页
第1页 / 共42页
基于基音周期模型的语音识别毕业设计论文_第2页
第2页 / 共42页
基于基音周期模型的语音识别毕业设计论文_第3页
第3页 / 共42页
基于基音周期模型的语音识别毕业设计论文_第4页
第4页 / 共42页
基于基音周期模型的语音识别毕业设计论文_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《基于基音周期模型的语音识别毕业设计论文》由会员分享,可在线阅读,更多相关《基于基音周期模型的语音识别毕业设计论文(42页珍藏版)》请在金锄头文库上搜索。

1、基于基音周期模型的语音识别摘要 基音周期是表征语音信号本质特征的参数,属于语音分析的范畴,只有准确分析并且提取出语音信号的特征参数,才能够利用这些参数进行语音识别处理。语音识别率的高低,都依赖于对语音信号分析的准确性和精确性,因此基音周期的研究在语音信号的处理应用中具有十分重要的作用。本论文通过两种算法在Matlab上实现基音周期的检测,分别是短时自相关函数法和短时平均幅度差函数法。通过实验得到的基音周期结果的分析来识别不同的人的语音信号。 论文首先介绍了语音基音检测算法在语音识别方面的研究背景极其重要意义。其次对现有的基音检测算法进行了归纳和总结,并详细的介绍本文将用的两种基本基音检测算法的

2、基本原理及实现。最后在Matlab上对语音信号进行基音周期的检测。本设计为语音信号的基音周期检测,采集语音信号,对语音信号进行处理,区分清音浊音,并通过对采样值进行滤波、分帧、求短时自相关函数,得到浊音的基音周期。关键词:预处理,基音检测,自相关函数法,平均幅度差函数法,基音轨迹 ,语音识别Abstract pitch is characterization parameters of speech signal characteristics, belongs to the category of speech analysis, only the accurate analysis and

3、 extract the characteristic parameters of speech signal can use these parameters to speech recognition processing. voice recognition rate of high and low, are dependent on the accuracy of the analysis of speech signal and accuracy, so the pitch period of the study on speech signal processing plays a

4、n important role in application.in this paper, through the two algorithm in Matlab pitch period detection, respectively is short-time autocorrelation method and short time average magnitude difference function method. Pitch period is obtained by the experiment results of speech signal analysis to id

5、entify the different people. The curriculum design of pitch detection of speech signals, speech signal, the speech signal processing, distinguish between the voiced and unvoiced speech has different samples values in the filtering, framing, asks the short-time autocorrelation function, have voiced s

6、ound pitch period. The thesis first introduces the research background of speech pitch detection algorithm is very important. Next to the existing algorithm for pitch detection are summarized, and a detailed introduction to this article will use the two kinds of basic pitch detection algorithm is th

7、e basic principle and realization. Finally in Matlab on speech signal pitch period detection.Keywords: pretreatment,pitch detection ,autocorrelation function; the average magnitude difference function method; pitch contrail,Speech recognition 目 录摘要IAbstractII1 绪论11.1引言11.2基音周期检测对语音识别的意义21.3基音周期检测现状3

8、1.4论文的结构安排42 基音检测常用的算法52.1引言52.2 常用的基音检测算法及其原理52.2.1 自相关函数法52.2.2 平均幅度差函数法92.3 本章小结113 基于Matlab基音周期的检测123.1 语音文件的录制与读入123.2 语音信号的采样和分帧133.3 语音信号基音周期的检测153.3.1 短时自相关函数法检测基音周期153.3.2 短时平均幅度差函数法检测基音周期163.4 基音周期检测的后处理183.5 滤波后的基音周期检测223.6 本章小结254 语音识别结果分析265 展望与应用30附录33致 谢38 1 绪论1.1引言 通过语言相互传递信息是人类最重要的基

9、本功能之一。语言是人类特有的功能,它是创造和记载几千年人类文明史的根本手段,没有语言就没有今天的人类文明。同时语言又属于声学范畴,是相互传递信息最重要的手段,是人类最重要,最有效,最常用和最方便的交换信息的形式。语音中除了包含实际发音内容的语音信息外,还包括发音者是谁及喜怒哀乐的各种信息。语音识别技术是一项集声学,语音学,计算机,信息处理,人工智能计算机接口的范畴。现在的电脑网络技术的普及和完善,对于语音信号处理技术发挥着越来越重要的作用。语音识技术是用来设计一种会听话的计算机,只要对着麦克风讲话,便可以指挥计算机动作,也就是要实现“芝麻开门”声控计算机的梦想,当然现在这已经不是梦想。语音信号

10、处理的一系列技术及其应用已经成为信息社会中不可或缺的组成部分,促进了信息社会的发展。语音信号中的情感信息是一种很重要的信息资源,它是人们在感知事物时的一种独特的信息,就比如,虽然是同样的语音内容,不同的人就会表现出不同的情感,也会有不用的意思。在听别人说话时,不仅要听还要看,这些语音特征在研究时很重要的。语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科,其中包括语音识别只是其中的一个分支。但其前提和基础是对语音信号的分析,语音识别率的高低取决于对语音信号分析的准确性和精度。只有将语音信号分析成其本质的特性参数

11、,才能建立用于识别的模板或知识库。语音信号处理和认知科学、心理学、语言学、计算机科学、模式识别和人工智能等学科联系紧密。 基音周期检测也称为基频检测(Pitch Detection) ,它的目标是找出和声带振动频率完全一致的基音周期变化轨迹曲线,或者是尽量相吻合的轨迹曲线。基音频率的检测和共估值在语音编码,语音合成和语音识别中有着广泛的应用。它的准确性及实时性对系统起着非常关键的作用,影响着整个系统的性能。因为清音信号没有周期性,所以就将浊音信号的周期称为基音周期, 它是声带振动频率的倒数。基音检测是语音处理中的一项重要技术之一, 也是语音处理中最困难的工作之一,而且是语音处理领域最具挑战的任

12、务之一。着眼于基音的检测方法,开展了一下三个方面的研究:1)稳定并提取准周期性信号的周期性方法;2)因周期混乱,采取基音提取误差补偿的方法;3)消除声道(共振峰)影响的方法。在基音提取时,容易错误的提取真正基频两倍的频率(倍基音)和基频一半的频率(半基音),至于产生哪种错误随抽取方法而变化,本论文中会介绍两种比较好的算法来进行基音检测。 要准确地提取语音信号的特征参数,对语音信号的处理分析很重要。因此,表征语音特征参数的获取,是利用它们进行准确语音识别的关键。在这些参数中,基音周期的提取显得更重要些,其提取的准确与否直接影响到语音识别是否真实再现原始语音信号的频谱。1.2基音周期检测对语音识别

13、的意义基音周期是语音信号最重要的参数之一,它描述了语音激励源的一个重要特征。基音周期是指发浊音时声带震动所引起的周期运动时间间隔。语音信号是十分复杂的非平稳信号,它不仅包括语义信息,还有个人特征信息,对于语音信号特征参数的研究是语音识别的基础。特征参数应能完全,准确地表达语音信号,那么特征参数也应能完全,准确地表达语音信号所携带的全部信息。实验语音学给出的语音信号的特征参数本质上讲是客观,合理的,存在的问题是不够完全。仅对元音的特征进行了深入的研究,辅音的领域就比较薄弱,最难的元辅音的过渡就更是空白,但偏偏这一部分所含的信息量大,最难处理的。准确可靠的对基音周期进行检测将直接影响整个语音处理系

14、统的性能。声带的声学功能是为语音提供主要的激励源,由声带的振动产生声音,是形成声音的基本声源。根据声带是否震动可以将语音信号分为清音跟浊音两种。语音由声带震动或不经声带震动来产生,其中由声带震动产生的音统称为浊音,而不由声带震动产生的音统称为清音。携带者语言中大部分的能量,浊音在时域上呈现出明显的周期性。发浊音时,气流通过声门使声带产生张弛震荡式振动,产生准周期的激励脉冲串。这种声带振动的频率称为基音频率,相应的周期就成为基音周期。在基音检测的方法中,对每帧语音信号只进行一次清浊判决,若判决为浊音,则以基音周期间隔的脉冲序列作为该帧的激励信号;若为清音,则以随机噪音作为该帧的激励信号,实际中,

15、清浊信号的过渡段是很难区分的,且激励信号也常常含有类噪音成分,很难以帧加以区分。基音周期与先天个人的声带条件(比如声带的厚薄,韧性等)还有后天的个人说话习惯都有关系,在很大程度上反应了个人的语音特征。语音信号还是随着一些因素在变化的,男人声音低,就基音频率低,女基音频率还跟随着人的性别、年龄不同而有所不同。一般来说,男性说话者的基音频率较低,大部分在70200Hz的范围内,而女性说话者和小孩的基音频率相对较高,在200450Hz之间。基音周期的估计称谓基音检测,基音检测的最终目的是为了找出和声带振动频率完全一致或尽可能相吻合的轨迹曲线。基音是指发浊音时声带震动所引起的周期性,基音周期是指声带震动频率的倒数。基音周期信息的应用很广发,如:语音识别,说话人识别,语音分析与综合以及低码率语音编码,发音系统疾病的诊断,听觉残障者的语言指导等。汉语是一门讲声调的语言,基音周期的变化恰好就是声调,它携带的信息的辨别作用很重要,具有区别功能,声调对于汉语语音的理解极为重要。在使用汉语进行谈话时,我们可以说话人的语调来了解其中的意思,也可以是用元音和辅音来辨识说话人的意思,但是,由于汉语中常常会出现多音字,就是一个字它有不同的读音和不同的意义,所以,能够准确并且可靠地进行基音周期检测对汉语语音信号的处理相当重要,同时对于语音识别有十分重要的意义。1.3基音周期检

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号