语音信号报告

上传人:今*** 文档编号:105898723 上传时间:2019-10-14 格式:DOC 页数:15 大小:473.01KB
返回 下载 相关 举报
语音信号报告_第1页
第1页 / 共15页
语音信号报告_第2页
第2页 / 共15页
语音信号报告_第3页
第3页 / 共15页
语音信号报告_第4页
第4页 / 共15页
语音信号报告_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《语音信号报告》由会员分享,可在线阅读,更多相关《语音信号报告(15页珍藏版)》请在金锄头文库上搜索。

1、江苏师范大学物电学院课程设计报告课 程 名 称: 语音信号处理 题 目: 语音信号的线性预测分析及应用 专 业 班 级: 14物41 学 生 姓 名: 刘梦娇 学 生 学 号: 140220018 日 期: 2016.12.20 指 导 教 师: 马勇 物电学院教务部印制1 绪论1.1语音信号LPC分析技术的基本概念线性预测这一术语是维纳1947年首次提出的,此后,线性预测应用于许多领域中。1967年,板仓等人最先将线性预测技术直接应用到语音分析和合成中。线性预测作为一种工具,几乎普遍地应用于语音信号处理的各个方面。这种方法是最有效和最流行的语音分析技术之一。在各种语音分析技术中,它是第一个真

2、正得到实际应用的技术。线性预测技术产生至今,语音处理又有许多突破,但这种技术目前仍然是唯一的最重要的分析技术基础。线性预测分析是最有效的语音分析技术之一,在语音编码、语音合成、语音识别和说话人识别等语音处理领域中得到了广泛的应用。语音线性预测的基本思想是:一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近。通过使实际语音抽样值与线性预测抽样值的均方误差达到最小,可以确定唯一的一组线性预测系数。采用线性预测分析不仅能够得到语音信号的预测波形,而且能够提供一个非常好的声道模型。此外,LPC分析还能够对共振峰、功率谱等语音参数进行精确估计,LPC分析得到的参数可以作为语音识别的重要参数之一。

3、1.2 线性预测的基本原理线性预测编码原理:利用过去的样值对新样值进行预测,然后将样值的实际值与其预测值相减得到一个误差信号,显然误差信号的动态范围远小于原始语音信号的动态范围,对误差信号进行量化编码,可大大减少量化所需的比特数,使编码速率降低。线性预测分析又称LPC分析,对分析就是用过去P个取样值的加权之和来预测信号当前取样值,如果利用P个取样值来进行预测,则称为P阶线性预测。预测信号为: (2.2.1),称为预测系数,由于语音信号性质变化缓慢,所以对于所分析的帧来说,预测系数是一组恒定的参数。预测误差为:(2.2.2)预测误差e(n)是信号s(n)通过如下系统的输出,A(z)称为LPC误差

4、滤波器.图1.2该方程可以求出预测误差滤波器的传输函数为将(2.2.2)改写成下列形式现在输入信号是,输出信号是,传输函数为这是一个全极点滤波器,称为LPC的语音合成模型。系统A(z)为LPC误差滤波器,设计预测误差滤波器就是求解预测系数,使得预测误差e(n)在某个预定的准则下最小,这个过程就是LPC分析。线性预测的基本问题就是由语音信号直接求出一组线性预数 ,这组预测误差滤波器就被看做语音产生模型中系统函数H(z)的参数,使得在一短段语音波形中均方预测误差最小。将 对各个系数求偏导,并令其结果为零,即(2.2.3)由式(2.2.2)可知(2.2.4)将式(2.2.4)代入(2.2.3)可得(

5、2.2.5)式(2.2.5)表明预测误差与信号的过去p的取样值是正交的,称为正交方程。将式(2.2.2)代入(2.2.5)得(2.2.6)令s(n)的自相关序列为 (2.2.7)由于自相关序列为偶对称,因此 (2.2.8)这表明式(2.2.8)与一般的自相关序列的定义是一样的。这样式(2.2.7)进一步表示为 (2.2.9)上式称为标准方程式,它表明只要语音信号是已知的,则p个预测系数 通过求解该方程即可得到。设 (2.2.10)上式矩阵形式为 或者 (2.2.11)通过求解上式即可求得p个线性预测系数 1.3 LPC和语音信号模型的关系如图2-1所示,为描述语音产生过程的离散时间信号模型。图

6、中,准周期性脉冲序列发生器产生浊音的激励源,浊音的基音频率由脉冲重复的周期决定;随机噪声发生器产生清音的激励源,模拟湍空气湍流;清浊音开关控制清音和浊音的产生;嘴唇的辐射特性可以用一个一阶极点数字滤波器来实现;增益控制来控制语音的强度。模型中所有参数(基音频率,随即噪声的方差,清浊音开关的位置,模型的参数)都是随着时间改变的。声门激励、声道调制和嘴唇辐射的合成贡献,可用如下数字时变滤波器表示上式既有极点又有零点。按其有理式的不同,有如下三种信号模型:(1)自回归滑动平均模型(ARMA模型);(2)自回归信号模型(AR模型);(3)滑动平均模型(MA模型)。 一般都用AR模型作为语音信号处理的常

7、用模型。此时H(z)写为式中,增益G以及数字滤波器系数都可以随时间而变化,p为预测器阶数。当p足够大时,上式几乎可以模拟所有语音信号的声道系统。采用简化模型的主要优点:可以用线性预测分析法对增益G和滤波器系数进行直接而高效的计算。在语音产生的数字模型中,语音抽样信号s(n)和激励信号之间的关系可用下列差分方程来表示:可见,如果语音信号准确服从上式的模型,则 ,所以预测误差滤波器A(z)是H(z)的逆滤波器,故有下式成立: 2 设计方案选择2.1自相关算法由于语音是一种短时平稳信号,因此只能利用一段语音来估计模型参数。将长的语音序列加窗,然后对加窗语音进行LPC分析,只要限定窗的长度就可以保证分

8、析的短时性,这种方案称为自相关法。 )()()()( )()()()(11min2=-=-=piipiipinsneEansneEinsansneEneEE根据线性预测分析的原理可知,求解p个线性预测系数的依据,是预测误差滤波器的输出方均值或输出功率最小。称这一最小方均误差为正向预测误差功率,即 (2.3.1)由式(2.2.5)正交方程知上式第二项为0。再将式(2.2.2)代入可得以上两式组合起来得称为尤勒-沃尔克方程。方程的系数矩阵为托普利兹矩阵 可见,为了解得线性预测系数,必须首先计算出自相关序列R(k) ,为了简化计算,可根据语音信号的短时平稳特性将语音信号分帧,这样自相关序列R(k)可

9、用下式估计 (2.3.2)如果将预测误差功率Ep理解为预测误差的能量,则上式中的系数对线性预测方程的求解没有影响,因此可以忽略。利用对称托普利兹矩阵的性质,自相关法求解可用莱文逊-杜宾递推算法求解。该方法是目前广泛采用的一种方法。利用Levinson-Durbin算法递推时,从最低阶预测器开始,由低阶到高阶进行逐阶递推计算。自相关法递推过程如下 )(iii-ka=联立上面5式可对i=1、2、p进行递推求解,其最终解为 (2.3.3)3 仿真分析操作3.1仿真系统模型通过在MATLAB 命令栏中输入dsplpc,打开语音信号线性预测分析仿真模型:显示仿真模型如下图:图3-1 仿真系统框图图3-1

10、是线性预测语音信号的分析合成系统,本仿真图由两大部分构成,分别是语音信号的分析合成部分。由上图可知对于因信号进行采样,采样频率为8KHz的语音信号“MATLAB”,首先进行预加重,提升语音信号的高频部分,提高信噪比,然后通过叠阶窗分析将语音信号的频谱图连接起来,达到淡入淡出的效果,防止语音信号在连接点的跳变,避免刺耳的噪声。而后通过汉明窗对语音信号频谱进行截取,分析一段语音信号。进行自相关函数的计算,得到LPC方程组,通过莱文森杜宾算法计算出预测系数。预测系数作为逆滤波系数,并将残差信号送到声道滤波器中进行滤波,合成的语音信号进行去加重,便得到与原始信号相似的语音波形。3.2 仿真工作过程3.

11、2.1语音信号采样图3-2 输入语音信号模型双击出现如下对话框,输入一个8kHZ的语音信号“speech1”。图3-3 输入语音信号参数设定参数分析:采样周期为1/8000,每帧采样点为80,并分帧处理。3.2.2预加重图3-4 预加重模型图3-5 预加重参数设定参数分析:传递函数类型:全极点,即全零点FIR数字滤波器。滤波器结构:直接型无反馈。分子系数:1,0.95 起始值:预加重就是设计滤波器,常采用的是传递函数为H(z)=1-u/z的一阶FIR高通滤波器来实现预加重。预加重系数取接近于1的值,常取0.91。设n时刻的语音采样信号x(n),经过预加重处理后的结果为y(n)=x(n)-ux(

12、n-1),这里取u=0.98。3.2.3叠阶窗分析图3-6 叠接窗模型通过预加重处理后,接下来进行加窗分帧处理。双击该图标将出现图2-7。图2-7 叠接窗参数设定参数分析:由上图可知,帧长:160bit; 帧移动:80bit; 帧移与帧长的比值为1/2,即一帧160个样点,缓冲80个样点。3.2.4汉明窗图3-8 汉明窗模型下图是汉明窗的参数设定:图3-9 汉明窗参数设定参数分析:由图可知采用汉明窗口输入,采用对称采样。3.2.5自相关算法图3-10 自相关和莱文森-杜宾算法模型用自相关函数测定语音的相似特性,之后运用莱文森-杜宾算法进行快速简便的运算,计算出预测系数。在这个过程中可用前n-1

13、个值来预测第n个值,用来取消冗余,实际与现实有误差,来计算误差。计算得出的值作为预测系数进行傅里叶等计算得到LPC的频谱。而通过莱文森算法得出的预测系数作为滤波器系数,使预测语音信号和原始信号进行相减滤波得出残差,这里即为预测系数。图3-11为LPC频谱。图3-11 LPC频谱图图3-11为莱文森-杜宾算法计算得出的预测系数经添零后作傅里叶变换,再求其倒数得到的LPC频谱。可以清晰地看到第一共振峰,第二共振峰以及第三共振峰。 4总结通过此次的课程设计,我对语音信号处理这门课有了更加深入的了解。从原先的不太了解到现在慢慢地接触,收获了很多。这次的课设题目是语音的线性预测分析及应用,我用了自相关算法进行仿真,录入了一个自己的语音,完成了这次试验。由于平时上课的不太用心,在仿真过程中遇到了一些困难,但后来通过网络和咨询同学得到了解决。在实验中运用MATLAB 软件,使我发现了这个软件奇妙的地方,当看到出图时,立马感受到了收获成果的喜悦,让我对语音技术有了更多的兴趣。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号