线性预测分析

上传人:M****1 文档编号:567328165 上传时间:2024-07-20 格式:PPT 页数:58 大小:932.50KB
返回 下载 相关 举报
线性预测分析_第1页
第1页 / 共58页
线性预测分析_第2页
第2页 / 共58页
线性预测分析_第3页
第3页 / 共58页
线性预测分析_第4页
第4页 / 共58页
线性预测分析_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《线性预测分析》由会员分享,可在线阅读,更多相关《线性预测分析(58页珍藏版)》请在金锄头文库上搜索。

1、线性预测分析线性预测分析 时域、频域处理方法(50)3.7 线性预测(线性预测(Linear Prediction)分析分析根据语音信号的产生模型,语音信号根据语音信号的产生模型,语音信号x(n)可以看作以可以看作以u(n)为激励的一个全极点滤波器的响应。为激励的一个全极点滤波器的响应。问题:如何在已知问题:如何在已知x(n)的条件下,求出系数的条件下,求出系数 ai i=1, p ? AR模型模型解答:线性预测分析的方法。解答:线性预测分析的方法。 时域、频域处理方法(51)思路:思路:一个语音的采样能够用过去若干个语音采样的线一个语音的采样能够用过去若干个语音采样的线性组合来逼近。通过使线

2、性预测到的采样在最小均方误性组合来逼近。通过使线性预测到的采样在最小均方误差意义上逼近实际语音采样,可以求取一组唯一的预测差意义上逼近实际语音采样,可以求取一组唯一的预测系数。系数。 常简称为常简称为LPC(Linear Prediction Coding),),系数称为系数称为线性预测系数或线性预测系数或LPC系数。系数。几个概念几个概念 预测器:预测器: 从时域角度可以理解为,用信号的前从时域角度可以理解为,用信号的前p p个样本来预测当个样本来预测当前的样本得到预测值前的样本得到预测值。它的差分方程为它的差分方程为 时域、频域处理方法(52)预测误差预测误差 :预测误差滤波器:预测误差滤

3、波器: 可知可知H(z)=G/A(z),即预测误差滤波器是系统的逆滤波器。即预测误差滤波器是系统的逆滤波器。 短时预测均方误差短时预测均方误差: : 线性预测分析应该在短时的语音段上进行,线性预测分析应该在短时的语音段上进行,求解过程求解过程 使使则有:则有: 时域、频域处理方法(53) 得到线性方程组得到线性方程组若定义若定义则方程组可简写为则方程组可简写为一个由一个由p个方程组成的有个方程组成的有p个个未知数未知数的线性方程组的线性方程组 并可以计算最小预测误差能量并可以计算最小预测误差能量 求解方程,可得到求解方程,可得到LPC系数系数又被称为预测残差能量,它由一个固定分量和一个依赖又被

4、称为预测残差能量,它由一个固定分量和一个依赖于预测系数的分量组成。于预测系数的分量组成。 时域、频域处理方法(54)要构造信号的要构造信号的AR模型,还应估算增益因子。模型,还应估算增益因子。 AR模型模型的差分方程形式的差分方程形式因此可计算预测误差因此可计算预测误差则则激励信号激励信号u(n)总能量可以认为近似为总能量可以认为近似为1,因此有,因此有 时域、频域处理方法(55)求求LPC系数需考虑两个因素:系数需考虑两个因素: (1)模型阶数的选择。)模型阶数的选择。 (2)由于声门脉冲形状和口唇辐射的影响,语音信号的由于声门脉冲形状和口唇辐射的影响,语音信号的频谱在总趋势上会产生高频衰落

5、的现象,可频谱在总趋势上会产生高频衰落的现象,可通过预加重通过预加重进行高频提升。进行高频提升。D声门激励是一个双极点模型,口唇辐射是一个零点模型,声门激励是一个双极点模型,口唇辐射是一个零点模型,如一个零点抵消一个极点,则还有一个极点的影响。因如一个零点抵消一个极点,则还有一个极点的影响。因此,模型阶数为此,模型阶数为 , 其中其中 为共振峰的个数。为共振峰的个数。 时域、频域处理方法(56)自相关法自相关法 我们定义我们定义时,未将求和范围具体化。时,未将求和范围具体化。采用短时分析技术,只计算范围(采用短时分析技术,只计算范围(0nN-1)以内的语音以内的语音数据。数据。 或或为加窗后的

6、语音数据。为加窗后的语音数据。 线性预测方程组的解法:线性预测方程组的解法: 时域、频域处理方法(57)由于短时自相关函数可以表示为:由于短时自相关函数可以表示为:求求解解LPC系数的系数的方程组就可以写为:方程组就可以写为:则则可以表示为可以表示为仅与仅与 的相对值有关。的相对值有关。且有且有 , 时域、频域处理方法(58)将其转换成矩阵形式将其转换成矩阵形式 这种方程这种方程为为Yule-Walker方程方程 ,其系数矩阵被称为托布里,其系数矩阵被称为托布里兹兹(Toeplitz)矩阵。具有矩阵。具有如下特点:如下特点:(1 1)pp阶阶的对称阵。的对称阵。 (2 2)沿着主对角线及任何一

7、条与主对角线平行的斜线上的沿着主对角线及任何一条与主对角线平行的斜线上的所有元素都相等所有元素都相等 。 时域、频域处理方法(59)利用利用Toeplitz矩阵特点:矩阵特点: i阶方程组的解可以用阶方程组的解可以用i-1阶方程组的解来表示,阶方程组的解来表示,i-1阶方程阶方程组的解又可以用组的解又可以用i-2阶方程组的解表示,依此类推。阶方程组的解表示,依此类推。因此,只要解出一阶方程组的解,就可以一步一步地递推来因此,只要解出一阶方程组的解,就可以一步一步地递推来解出任意阶方程组的解。解出任意阶方程组的解。典型的方法有:典型的方法有: 莱文逊莱文逊杜宾(杜宾(LevinsonDurbin

8、)递推算法递推算法 舒尔(舒尔(Schur)递推算法递推算法 (3)(3)开始按如下公式进行递推运算开始按如下公式进行递推运算 (1)(1)计算自相关系数计算自相关系数 (2)(2)初值初值(4) i=i+1。若若i p则算法结束退出,否则返回第(则算法结束退出,否则返回第(3)步,)步, 时域、频域处理方法(60)这样经过递推计算后,可得到这样经过递推计算后,可得到i=1,2,p各阶预测器的解。各阶预测器的解。 莱文逊莱文逊杜宾递推算法杜宾递推算法 时域、频域处理方法(61)经过递推计算后经过递推计算后, ,最终解为最终解为: : 由于各阶预测器的预测残差能量都是非负的,可以推知由于各阶预测

9、器的预测残差能量都是非负的,可以推知ki称为反射系数。称为反射系数。 且且 必随预测器阶数的增加而减少。必随预测器阶数的增加而减少。 时域、频域处理方法(62) 舒尔递推算法:舒尔递推算法: 定义归一化的自相关函数如下:定义归一化的自相关函数如下: 将前面方程中的自相关函数都转化为其归一化形式。将前面方程中的自相关函数都转化为其归一化形式。归一化自相关函数永远不大于归一化自相关函数永远不大于1 1,因而,递推过程中的所有变,因而,递推过程中的所有变量都小于或等于量都小于或等于1 1。 递推过程中设一辅助序列递推过程中设一辅助序列 时域、频域处理方法(63)可以证明,可以证明, 有如下性质:有如

10、下性质: (1)当)当 时,时, (2)反射系数)反射系数 (3)递推式)递推式 成立;成立; (4) ,其中等号仅当,其中等号仅当 时成立。时成立。 时域、频域处理方法(64)舒尔递推算法描述如下:舒尔递推算法描述如下: (1)计算自相关系数)计算自相关系数 , (2)计算归一化自相关系数)计算归一化自相关系数 (3)令)令 (4)令)令 (5)对于)对于 计算:计算: (6) 。若。若 则算法结束退出,否则返回(则算法结束退出,否则返回(5)。)。 时域、频域处理方法(65)最终得到的是相应的反射系数。最终得到的是相应的反射系数。 如果如果在第(在第(5)步的递推过程加入相应的递推式,也)

11、步的递推过程加入相应的递推式,也可以同步求出线性预测系数和预测残差能量。可以同步求出线性预测系数和预测残差能量。 时域、频域处理方法(66)格型法格型法 :引入了引入了“正向预测正向预测”和和“反向预测反向预测”的概念,阐述了参的概念,阐述了参数数ki的物理意义。的物理意义。 首先提出了逆滤波器首先提出了逆滤波器A(z)的格型结构形式,由此给出了的格型结构形式,由此给出了线性预测分析的格型法。线性预测分析的格型法。 格型法不需要用窗口函数对信号进行加权,同时又保证格型法不需要用窗口函数对信号进行加权,同时又保证了解的稳定性,较好地解决了精度和稳定性的矛盾。了解的稳定性,较好地解决了精度和稳定性

12、的矛盾。 时域、频域处理方法(67)格型法的基本原理格型法的基本原理: 在基于自相关的杜宾递推算法中,当递推进行到第在基于自相关的杜宾递推算法中,当递推进行到第 i 阶阶时,可得到该阶预测系数时,可得到该阶预测系数 可以定义一个可以定义一个 i 阶的线性预测误差滤波器,它的传输函数阶的线性预测误差滤波器,它的传输函数定义如下:定义如下: 这个滤波器输入信号是这个滤波器输入信号是 ,输出信号为预测误差,输出信号为预测误差 , 写成写成z变换形式为:变换形式为: 时域、频域处理方法(68)利用前面的递推式:利用前面的递推式:写成矩阵形式:写成矩阵形式: 可以导出:可以导出:方程两边同时左乘方程两边

13、同时左乘 ,得,得 时域、频域处理方法(69)其中,其中, 预测误差:预测误差:上式表明,第上式表明,第 i 阶线性预测误差滤波器的输出可以分解成两部阶线性预测误差滤波器的输出可以分解成两部分,一是第分,一是第i 1阶滤波器的输出;第二部分是与第阶滤波器的输出;第二部分是与第i 1阶有关阶有关的输出信号的输出信号 经单位移序和经单位移序和 加权后的信号。加权后的信号。 时域、频域处理方法(70) 将这两部分信号分别定义为正向预测误差信号将这两部分信号分别定义为正向预测误差信号 和反向和反向预测误差信号预测误差信号 。 前者的计算公式前面已经给出,后者可以推导出:前者的计算公式前面已经给出,后者

14、可以推导出: 正向预测误差信号是用正向预测误差信号是用i个过去的样本值个过去的样本值来预测来预测 时的误差。时的误差。 反向预测误差是用时间上延迟时刻的样本值反向预测误差是用时间上延迟时刻的样本值 来预测来预测 时的误差。时的误差。 )()(nei)()(nbiZ反变换反变换 时域、频域处理方法(71)这两种预测情况如下图所示。这两种预测情况如下图所示。 时域、频域处理方法(72) 基于正向预测和反向预测,可以推出线性预测分析采用基于正向预测和反向预测,可以推出线性预测分析采用的格型滤波器结构。的格型滤波器结构。 对于正向预测,可得到如下的递推公式:对于正向预测,可得到如下的递推公式: 将将代

15、入代入求反变换后有:求反变换后有:当当i=0 时,有时,有 当当i=p时,有时,有 时域、频域处理方法(73)线性预测分析的格型滤波器的结构形式线性预测分析的格型滤波器的结构形式如图如图4-34-3所示。所示。这个滤波器输入为这个滤波器输入为x(n),输出为预测误差输出为预测误差e(n),对应对应于于预测误预测误差滤波器差滤波器A(z) 时域、频域处理方法(74) H(z)是预测误差滤波器是预测误差滤波器A(z)的逆滤波器。合成滤波器的逆滤波器。合成滤波器H(z)的输入为的输入为e(n)时,输出应为时,输出应为x(n)。整理递推式整理递推式: 据此可画出图据此可画出图4-4所示的格型合成滤波器

16、的结构。所示的格型合成滤波器的结构。 时域、频域处理方法(75) 由图由图4-34-3和图和图4-44-4可见,可见,p p 阶滤波器可以表示成由阶滤波器可以表示成由p p 节斜格构成,尤其是合成滤波器的结构直接与节斜格构成,尤其是合成滤波器的结构直接与前面讨论的声道的级联声管模型相对应。前面讨论的声道的级联声管模型相对应。 时域、频域处理方法(76)格型法的求解:格型法的求解: 根据格型分析滤波器的结构形式,可以依据最小误差准则,求根据格型分析滤波器的结构形式,可以依据最小误差准则,求出各反射系数出各反射系数ki。如果需要,还可以更进一步计算出预测如果需要,还可以更进一步计算出预测ai 。

17、可依照几种不同的最优准则来进行,由此出现了多种格型法的可依照几种不同的最优准则来进行,由此出现了多种格型法的求解算法。首先定义求解算法。首先定义3种均方误差:种均方误差: 正向均方误差正向均方误差 反向均方误差反向均方误差 交叉均方误差交叉均方误差 时域、频域处理方法(77)(1 1)正向格型法)正向格型法 : 正向格型法逼近准则:使格型滤波器的第正向格型法逼近准则:使格型滤波器的第i节正向均方误差最小节正向均方误差最小 经过推导可得:经过推导可得: 或者或者 时域、频域处理方法(78)(2 2)反向格型法)反向格型法 : 反向格型法逼近准则:使格型滤波器的第反向格型法逼近准则:使格型滤波器的

18、第i节反向均方误差最小节反向均方误差最小 经过推导可得:经过推导可得: 注意到注意到 和和 的值都是非负的,所以的值都是非负的,所以 和和 符号总是符号总是相同的。相同的。 由于不能保证由于不能保证 和和 ,所以,所以它们都不能保证它们都不能保证 ,也就是说解的稳定性是不能保证的。,也就是说解的稳定性是不能保证的。 时域、频域处理方法(79)(3 3)几何平均格型法)几何平均格型法 : S S为为 的符号。的符号。 定义正向格型法和反向格型法中定义正向格型法和反向格型法中 和和 的几何平均值的几何平均值 可得:可得: 或者以时间平均的形式表示:或者以时间平均的形式表示: 时域、频域处理方法(8

19、0) 上面的表达式具有归一化互相关函数的形式,上面的表达式具有归一化互相关函数的形式,由于它表示由于它表示了正向预测误差和反向预测误差之间的相关程度,因此反了正向预测误差和反向预测误差之间的相关程度,因此反射系数也被称为部分相关系数,简写为射系数也被称为部分相关系数,简写为PARCOR系数。系数。 运用柯西运用柯西许瓦兹不等式容易证明有许瓦兹不等式容易证明有 ,所以这种方,所以这种方法求解的反射系数将能保证系统的稳定。法求解的反射系数将能保证系统的稳定。 时域、频域处理方法(81)(4)伯格()伯格(Burg)法法 伯格法的逼近准则是:使格型滤波器伯格法的逼近准则是:使格型滤波器第第i节正向和

20、反向均方误节正向和反向均方误差之和最小,差之和最小, 由此可以得到:由此可以得到: 或者或者 时域、频域处理方法(82)1 1、反射系数、反射系数 其中其中Ai是第是第 i 节声节声管的面积函数。管的面积函数。 另一方面,它也表示了正向预测误差和反向预测误差之间的另一方面,它也表示了正向预测误差和反向预测误差之间的相关程度。相关程度。 线性预测的几种推演参数线性预测的几种推演参数 在前面声道的级联声管模型中,声道被模拟成一系列长度在前面声道的级联声管模型中,声道被模拟成一系列长度和截面积不等的无损声管的级联,反射系数和截面积不等的无损声管的级联,反射系数ki反映了声波反映了声波在各声管段边界处

21、的反射量。在各声管段边界处的反射量。 时域、频域处理方法(83)2 2、预测器多项式的根、预测器多项式的根 如果把合成滤波器看作是一个如果把合成滤波器看作是一个 p 阶阶AR模型,那么就有模型,那么就有 看作是对信号谱的一个估计。看作是对信号谱的一个估计。通过求取预测器多项式的根,可以实现对共振峰的估计。通过求取预测器多项式的根,可以实现对共振峰的估计。预测误差滤波器预测误差滤波器A(z)可以用它的一组根可以用它的一组根 等效等效地表示。地表示。 时域、频域处理方法(84)每一对根与信号谱中的一个共振峰相对应。每一对根与信号谱中的一个共振峰相对应。 如使如使A(z)=0,则可以解出则可以解出p

22、个根个根z1,z2,zp。 若若p为偶数,那么一般情况下得到的是为偶数,那么一般情况下得到的是p/2对复根,它们对复根,它们可以表示为:可以表示为: 时域、频域处理方法(85)如果把如果把z平面的根转换到平面的根转换到s平面,平面, 令令 其中其中T为采样间隔。设为采样间隔。设 则则 决定了共振峰的频率,决定了共振峰的频率, 决定了共振峰的带宽。决定了共振峰的带宽。 时域、频域处理方法(86)3 3、对数面积比系数、对数面积比系数由反射系数可以直接推导出一组重要参数由反射系数可以直接推导出一组重要参数对数面积比对数面积比系数,其定义为:系数,其定义为: 其中其中Ai就是多节无损声管中第就是多节

23、无损声管中第 i 节的截面积。节的截面积。 可得到直接通过反射系数求取对数面积比系数的关系式:可得到直接通过反射系数求取对数面积比系数的关系式: 同理,同理, 时域、频域处理方法(87)4 4、线谱对分析法、线谱对分析法 线线谱谱对对参参数数(Line Spectrum Pair,简简称称LSP)也也是是线线性性预预测测系系数数的的一一种种推推演演参参数数。LSP参参数数具具有有非非常常好好的的量量化化特特性性和和插插值值特特性性,因因而而在在声声码码器器研研究究中中获获得得广广泛泛的应用。的应用。定义定义 i 阶线性预测器的逆滤波器为阶线性预测器的逆滤波器为 时域、频域处理方法(88)定义两

24、个定义两个(p+1)阶的多项式阶的多项式 有有相当于相当于 时的时的 相当于相当于 时的时的 将相关项写成如下的形式:将相关项写成如下的形式:可以得到如下递推公式可以得到如下递推公式: 时域、频域处理方法(89)展开有展开有可见可见P(z)是一个对称的实系数多项式,而是一个对称的实系数多项式,而Q(z)是一个反对称是一个反对称的实系数多项式,因此它们都有共轭的复根。且都有实根:的实系数多项式,因此它们都有共轭的复根。且都有实根: 共轭复根的形式为共轭复根的形式为 零点构成的基本因式具有如下的形式:零点构成的基本因式具有如下的形式: 时域、频域处理方法(90)可以证明:当可以证明:当A(z)的零

25、点都在单位园内时,的零点都在单位园内时,P(z)和和Q(z)的零点都在单位园上,并且的零点都在单位园上,并且P(z)和和Q(z)零点交替出现,零点交替出现,即:即: 参数参数 、 成对地出现,且反映信号的频谱特性,因成对地出现,且反映信号的频谱特性,因此被称为线谱对系数。此被称为线谱对系数。 若阶数若阶数p是偶数,是偶数,P(z)和和Q(z)零点分别为零点分别为则则 时域、频域处理方法(91)求解线谱对参数就是求解多项式求解线谱对参数就是求解多项式P(z)和和Q(z)关于关于z的根。当的根。当线性预测系数已知时,可以用如下方法来求线性预测系数已知时,可以用如下方法来求LSP参数参数: 线谱对参

26、数的求解线谱对参数的求解: : 因为因为 令令可以通过变换使可以通过变换使 和和 表表示成关于示成关于y的的一对一对p/2次次代数方程组。代数方程组。 这对代数方程可以用牛顿迭代法求解得到方程的根,再进这对代数方程可以用牛顿迭代法求解得到方程的根,再进一步可求出一步可求出 和和 。 时域、频域处理方法(92)5、LPC倒谱系数(倒谱系数(LPCC) 语语音音信信号号的的倒倒谱谱是是通通过过对对语语音音信信号号进进行行Z变变换换,取取对对数数,再反再反Z变换来得到的。变换来得到的。 也也可可用用声声道道系系统统的的传传递递函函数数H(z)来来代代替替语语音音信信号号来来求求复复倒谱,因为它也反映

27、了信号的谱包络信息。倒谱,因为它也反映了信号的谱包络信息。系统的传递函数为系统的传递函数为其冲激响应为其冲激响应为h(n)其倒谱为其倒谱为有:有:可以展开成级数形式可以展开成级数形式 时域、频域处理方法(93)得到得到 和和 间的递推关系为间的递推关系为 时域、频域处理方法(94)3.8 基音周期估计基音周期估计 基音周期是语音信号最重要的参数之一,也称基基音周期是语音信号最重要的参数之一,也称基音检测(音检测(Pitch Detection) 对汉语:是一种有调语言,基音的变化模式称为对汉语:是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息。声调,它携带着非常重要

28、的具有辨意作用的信息。 时域、频域处理方法(95)基音检测的主要困难表现在:基音检测的主要困难表现在: 语音信号变化十分复杂,声门激励的波形并不语音信号变化十分复杂,声门激励的波形并不是一个完全周期的序列。是一个完全周期的序列。 要从语音信号中去除声道的影响,直接取出仅与要从语音信号中去除声道的影响,直接取出仅与声带振动有关的声源信息并非易事。声带振动有关的声源信息并非易事。 在浊音段很难精确地确定每个基音周期的开始和在浊音段很难精确地确定每个基音周期的开始和结束位置结束位置 。 基音周期变化范围较大。基音周期变化范围较大。 时域、频域处理方法(96)1 1 自相关方法自相关方法 浊音信号的自

29、相关函数在基音周期的整数倍位置浊音信号的自相关函数在基音周期的整数倍位置上出现峰值,而清音的自相关函数没有明显的峰上出现峰值,而清音的自相关函数没有明显的峰值出现。值出现。 影响从自相关函数中正确提取基音周期的最主要原影响从自相关函数中正确提取基音周期的最主要原因是声道响应部分。因是声道响应部分。 为了提高自相关方法检测基音周期的准确性,需要为了提高自相关方法检测基音周期的准确性,需要进行一些前期的预处理。进行一些前期的预处理。 时域、频域处理方法(97)(1) 60Hz900Hz的带通滤波的带通滤波(2)中心削波)中心削波(3)中心削波后的语音再计算自相关函数,中心削波后的语音再计算自相关函

30、数,求第求第一最大峰值点一最大峰值点由语音信号的峰值幅度来确定由语音信号的峰值幅度来确定 时域、频域处理方法(98) 计算自相关函数的运算量是很大的,可用一些计算自相关函数的运算量是很大的,可用一些减少短时自相关运算的有效方法。减少短时自相关运算的有效方法。 如可对中心削波函数进行修正。如可对中心削波函数进行修正。如采用三电平中心削波方法如采用三电平中心削波方法 时域、频域处理方法(99)3 倒谱法倒谱法 对语音信号利用倒谱解卷原理,可以得出激励序对语音信号利用倒谱解卷原理,可以得出激励序列的倒谱,它具有与基音周期相同的周期,因此可列的倒谱,它具有与基音周期相同的周期,因此可以求出基音周期。以

31、求出基音周期。 时域、频域处理方法(100)下图为语音信号对数频谱示意图。下图为语音信号对数频谱示意图。频谱包络的慢变分量频谱包络的慢变分量(虚线所示)(虚线所示) 基音谐波峰值基音谐波峰值的快变分量的快变分量(实线所示)(实线所示) 时域、频域处理方法(101) 通过滤波或再取一次傅里叶反变换,即可将慢变分通过滤波或再取一次傅里叶反变换,即可将慢变分量与快变分量分离开。量与快变分量分离开。 下图为倒谱的示意图。下图为倒谱的示意图。 靠近原点的低靠近原点的低倒频部分是频倒频部分是频谱包络的变换谱包络的变换 谐波峰值的变换,谐波峰值的变换,表示基音。表示基音。 时域、频域处理方法(102)一个用

32、倒谱提取基音的实例如下图。一个用倒谱提取基音的实例如下图。 窗口选择的语音段窗口选择的语音段应至少包含有两个应至少包含有两个明显的周期。明显的周期。 求出倒谱峰值求出倒谱峰值及其位置及其位置 如果峰值如果峰值未超过某未超过某门限值,门限值,则进行过则进行过零计算;零计算;若过零率低于某若过零率低于某门限值,则为无门限值,则为无声语音帧。声语音帧。时域信号的峰值检时域信号的峰值检测器;若低于某门测器;若低于某门限值,则是无声,限值,则是无声,不进行由倒谱检测不进行由倒谱检测基音的计算。基音的计算。 时域、频域处理方法(103) 各种算法求得的基音周期轨迹与真实的基音周期轨各种算法求得的基音周期轨

33、迹与真实的基音周期轨迹不可能完全吻合。迹不可能完全吻合。 在一些局部段落或区域中有一个或几个基音周期的在一些局部段落或区域中有一个或几个基音周期的估计值偏离了正常的轨迹(通常是偏离到正常值的估计值偏离了正常的轨迹(通常是偏离到正常值的2倍或倍或1/2)。)。 可以采用各种平滑算法,最常用的是中值平滑算法可以采用各种平滑算法,最常用的是中值平滑算法和线性平滑算法。和线性平滑算法。 时域、频域处理方法(104) 3.9 共振峰的估计共振峰的估计 共振峰信息包含在语音频谱包络中,共振峰参数提取共振峰信息包含在语音频谱包络中,共振峰参数提取的关键是估计语音的频谱包络,一般认为谱包络中的的关键是估计语音

34、的频谱包络,一般认为谱包络中的最大值就是共振峰。最大值就是共振峰。 被许多问题所困扰被许多问题所困扰 : 虚假峰值虚假峰值 :为了增加灵活性会给预测器增加二至为了增加灵活性会给预测器增加二至三个额外的极点,可利用这些极点代表虚假峰值;三个额外的极点,可利用这些极点代表虚假峰值; 共振峰合并。共振峰合并。 时域、频域处理方法(105)根据声道滤波器找出共振峰。线性预测共振峰估计通根据声道滤波器找出共振峰。线性预测共振峰估计通常有两种途径可供选择:常有两种途径可供选择:一种途径是利用一种标准的寻找复根的程序计算预测一种途径是利用一种标准的寻找复根的程序计算预测误差滤波器的根,称为求根法;误差滤波器的根,称为求根法;另一种途径是找出由预测器导出的频谱包络中的局部另一种途径是找出由预测器导出的频谱包络中的局部极大值,称为选峰法。极大值,称为选峰法。 基于线性预测的共振峰求取方法:基于线性预测的共振峰求取方法: 时域、频域处理方法(106)这部分全讲这部分全讲完了。完了。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号