同态滤波及倒谱分析

上传人:鲁** 文档编号:575597088 上传时间:2024-08-18 格式:PPT 页数:55 大小:1.10MB
返回 下载 相关 举报
同态滤波及倒谱分析_第1页
第1页 / 共55页
同态滤波及倒谱分析_第2页
第2页 / 共55页
同态滤波及倒谱分析_第3页
第3页 / 共55页
同态滤波及倒谱分析_第4页
第4页 / 共55页
同态滤波及倒谱分析_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《同态滤波及倒谱分析》由会员分享,可在线阅读,更多相关《同态滤波及倒谱分析(55页珍藏版)》请在金锄头文库上搜索。

1、第5章 语音的同态滤波及倒谱分析5.1 概述5.2 同态信号处理的基本原理5.3 复倒谱和倒谱5.4 语音信号两个卷积分量复倒谱的性质5.5 避免相位卷绕的算法5.6 语音信号的复倒谱分析实例5.1 概述o在这一章中讨论的同态处理方法是一种非线性方法.它能将两个信号通过乘法合成的信号或通过卷积合成的信号分开.n对于语音信,我们的目的是要从声道冲激响应分量与激励分量的卷积中分开各原始分量n本章主要讨论卷积同态系统,以及它在语音处理中的应用,如基音检测、共振峰分析以及同态声码器等.o一帧语音信号 = 声门激励信号 * 声道冲激响应注意:此处符号*表示卷积运算o语音分析的目的:将激励源与声道冲激响应

2、分开来分别进行研究,它们被广泛用于各种语音编码、合成、识别以及说话人识别 。5.1 概述o“解卷”,即将各卷积分量分开,有时也称作反卷积。o解卷算法分为两大类:n第一类算法是“参数解卷”,包括线性预测分析等。n第二类为“非参数解卷”,同态信号处理是其中最重要的一种。 o对语音信号解卷的好处:1) 可对激励源进行研究,因而可以了解语音段是属于浊音还是清音,及确定浊音的基音频率2) 可对声道冲激响应进行研究,因而可以了解声道特性及共振峰 5.1 概述o分离组合信号所采用的方法:1)分离加性信号常采用线性滤波的方法:2)分离非加性组合(如乘性或卷积性组合)信号,常采用同态滤波技术。o同态信号处理也称

3、为同态滤波,它实现了将卷积关系变换为求和关系的分离处理。n为了分离加性组合信号,常采用线性滤波方法。n为了分离非加性组合(如乘积性或卷积性组合)信号,常采用同态滤波技术。同态滤波是一种非线性滤波,但它服从广义叠加原理。o对语音信号进行同态分析后将得到其倒谱参数,所以同态分析也称为倒谱分析。由于对语音信号分析是以帧为单位进行的,所以得到的是短时倒谱参数。o无论是对于语音通信、语音合成还是语音识别n倒谱参数优点:所含的信息比其他参数多,也就是说语音质量好、识别正确率高;n倒谱参数缺点:是运算量较大。n尽管如此,倒谱分析仍是一种有效的语音信号分析方法。5.1 概述5.1 概述o广义叠加原理o小四边形

4、表示输入矢量之间的运算、小三角形表示输入矢量与标量之间的运算、小圆形表示输出矢量之间的运算、小菱形表示输出矢量与标量之间的运算。o输入矢量之间的运算和输出矢量之间的运算可以为: 加法、乘法或卷积等运算。o输入矢量或输出矢量与标量之间的运算可以为: 乘法、幂或开方等运算5.1 概述o广义叠加原理数学表达:o同态系统的规范形式:5.2 同态信号处理的基本原理o同态信号处理的实质:把非线性问题转化为线性问题来处理。o分类:1)乘积同态处理 2)卷积同态处理图5-1卷积同态系统的模型该系统的输入输出都是卷积性运算。 5.2 同态信号处理的基本原理o卷积同态处理的基本原理:o同态处理理论:任何同态系统都

5、能表示为三个同态系统的级联,即同态系统可分解为:n两个特征系统(它们只取决于信号的组合规则)o第一个系统以若干信号的卷积组合作为其输入,并将它变换成对应输出的相加性组合。o第二个系统是一个普通线性系统,它服从叠加原理。n一个线性系统(它仅取决于处理的要求)。o第三个系统是第一个系统的逆变换,即它将信号的相加性组合反变换为卷积组合。o这种同态系统的重要性在于,可以使这种系统的设计简化为线性系统的设计问题。5.2 同态信号处理的基本原理o卷积特征子系统:图5-2同态系统的组成5.2 同态信号处理的基本原理加性信号的Z变换或逆Z变换仍然是加性信号,因而这种时域信号可以用线性系统处理。5.2 同态信号

6、处理的基本原理 线性系统线性系统 5.2 同态信号处理的基本原理o卷积逆特征子系统:经过线性处理后,若将其恢复为卷积性信号,可以通过逆特征系统,它是特征系统的逆变换。 5.2 同态信号处理的基本原理返回5.3复倒谱和倒谱-两种同态处理方法o复倒谱定义: 是一个时域序列,是x(n)的“复倒频谱”,简称为“复倒谱”,也称作对数复倒谱。o复对数函数的复对数函数的单值性原则单值性原则:(1)它必须是一对一的变换;它必须是一对一的变换;(2)它必须满足广义的叠加原理;它必须满足广义的叠加原理;(3)它必须是有效的它必须是有效的z变换;变换;(4)它必须有唯一的定义(必须选定一个收敛域)。它必须有唯一的定

7、义(必须选定一个收敛域)。1.1.复对数的复对数的多值性问题多值性问题: 并不是一对一的变换并不是一对一的变换5.3 复倒谱和倒谱5.3 复倒谱和倒谱 虽然通过用虽然通过用其主值来取代原值其主值来取代原值的手段的手段来解决复对数中来解决复对数中 不明确的问题是不明确的问题是相当普遍的,但是不能在这里采用此手段,相当普遍的,但是不能在这里采用此手段,因为它通常会使运算不再遵循广义叠加原因为它通常会使运算不再遵循广义叠加原理:理:5.3 复倒谱和倒谱但两个角度之但两个角度之和的主值和的主值通常通常不等于不等于它它们各自相应的们各自相应的主值之和主值之和。5.3 复倒谱和倒谱2. 复对数函数的复对数

8、函数的解析性问题解析性问题: 为了让同态滤波系统成为一个可实现系为了让同态滤波系统成为一个可实现系统,统, 必须是因果、稳定和唯一的,因此必须是因果、稳定和唯一的,因此 的收敛域包含单位圆,且在此收敛域的收敛域包含单位圆,且在此收敛域内内 是是 z的解析函数,即的解析函数,即 必须是关必须是关于于 的连续函数,但的连续函数,但 不是不是 的的连续函数连续函数 。5.3 复倒谱和倒谱5.3 复倒谱和倒谱5.3 复倒谱和倒谱o倒谱(倒频谱/对数倒频谱) :o与复倒谱不同的是,在倒谱情况下一个序列经过正逆两个特征系统变换后,不能还原成自身,因为c(n)中只有幅值信息而无相位信息。尽管如此,但仍可用于

9、语音信号分析中,因为人们的听觉对语音的感知特征主要包含在幅度信息中,相位信息不起主要作用。oc(n)即是即是 中的偶对称分量。是时间序列,因中的偶对称分量。是时间序列,因为它是从频率逆变换得到的。为它是从频率逆变换得到的。o如果c1(n)和c2(n)分别是x1(n)和x2(n)的倒谱,并且x(n)=x1(n)*x2(n);那么x(n)的倒谱为c(n)=c1(n)+c2(n)。o与复倒谱不同的是,在倒谱情况下一个序列经过正逆两个特征系统变换后,不能还原成自身;这是因为在计算倒谱的过程中将序列的相位信息丢失了。5.3 复倒谱和倒谱5.4 语音信号两个卷积分量复倒谱的性质o语音信号可看作是声门激励信

10、号和声道冲激响应的卷积1.声门激励信号的复倒谱:(主要分析浊音激励主要分析浊音激励)5.4 语音信号两个卷积分量复倒谱的性质o其中2)对上式取对数,并将对数部分展开为泰勒级数:5.4 语音信号两个卷积分量复倒谱的性质结论:一个有限长的周期冲激序列,其复倒谱除原点处也是一个周期冲激序列,且周期不变,只是序列变为无限长序列,同时其振幅随k的增大而衰减,且比原序列衰减更快。除原点外,可以采用“高复倒谱窗”从语音信号的频谱中提取浊音激励信号的频谱(对于清音激励,也只损失了0nN-1的一部分的激励信息),从而可使用复倒谱提取基音。5.4 语音信号两个卷积分量复倒谱的性质2. 声道冲激响应序列的复倒谱:若

11、用最严格的零极点模型,则有5.4 语音信号两个卷积分量复倒谱的性质5.4 语音信号两个卷积分量复倒谱的性质5.4 语音信号两个卷积分量复倒谱的性质5.4 语音信号两个卷积分量复倒谱的性质5.4 语音信号两个卷积分量复倒谱的性质语音信号的复倒谱语音信号的复倒谱5.5 避免相位卷绕的算法o相位卷绕:求复倒谱中的取对数运算存在的相位多值性问题,我们称之为相位卷绕。它的不确定性将使复倒谱恢复语音的运算产生错误。o三种避免相位卷绕的方法(非取相位主值的方法)5.5 避免相位卷绕的算法o1.微分法:本质:利用傅里叶变换微分、对数微分特性。o微分特性:x(n)的复倒谱对数谱5.5 避免相位卷绕的算法5.5

12、避免相位卷绕的算法图5-4利用傅里叶变换的微分特性求复倒谱的框图o缺点:会引起严重的频谱混叠o原因:nx(n)频谱中的高频分量比x(n)的多,有效最高频率比x(n)的大,若仍按原取样率分析将引起此现象。5.5 避免相位卷绕的算法2.最小相位信号法:o本质:由最小相位信号序列的复倒谱性质及希尔伯特变换的性质推导而来。o适用范围:是一种好方法,但仅适用于最小相位信号。5.5 避免相位卷绕的算法o原理:5.5 避免相位卷绕的算法5.5 避免相位卷绕的算法图5-5因果序列的分解和恢复5.5 避免相位卷绕的算法图5-6最小相位信号法求复倒谱5.5 避免相位卷绕的算法3.递推法:o适用范围:仅限于最小相位

13、信号。o基本原理:设 x(n)为最小相位序列5.5 避免相位卷绕的算法5.5 避免相位卷绕的算法是一个是一个因果序列因果序列:是一个是一个最小相位序列最小相位序列:5.5 避免相位卷绕的算法这是一个递推公式,求出这是一个递推公式,求出n=0时的值,所有其它值均可求出。但时的值,所有其它值均可求出。但n=0要用其他办法求出要用其他办法求出5.5 避免相位卷绕的算法5.5 避免相位卷绕的算法o缺陷:对某些信号,若初值x(0)过小,则复倒谱在递推计算时将出现发散的情况。5.6 语音信号的复倒谱分析实例o在进行语音倒谱和复倒谱分析之前必须对语音信号进行加窗处理:1.倒谱分析:5.6 语音信号的复倒谱分

14、析实例在x(n)是最小相位序列的情况下,复倒谱与倒谱之间有以下的关系:由于倒谱等于复倒谱的偶对称部分,故有着与复倒谱相同的特性,且为偶函数。5.6 语音信号的复倒谱分析实例 先用窗w(n)选择一个语音段,再计算复倒谱,然后将欲得到的复倒谱分量用一个“复倒谱窗”l(n)分离出来。所得到的窗选复倒谱用逆特征系统进行处理以恢复所需的卷积分量。图5-8语音同态滤波系统的构成5.6 语音信号的复倒谱分析实例2.倒谱分析实例:o图(a)是一段加窗语音的时域波形图,窗长为15 ms,fs10 kHz,因此共包括150个语音样点。这段语音用海明窗加权,基音周期为Np45;o图(b)所示为其对数幅度谱,其谐波分

15、量是由输入信号的周期性所引起的;o图(c)显示出相位主值的不连续性,5.6 语音信号的复倒谱分析实例2.倒谱分析实例:o图(d)所示的避免了卷绕的相位谱就没有不连续性。o图(b)和图(d)合在一起构成图(e)所示复倒谱的傅里叶变换。o图(e)中正负两侧等于基音周期的时间点上出现的尖峰,迅速衰减的低复倒谱域分量表示声道、声门激励以及辐射的组合效应。o图(f)所示为倒谱,它只是对对数幅度谱进行傅里叶反变换(即设相位恒为零)。实际上倒谱也表现出和复倒谱相同的一般性质,这是因为倒谱是复倒谱的偶对称分量。由图(f)可见,倒谱是一个偶函数;这是因为它是一个偶对称分量。5.6 语音信号的复倒谱分析实例图5-

16、9浊音语音用同态滤波分离出声门激励和声道响应的示例(a) 声道的对数幅频特性的估值;(b) 声道相频特性的估值;(c) 声道冲激响应的估值;(d) 声门激励脉冲的估值其中图(a)和图(b)为特征系统中得到的对数幅度谱及相位谱,经过低复倒谱窗l(n)和D*-1 之后的输出波形即声道冲激响应如图(c)所示。图(d)给出了声门激励信号。可以看出,声门激励波形近似于一个冲激串,其幅度随时间的变化关系保持了加权所用的海明窗形状。 5.6 语音信号的复倒谱分析实例o图5-10给出了相同条件下一段加窗清语音的时域波形及其倒谱。o其中图(a)是一个海明窗乘过的清音语音段,图(b)为这段语音的对数幅度谱,图(c

17、)为其倒谱。o可见对数幅度谱的变化没有规律,没有体现出谐波分量,这是因为激励信号是随机的,因而语音的短时道中包含一个随机分量。此时,计算相位没有什么意义。o由图(c)可见,倒谱中没有出现在浊音情况下的那种尖峰,然而低倒谱域部分包含了关于声道冲激响应的信息。由图(c)明显可见倒谱为偶函数。图(d)表明了这一点,它表示对图(c)的倒谱经低倒谱窗加权后得到的声道的对数幅频特性。图5-10清音的同态分析(a)窗选时域波形;(b) 语音的短时对数幅度谱;(c) 倒谱;(d) 声道幅频特性的估值5.6 语音信号的复倒谱分析实例o上面的举例表明:n能够用同态滤波得到某些基本参数的近似表示。o实际上,在大多数语音分析的应用中没有必要对语音波形完全解卷,一般满足于估计如基音周期和共振峰频率等一些基本参数,因而可以从复杂的相位计算中解脱出来。o例如,比较图5-7(f)和图5-10(c)可知,用倒谱可以区分清音和浊音;而且,倒谱中存在着浊音的基音周期。同时,共振峰频率在声道的对数幅频特性中清楚地显现出来。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号