第四章小波变换.doc

上传人:枫** 文档编号:561790297 上传时间:2022-09-08 格式:DOC 页数:18 大小:1.54MB
返回 下载 相关 举报
第四章小波变换.doc_第1页
第1页 / 共18页
第四章小波变换.doc_第2页
第2页 / 共18页
第四章小波变换.doc_第3页
第3页 / 共18页
第四章小波变换.doc_第4页
第4页 / 共18页
第四章小波变换.doc_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《第四章小波变换.doc》由会员分享,可在线阅读,更多相关《第四章小波变换.doc(18页珍藏版)》请在金锄头文库上搜索。

1、.语音增强算法研究p584.1小波理论4.1.1小波变换的定义4.1. 2小波去噪原理.4.2小波包变换语音增强方法4.2.1 小波包变换语音增强方法原理4 2. 2 Bark尺度小波包分解4.2.3闽值函数4.2.4 实验仿真4.3小波包变换和听觉掩蔽效应的语音增强方法4.3. 1小波包变换和听觉掩蔽效应的语音增强方法原理4.3. 2实验仿真第四章 小波包语音增强算法 小波(Wavelets)分析的起源可以追溯到20世纪初,在20世纪80年代后期开始形成一个新兴的数学分支。小波变换是调和分析这一数学领域半个世纪以来的工作结晶,是傅里叶变换发展史上的里程碑式的进展,近些年来成为国外众多学者共同

2、关注的热点。它在傅里叶变换的基础上发展而来,但又有极大不同。传统的信号处理方法是建立在傅立叶变换的基础上,而傅立叶分析使用的是一种全局的变换,要么完全在时域,要么完全在频域,因此无法表达信号的时频局域性质,而这种性质恰恰是非平稳信号(如语音信号)最根本和最关键的性质。小波分析是建立在泛函分析、傅立叶分析、样条分析及调和分析基础上的新的分析处理工具它又称为多分辨分析,在时域和频域同时具有良好配局部化特性,常被誉为信号分析的“数学显微镜”。小波变换在时频两域都具有表征信号局部特征的能力,它克服了短时傅立叶变换固定分辨率的缺点,在信号的高频部分,可以获得较好的时间分辨率,在信号的低频部分可以获得较高

3、的频率分辨率,这就使指小波变换具有对信号的自适应性。它能有效地从信号中提取信息,通过伸缩和平移等运算功能对信号进行多尺度细化分析。小波分析是目前国际上公认的信号信息获取与处班领域的高新技术,是信号处理的前沿课题,其中小波去噪也是小波分析的主要应用之一,对语音增强的研究不可避免的要利用小波这一有效工具。 小波包变换理论是20世纪80年代中后期逐渐成熟并发展起来的,由于可同时进行时域和频域分析,具有时频局部化和变分辨特征,而且小波函数的选取也很灵活,因此在语音增强中得到了广泛的应用。这就使得小波包变换在信号处理方面有许多独到的优点,特别适用于像信号处理,图象处理,量子场论,地震探测,话音识别与增强

4、,雷达,机器视觉以及数字电视等科技领域31-354.1小波理论4.1.1小波变换的定义其中,为给定的一个基本函数,式中a,b均为常数,且a0。给定平方可积的信号x(t , ,则的小波变换(wavelet transform,WT)定义为:式中,a,b和t均是连续变量。因此此式又称为连续小波变换(CWT)。信号的小波变换 (a,b)是a和b的函数,b是时移,a是尺度因子。又称为基本小波,或母小波。是母小波经移位和伸缩所产生的一组函数,称之为小波基函数,或简称小波基。母小波可以是实函数,也可以是复函数。若是实信号,也是实信号,则也是实函数,反之,为复函数。在(5-l)式中,时移b的作用是确定对分析

5、的时间位置,也即时间中心。尺度因子a的作用是把基本小波作伸缩。由变成,当a1时,a越大,则的时域支撑范围(即时域宽度)较之变得越大;反之,当a1时,a越小,则的宽度越窄。这样,a和b联合起来确定了对分析的中心位置及分析的时间宽度。这样,(5-2)式的小波变换可以理解为用一组分析宽度不断变化的基函数对作分析,这一变化正好适应了对信号分析时在不同频率范围需要不同的分辨率这一基本要求。(5-2)式中的因子是为了保证在不同的尺度a时,始终能和母函数有蓍相同的能量,即:令,则dt=adt,这样,上式右边的积分即等于。令的傅里叶变换为 , 的傅里叶变换为,由傅里叶变换的性质:的傅里叶变换为:由Parsev

6、al定理,(5-2)式可重新表达为:此式即为小波变换的频域表达式36。5.1.2小波去噪原理假设观察信号式中,是纯净语音信号,是噪声序列。假定是零均值且服从高斯分布的随机序列,对(5-5)式两边做小波变换,根据小波变换的性质,有:即两个信号和的小波变换等于各个信号小波变换的和。再令u (t)是零均值、独立同分布的平稳随机信号,记。显然:是的协方差矩阵。令是小波变换矩阵,对于正交小波变换,它是正交阵。分别令x和s是对应s(t)和u(t)的向量,向量X, S和U分别是x(t) , s(t)和u(t)的小波变换,即:由于X =S+U。令P是U的协方差矩阵,由于:所以:因为W是正交阵,且。 由此,可得

7、到一个重要的结论:平稳白噪声的正交小波变换仍然是平稳的白噪声。由此结论可知,对于加法性噪声模型,经正交小波变换后,最大程度地去除了的相关性,其能量将集中在少数的小波系数上,这些系数即是信号经小波变换后在各个尺度下的模极大值。但是,噪声经正交小波变换后仍然是白噪声,因此,其小波系数仍然是不相关的,它们将分布在各个尺度下的所有时间轴上。这一结论即为抑制噪声提供了理论依据,即在小波变换的各个尺度下保留那些模极大值点,而将其他点置零,或是最大程度地减小,然后利用处理后的小波系数做小波反变换,即可达到抑制噪声的目的。5.2小波包变换语音增强方法5.2.1小波包变换语音增强方法原理 在小波变换中,由于多分

8、辨分析只是对低频部分作进一步分解,高频部分则不再分解。小波包分析能将频带进行多层次划分,对多分辨分析没有细分的高频部分进一步分解,并能够根据被分析信号的特征,自适应地选择相应频带,使之与信号频谱相匹配,从而提高了时一频分辨率37。假设带噪语音信号可以表示为:其中,是含有噪声的语音信号,是没有叠加噪声的语音信号,是方差为的高斯白噪声。 对信号进行N层离散小波包分解,得到一组小波包分解系数,由两部分组成:一部分是对应的小波包系数,记为,另一部分是对应的小波包系数,记为对于每一个小波包分解系数,选择一个当的阈值,并对系数进行阈值量化,得出估计小波系数,使得尽量小。5.2.2 Bark尺度小波包分解B

9、arkhausen等学者依据人耳的掩蔽效应的实验结果,提出了频率群的概念。即将基底膜分解为许多的小段,每一小段称为一个频率群。在20-16000Hz范围内共有24个频率群。同一频率群的声音在大脑中是叠加在一起进行评价的,具有一致的心理声学特征。按频率由低到高,将频率群顺序编号,将编号定义为32新的频率单位Bark。若记Bark域的频率变量为z,赫兹(Hertz)域频率变量为,则有: Bark域的频率描述充分反映了人耳的听觉特性,因此在语音处理方面得到了大量应用。根据小波包的函数空间正交剖分理论,可以构造与人耳Bark域频率描述相似的小波包分解结构,称之为“Bark尺度小波包分解”。常规方法是模

10、拟人耳的24个频率群,对于8kHz采样的语音信号,选取1至17个频率群,得到的每个子带的中心频率相差1Bark。试验证实,如果对Bark域进行进一步分解,使每个子带的中心频率相差减至,对语音的描述会更加细致,也不会导致较大的计算量。因此,本论文采用的小波包分解树结构如图5-1所示,共68个子频带38-41。5.2.3阈值函数 在小波阈值去噪理论中42-44,阈值函数的选取和阈值的确定是两个最基本的问题。目前存在的阈值函数主要是硬阈值函数和软阈值函数。但由于硬阈值函数整体不连续,直接导致了会在去噪后的信号中出现突变的震荡点,当噪声水平较高时,这种现象尤为明显。软阈值函数虽然整体连续性好,但是由于

11、当小波系数较大时,处理过的系数与原系数之间总存在恒定的偏差,这将直接影响重构信号与真实信号的逼近程度,给重构信号带来不可避免的误差。考虑到软、硬阈值函数存在的缺陷,人们提出了各种基于这两种基本阈值函数的改进的阈值函数。 小波阈值在去噪过程中起到了决定性的作用。如果太小,那么,施加阈值以后的小波系数中将包含过多的噪声分量,达不到去噪的目的;反之,如果太大,那么将去除一部分信号的分量,从而使由小波系数重将后的信号产生过大的失真。因此,在实际工作中,估计阈值的大小尤为关键。常用的估计阀值的阀值函数为硬阈值函数45和软阈值函数46: 但是,由于硬阈值函数整体不连续,直接导致了会在去噪后的信号中出现突变

12、的震荡点,当噪声水平较高时尤为明显。软阈值函数虽然整体连续性好,但是由于当小波系数较大时,处理过的系数与原系数之间总存在恒定的偏差,这将直接影响重构信号与真实信号的逼近程度。文献36提出了一种改进的阀值函数能够有效减少失真,其阀值函数:一种改进的阀值函数公式为:小波包变换语音增强方法原理图:小波包变换的语音增强算法的具体步骤为:步骤1:对带噪语音分帧。步骤2:采用5阶Daubechies小波进行Bark尺度小波包分解,得到每一级的小波包分解系数。步骤3:用小波系数在各尺度下绝对值的中值估算噪声方差。步骤4:利用通用阀值计算每一级的节点阀值,并对该节点的小波包分解系数进行采用公式(5-15)的处

13、理,更新小波包系数。步骤5:进行小波包重建,重叠相加恢复原始数据帧长度的增强语音。5.2.4实验仿真用MATLAB对Bark尺度小波包变换语音增强方法进行实验仿真:1. 实验所用数据:语音取自863语音库,噪声为NOISEX. 92数据库的高斯白噪声和火车噪声,语音信号的采样率为8kHz,帧长K为256个采样点,帧叠为50%。2.仿真所选标准:波形图,语谱图。3.仿真结果如下:5.3小波包变换和听觉掩蔽效应的语音增强方法5.3.1小波包变换和听觉掩蔽效应的语音增强方法原理 小波包变换理论是20世纪80年代中后期逐渐成熟并发展起来的,由于可同时进行时域和频域分析,具有时频局部化和变分辨特征,而且

14、小波函数的选取也很灵活,因此在语音增强中得到了广泛的应用。但是,增强后不可避免地伴有一定程度的音乐噪声,影响了增强效果。掩蔽效应通过模拟人耳的感知,能够掩蔽同时进入听觉系统的较小噪声信号。优点是可以有效地抑制音乐噪声,缺点是性能受限于对背景噪声功率谱估计的准确性,且计算量较大,运行速度较慢。为了抑制音乐噪声和提高运算速度,本文提出一种基于小波包变换和听觉掩蔽效应的语音增强算法,同时具备了小波包变换和掩蔽效应两种方法的优点。仿真结果表明,该算法在信噪比和听觉舒适度上都取得了较好的效果。小波包变换和听觉掩蔽效应的语音增强方法原理图:感知滤波器的作用是在信号频谱失真最小的情况下使残差噪声的频谱能量小

15、于掩蔽阈值。感知滤波器应满足:其中,为背景噪声功率谱密度,为噪声掩蔽阈值。的具体形式为:基于小波包变换和听觉掩蔽效应的语音增强算法的步骤为:步骤1:对带噪语音信号用小波包分解的方法进行去噪处理,得到增强后的语音信号,并进行分帧得到。步骤2:用Johnston掩蔽模型计算掩蔽阀值T。步骤3:使增强语音和掩蔽阀值T经过感知滤波器进行滤波,得到步骤4:经过帧重叠相加得到增强语音。5.3.2实验仿真 用MATLAB对小波包变换和听觉掩蔽效应的语音增强方法进行实验仿真:1.实验所用数据: 语音取自863语音库,噪声为NOISEX. 92数据库的高斯白噪声和火车噪声,语音信号的采样率为8kHz,帧长K为256个采样点,帧叠为50%。2.仿真所选标准:波形图,语谱图,信噪比,PESQ值,坂仓距离。3.仿真结果如下: 首先,在纯净语音中加入5dB高斯白噪声作为带噪语音,采用基于小波包变换和听觉掩蔽效应的语音增强算法(本文算法),比较传统的小波包变换增强算法,增强后仿真结果如下:4.结果分析 图5-6和图5-7分别为

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号