基于小波变换的语音消噪

资源描述

《基于小波变换的语音消噪》由会员分享，可在线阅读，更多相关《基于小波变换的语音消噪（53页珍藏版）》请在金锄头文库上搜索。

1、毕业论文基于小波变换的语音消噪摘要语音是语言信息的载体是人类交流信息最自然最有效最方便的手段在许多情况下人们所关心的语音信号不可防止地被其他信号所污染影响了人们的听辨小波变换在当今信号处理领域中是一种十分活泼的理论小波阈值消减法是对小波分解系数进行阈值化的降噪技术本文简要介绍了语音增强技术主要针对基于小波变换的阈值去噪方法进行了研究对小波阈值消噪从两个方面进行改良一方面通过对传统小波阈值消噪算法中的软阈值函数和硬阈值函数以及 LBreiman提出的非负死区阈值函数进行分析提出了两种改良的阈值函数另一方面受到谱减法思想的启发提出了新的阈值估计思想经实验证明本文阈值函数和阈值估计的消噪

2、结果保持了信号的边缘特性并且提高了语音信噪比关键词小波消噪阈值估计阈值函数高斯白噪声AbstractSpeech signal is the carrier of the speech information and also is the most nature convenient and shortcut way of intercommunication However in most cases speech signal is disturbed and polluted inevitably so that we cant catch the explicit meanin

3、g of the speech signalWavelet transform theory is one of the modem analysis methods Wavelet threshold de-noising is a de-noising technique based on the threshold of the wavelet coefficients In this paper several approaches of speech enhancement are introduced briefly- Wavelet threshold de-noising is

4、 the main part in this paper Two aspects improvement is presented in this paper In one aspect two new threshold fimction is presented based on the analysis of the traditional soft-thresholdhard-threshold functions and the threshold fimction presented by LBreiman In the another aspect a new idea abou

5、t threshold estimation which is affected by the idea of spectral subtraction is proposed Experiment results demonstrate that this method is effective in aspect of remaining geometrical characteristics of signal and improving the signal-to-noise ratio SNR Key words wavelet de-noising threshold estima

6、tion threshold functionswhite Gaussian noise第一章绪论语音信号处理是信息高速公路多媒体技术办公自动化现代通信及智能系统等新兴领域应用的核心技术之一在高度兴旺的信息社会用数字化的方法进行语音的传送存储识别合成增强等是整个数字化通信网中最重要最根本的组成局部之一同时语言不仅是人类相互间进行沟通最自然和最方便的形式也是人与机器之间进行通信的重要工具它是一种理想的人机通信方式因而可为计算机自动化系统等建立良好的人机交互环境进一步推动计算机和其他智能机器的应用提高社会的信息化和自动化程度语音处理技术其中最重要的包括语音编码语音合成语音识别说话人识

7、别及语音增强它的应用极其广泛包括工业军事交通医学民用等各个领域目前语音处理技术处于蓬勃开展的时期己有大量产品投放市场并且不断有新产品被开发研制具有及其广阔的市场需要和应用前景在语音增强方面小波变换出现以前应用最广泛的是傅立叶变换但是在利用傅立叶变换分析信号时存在着某些缺陷即总是假定信号为周期性信号将待分析信号分解成周期性的正弦信号然后根据分解得到的正弦信号提取待分析信号的频率信息和相位信息为了分析信号的局部特征开展了短时傅立叶变换但是在利用短时傅立叶变换分析信号时由于在时频平面的不同位置处分析单元的形状保持不变既不具有频率降低时视野自动放宽的特点也不具有频率特性品质因数恒定的

8、特点由于语音信号的复杂性以及在某些方面与小波变换的相似性从而使得小波变换在语音信号处理中有着很广泛的应用本文主要对小波变换在语音信号处理中的应用进行了深入的研究11课题的研究背景及意义语音是语言信息的载体是人类交流信息最自然最有效最方便的手段在许多情况下人们所关心的语音信号不可防止地被其他信号所污染即语音总会受到外界环境噪声的干扰这些噪声包括从周围环境传输媒质中引入的噪声电器设备的噪声以及其他说话人干扰等等环境噪声会影响语音质量严重的情况下语音将完全淹没到噪声中无法分辨这些背景噪声对人们得到语言信号中夹带的有效信息产生了很大的干扰会引起有用语音信息的相对失效计算机无法准确地别离

9、出噪声与有用信息因此要让它准确无误地执行所要求执行的操作就必须对语音进行降噪处理研究如何进行语音去噪的科学意义很大它能帮助人们解决很多问题同时它具有广阔的应用前景较好的降噪处理结果有利于语音信号的编码从而也会减少数据的存储量利于在网络中的传送语音增强技术就是从噪声背景中提取增强有用的信号抑制降低噪声干扰的技术语音增强技术在语音识别语音编码等方面很有应用价值比方语音识别系统在实验室环境中可取得相当好的效果但在噪声环境中尤其是在强噪声环境中使用时系统的识别率将受到严重影响低速语音编码同样会受到噪声的影响由于语音生成模型是低速率语音编码的根底当语音受到噪声干扰时提取的模型参数将很不

10、准确重建的语音质量就会急剧恶化此时如果采用语音增强技术进行预处理将有效的改善系统性能语音增强的目的是从带噪语音中提取尽可能纯洁的原始语音由于干扰通常都是随机的因而从带噪语音中提取完全纯洁的语音几乎不可能因此实际语音增强的目标主要有改良语音质量消除背景噪声使听者乐于接受不感到疲倦同时提高语音可懂度方便听者理解但这两个目的往往不能同时实现语音降噪处理的意义非常重大它可以帮助我们解决许多有关听辨的问题但是当今从事语音降噪处理研究的机构和单位并不是很多在国外虽然有一些这方面的产品但是这些产品往往不成熟在实际应用中这些产品并不能有效的降低语音信号中的噪音提高信噪比在国内从事这方面研究的机

11、构己经做成语音降噪产品的单位很少而且在对语音降噪处理过程中并没有用到什么新的数字语音处理技术也没有什么独特的方法未取得较大的突破随着社会生产的开展对于语音信号要求更为精确细致有用信号的提取是一种有效实用的技术具有广泛的应用前景由此可见开展这方面的理论研究并能应用于实际具有重要的现实意义12语音增强的根底知识语音增强不但与信号处理技术有关而且涉及到人的听觉感知和语音学另外噪声来源不同特性也不相同因而很难找出一种适用于各种噪声环境的增强算法对不同噪声必须使用不同的语音增强方法语音增强算法的根底是对语音和噪声特性的了解和分析com号的特点语音是时变的非平稳非遍历的随机过程语音发声是一个时变过

12、程很多因素造成了发声系统的时变性例如声道的面积随着时间和距离改变气流速度随着声门处压力变化而变化等但是在一段时间内10ms-30ms 人的声带和声道形状是相对稳定的可认为其物理特性与频谱特性近似不变因而语音的短时谱具有相对稳定性语音的短时特性是语音信号分析和处理的根底利用这一特性就可以应用平稳随机过程来分析与处理语音信号在语音分析中可以把语音信号分为假设干帧每一帧的语音可以认为是准稳定的语音可以分为周期性的浊音和非周期的清音浊音和清音经常在一个音节中同时出现浊音局部和音质关系密切在时域上呈现出明显的周期性在频域上有共振峰结构而且能量大局部集中在较低频段内是语音中大幅度高能量的局部

13、清音那么没有明显的时域和频域特征类似于白噪声能量较小在强噪声中容易被掩盖但信噪比拟高时能提供较多的信息在语音增强中可以利用浊音的周期性特征采用梳状滤波器提取语音分量或者抑制非语音信号而清音与宽带噪声那么难以区分根据中心极限定理傅里叶展开系数被认为是独立的高斯随机变量均值为零但方差是时变的语音的短时谱幅度的统计特性是时变的只有当分析帧长趋于无穷大时才能近似认为其具有高斯分布这种高斯模型应用于有限帧长时只是一种近似的描述在宽带噪声污染的带噪语音的语音增强中这种假设可作为分析的前提com感知特性人耳的感知特性对语音增强有着重要的作用这是因为语音增强的最终度量是人的主观感受人的听觉系统所具有的功能

14、是复杂的由于人耳对背景噪声有很大的抑制作用所以了解其机制可以在语音增强中减少运算代价实践证明人的主观感受听觉和客观实际语音波形并不完全一致语音增强一般都是作为语音识别过程中的预处理环节其目的是从带噪语音中削减噪声从而提取尽可能纯洁的原始语音或原始语音参数以提高语音质量任何复杂的声音对于人耳的感觉都可以用响度音调和音色三个特征量来描述其中响度是人耳对声音轻重的主观反响它取决于声音的幅度主要是声压的函数但与频率和波形也有关音调是人耳对声音频率的感受音调与声音的频率的关系是频率高的声音听起来感觉它的音调高而频率低的声音听起来感觉它的音调低但音调与声音的频率并不成正比它还与声音的强度及

15、波形有关音色是由于波形和泛音不同而造成的声音属性人根据音色在主观感受上区分具有相同响度和音调的两个声音音色是由混入基音的泛音所决定的每个基音有其固有的频率和不同音强的泛音因而每个声音具有各自不同的音色语音感知问题涉及到生理学心理学声学和语音学等诸多领域这是一个复杂的问题有待进一步研究但目前已有一些结论可以利用人耳对语音信号的幅度谱较为敏感对相位不敏感这一点对语音信号的恢复很有帮助人耳对于声波频率上下的感觉与实际频率的上下并不呈线性关系而近似与该频率的对数成正比人耳具有听觉掩蔽效应即会产生一个声音由于另外一个声音的出现而导致该声音被感知的阈值提高的现象也就是说强声音信号对弱声音信号有抑

16、制作用掩蔽的程度是声音强度与频率的二元函数频率邻近分量的掩蔽比频差大的分量有效共振峰对于语音感知很重要特别是第二共振峰比第一共振峰更为重要因此对语音信号进行一定程度的高通滤波不会对可懂度产生影响人耳除了可以感受声音的强度音调音色和空间方位外还可以在两人以上的讲话环境中分辨出所需的声音这种分辨能力是人体内部语音理解机制具有的一种感知能力人类具有的这种别离语音的能力与人耳的双耳输入效应有关称为鸡尾酒会效应com性噪声的来源很多因此噪声的特性也是多样的根据噪声对语音频谱的干扰方式噪声主要分为加性噪声和乘性噪声当噪声对语音的干扰表现为两者信号在时域进行相加时该噪声被称为加性噪声显然噪声和语音在频域也为相加关系在实际环境中背景噪声可以看作加性噪声加性噪声是对背景噪声一种比较贴切的表述乘性噪声是指噪声和语音在频谱上是相乘的关系在时域那么是卷积

展开阅读全文

基于小波变换的语音消噪

最新文档