基于短时谱的噪声估计和语音增强研究

资源描述

《基于短时谱的噪声估计和语音增强研究》由会员分享，可在线阅读，更多相关《基于短时谱的噪声估计和语音增强研究（30页珍藏版）》请在金锄头文库上搜索。

1、-1-基于短时谱的噪声估计和语音增强研究摘要噪声环境下，许多语音处理系统的性能急剧下降。语音增强作为解决噪声污染的一种行之有效的预处理技术，一直都是语音信号处理领域中的热门课题。其目的就是从带噪语音信号中尽可能地提取纯净的原始语音信号，以提高信噪比和改善语音质量。基于短时谱估计的语音增强方法简单、适用信噪比范围大并且易于实时处理，是目前应用得最为广泛的方法。这种语音增强方法通常采用精确的噪声估计来采集噪声特性，再通过良好的增强算法来得到期望的估计语音。对此，本文立足于应用国内外的最新技术，深入系统地研究了短时谱增强方法中的噪声估计和语音增强这两大技术环节，主要实现的工作如下：（1）介绍语音增强

2、和语音行为检测技术的研究背景、意义、存在的问题。（2）从语音活动检测和连续更新噪声谱两方面入手，深入地探讨了语音增强系统中的噪声估计问题。在此基础上研究了两种行之有效的噪声估计方法：基于统计模型 VAD 的方法与基于最小值约束的快速自适应方法。实验表明，VAD 方法的计算量小，并且易于实现，但是对非平稳噪声跟踪力度不够；而基于最小值约束的方法能及时地跟踪噪声变化，从而获得准确的噪声估计，有效改善增强效果。（3）在短时谱估计的基础上，对谱减法进行了研究。关键词：噪声估计语音活动检测语音增强-2-AbstractSpeech enhancement as a effective preproc

3、essing technology to mitigate noise pollution, in which the speech processing systems sharply slowdown in performance, has been a hot topic. Its purpose is to remove all kinds of interference noise, enhance the SNR, and resume the original speech as purely as possible.Speech enhancement based on sho

4、rt-time spectral estimation is the most popular method which is simple, applicable in a wide range of SNR, and apt to real-time processing. This method obtains the noise property by using accurate noise estimation and gains the expectancy speech in the performance of favorable enhancement algorithm.

5、According to the latest technology at home and abroad, this paper does systematic research on Noise Estimation and Speech Enhancement, which are two major technical issues of short-time spectral enhancement. The main work is listed as follows:1. It introduces the research background, significance an

6、d existed problems of Voice Activity Detection and speech enhancement.2. Starting with VAD and continually updated noise spectrum, it discusses the issue of noise estimation in speech enhancement system. Furthermore, it researches two effective methods to estimate noise. The one is based on statisti

7、cal model VAD; the other one is based on the fast self-adaptive algorithm with constrained minimization. And the experiment shows that the former method whose computation is small is easy to realize, but cant follow up non-stationary noise timely, while the latter is very accurate in non-stationary

8、noise environment, then following-up the changing noise timely, and benefits a lot for the enhancement.3. Based on short-time spectrum estimation, the method of spectral subtraction is discussed.Key Words: Speech Enhancement；Noise Estimation; VAD-3-目录第一章绪论 .11.1 研究背景及意义 .11.2 与本课题有关的国内外研究开发情况 .31.3

9、存在的问题 .41.4 本文的内容安排 .5第二章噪声估计 .62.1 基于语音活动检测的噪声估计 .6一、基于统计模型的 VAD 方法 .8二、基于语音活动检测的噪声估计 .112.2 基于最小值跟踪的噪声估计 .12一、最小值跟踪思想 .12二、基于最小值约束的快速自适应方法 .142.3 实验仿真 .16第三章语音增强 .173.1 短时谱估计 .173.2 谱减法 .18第四章后记 .21参考文献 .22附录： .23-1-第一章绪论语音活动检测和语音增强是语音处理领域很具有挑战性的两个研究热点。近年来，语音活动检测和语音增强得到迅速发展，同时也涌出现许多新的研究方向。本章分

10、别介绍语音活动检测和语音增强的研究背景、意义、存在的主要问题和本文所做的工作及内容安排。1.1 研究背景及意义语音是人类沟通的最基本的手段。人类的各种社会活动和行为也给语音信号研究增加了许多新的问题，同时，语音处理技术的发展时刻改变着人类的日常生活。例如语音编码技术的出现使人们可以在有限的通信带宽资源中聆听到远处的声音，近来，宽带语音编码的发展令我们通信中的话音更加自然，更加容易理解，降低了沟通中产生误解的可能性。对大词汇量连续语音识别难题的突破导致了人们有着新的语音输入方式和人机交互模式。人们可以解放双手直接口述，指示机器进行工作或者理解我们的话语，极大地提高了工作效率。在日常生活中使用的语

11、音处理技术 1如语音编码和语音识别等技术都不可避免地要面对各种背景噪声的干扰。噪声的存在大大降低了这些技术使用的性能或直接导致使用者不可忍受而放弃使用。环境噪声如现场存在的背景谈话声、汽车驾驶仓的机器振动噪音、高速行驶中的汽车引擎声，室内墙壁的反响噪声等，都会对原始语音信号造成污染。背景噪声的存在及其特性对考虑人类语音特性的参数语音处理技术影响尤其严重，破坏了预先假定的参数模型和听觉特性。现有的语音识别系统在无噪声环境下都可以很好地使用，但一在嘈杂的环境场所中使用，其实别性能急剧下降。显然，在噪声的干扰下，识别系统中使用的语音特征之间的区分性被减弱，导致系统识别错误增加。随着移动通信的普及变成

12、现实，移动通信技术带给人们无约-2-束和便利的语音沟通的同时，更是把语音通信带到了一个充满复杂噪声的应用环境。而在吵杂的环境中手提电话的语音编码不可避免会增大编码误差。这是由于语音编码如 CELP(Code Excited Linear Prediction)编码都是基于人类发声模型提出的，完全没有考虑环境噪声的存在。如何消除加性噪声带来的不便?语音增强的出现可以降低或解决噪声的不利影响。语音增强通常用作前端处理模块出现在各种实际应用的语音处理系统中。它通过对含噪语音进行滤波，近似还原纯净语音信号，使得语音处理不直接面对含噪语音信号，增强了语音系统的鲁棒性，而高鲁棒性的语音增强技术可有效地扩大语音处理系统的应用场所。语音通话中往往是一方说话一方听话，在整个通话过程中，两个人同时说话的时段不多，而且在某一方的说话中亦包含大量的停顿。以上因素造成实际传输的有效语音信号的持续时间比通话的时间少得多。有统计表明，以通话的一方来讲，有约 60左右的通话时间段是静音或背景噪声。为了降低通信带宽占用、节省通信设备的存储量和电源消耗、提高运算效率、增强

展开阅读全文

基于短时谱的噪声估计和语音增强研究

最新文档