基于MATLAB的语音共振峰的估计(共16页)

资源描述

《基于MATLAB的语音共振峰的估计(共16页)》由会员分享，可在线阅读，更多相关《基于MATLAB的语音共振峰的估计(共16页)（16页珍藏版）》请在金锄头文库上搜索。

1、精选优质文档-倾情为你奉上题目：基于MATLAB的语音共振峰的估计英文题目： MATLABBASED ESTIMATES OF FORMANTS 院系：电子工程学院专业：通信工程姓名：年级：二零零六级指导教师：武良丹二零零九年十二月摘要语音是人类相互之间进行交流时使用最多最自然最基本也是最重要的信息载体在高信息化得今天，语音处理的一系列技术及其应用几经成为信息社会部可或缺的最重要组成部分。语音编码算法利用语音信号的冗余信息及某些人耳不敏感的信息，可以在低比特率上获得较高质量的重建语音，压缩编码一直是通信中的关键技术。语音信号研究者们一直在寻求一种在保持语音质

2、量不显著下降的情况下使语音信号的编码比特率最小的方法，特别地，低比特率语音编码体制(比特率在4.8 kbs以下)因其广泛的需求而得到研究者的重视。语音编码器的性能常常用比特率、延时、复杂度和质量4个属性来进行衡量，因此，在分析语音编码器的性能时，主要应该考虑这些属性。值得注意的是，这些属性之间不是孤立的，而是相互紧密联系的，例如，低比特率的编码器一般比高比特率的编码器有更大的延时、更高的算法复杂度和较低的语音质量。因此在对各种编码算法进行取舍时，应根据实际应用环境，在这些属性之间进行权衡。共振峰参数编码算法在低码率的音频编码中应用越来越广泛。与基于时域波形的压缩算法相比，他在传输的过程中只需

3、要传输构造信号所用的基频和共振峰参数，因此可以大大地降低传输的码率，实现低码率下的多媒体通信。而且，基于共振峰参数的算法无须严格限制信号的结构，他可以灵活地描述音频信号的特征。这一灵活性决定了基于共振峰参数的算法，可以满足对音频信号进行方便访问和控制的需要。关键字：共振峰线性预测 ABSTRACTThe human voice to communicate with each other using the most natural and the most fundamental and most important information carriers in high-informa

4、tion that today, a series of voice processing technology and its application several times in the information society available to the Department or the lack of the most important component of the . Speech coding algorithm using speech signals redundant information and some peoples ears are not sens

5、itive information, you can gain at low bit-rate reconstruction of a high-quality voice compression coding has been the communication of key technologies. Speech Signal researchers have been looking for a way to maintain voice quality in asignificant decline in the case of voice signals in the smalle

6、st bit rate coding methods, in particular, the low bit rate speech coding system (bit-rate of 4.8 kb / s or less) because of its wide range of demands to be researchers attention. The performance of speech coding devices often use bit rate, delay, complexity and quality of the four attributes to mea

7、sure, therefore, in analyzing the performance of speech coder, the main consideration should be given these attributes. It is noteworthy that among these attributes are not isolated, but closely interrelated, for example, low bit rate encoder in general than high bit-rate encoder greater delay, high

8、er algorithm complexity and the lower voice quality. Therefore, various coding algorithms to choose should be based on the actual application environment, in the trade-off between these attributes. Formant parameter coding algorithm at low bit-rate audio coding more and more widely applied. Time-dom

9、ain waveform based on the compression algorithm, the process of transmission, he need only transmit the signal structure used for the base frequency and formant parameters, it can greatly reduce the transmission rate, low bit-rate multimedia communication. Moreover, the algorithm based on formant pa

10、rameters do not strictly limit the signal structure, he has the flexibility to describe the audio signal characteristics. This flexibility determines the parameters of formant-based algorithms, to meet the audio signal to facilitate access and control needs. KEY WORDS:第一章语音信号处理基础1.1语音信号处理概述语音编码算法利

11、用语音信号的冗余信息及某些人耳不敏感的信息，可以在低比特率上获得较高质量的重建语音，压缩编码一直是通信中的关键技术。语音信号研究者们一直在寻求一种在保持语音质量不显著下降的情况下使语音信号的编码比特率最小的方法，特别地，低比特率语音编码体制(比特率在4.8 kbs以下)因其广泛的需求而得到研究者的重视。语音编码器的性能常常用比特率、延时、复杂度和质量4个属性来进行衡量，因此，在分析语音编码器的性能时，主要应该考虑这些属性。值得注意的是，这些属性之间不是孤立的，而是相互紧密联系的，例如，低比特率的编码器一般比高比特率的编码器有更大的延时、更高的算法复杂度和较低的语音质量。因此在对各种编码算法进

12、行取舍时，应根据实际应用环境，在这些属性之间进行权衡。共振峰参数编码算法在低码率的音频编码中应用越来越广泛。与基于时域波形的压缩算法相比，他在传输的过程中只需要传输构造信号所用的基频和共振峰参数，因此可以大大地降低传输的码率，实现低码率下的多媒体通信。而且，基于共振峰参数的算法无须严格限制信号的结构，他可以灵活地描述音频信号的特征。这一灵活性决定了基于共振峰参数的算法，可以满足对音频信号进行方便访问和控制的需要。 1.2语音信号处理的发展及应用 1.3语音与常用的语音分析方法 1.3.1语音的基本特性 1.3.2常用语音信号分析方法 1.4 语音共振峰估计的现状第二章语音共振峰估计技术2.1

13、基础知识在语音信号分析技术中,表征语音信号主要特征的是两个最基本的语音参数,即共振峰和基频。通常,共振峰定义为声道脉冲响应的衰减正弦分量,在经典的语音信号模型中,共振峰等效为声道传输函数的复数极点对。对平均长度约为17cm 声道(男性) ,在3kHz 范围内大致包含三个或四个共振峰,而在5kHz 范围内包含四个或五个共振峰。高于5kHz 的语音信号,能量很小。根据语音信号合成的研究表明,表示浊音信号最主要的是前三个共振峰。一个语音信号的共振峰模型,只用前三个时变共振峰频率就可以得到可懂度很好的合成浊音。共振峰信息包含在语音信号的频谱包络中，谱包络的峰值基本上对应与共振峰频率。因此一切共振峰估

14、计都是直接或间接地对频谱包络进行考察，关键是估计语音频谱包络，并认为谱包络中的最大值就是共振峰。与基音提取，共振峰估计也是表面看很容易但实际上又为许多问题所困扰。包括：虚假峰值、共振峰合并、高基音语音。语音信号共振峰估计,在语音信号合成、语音信号自动识别和低比特律语音信号传输等方面都起着重要作用。由于实际的语音是准周期信号和实际上是短时间信号的频率分析，其频谱序列不是周期性冲激函数序列的采样，而是近似三角脉冲的采样，所以其傅里叶变换的幅度谱呈现高频衰减性质。从图3中可以观察到频谱序列的幅度谱是周期信号和高频衰减信号的乘积。实际语音分析过程中各时刻频谱序列的傅里叶变换后衰减幅度差异很大，低频部

15、分有时会出现分支脉冲的幅值大于下一个周期主脉冲的幅值，这对信号周期地分辨产生一定的干扰，而无法准确估计基频值。所以本文在确定基频时利用高频部分衰减幅度差异较小的特点，分析其周期特性并用来计算语音基频。共振峰参数包括共振峰频率、频带宽度和幅值，共振峰信息包含在语音频谱的包络中。因此共振峰参数提取的关键是估计语音频谱包络，并认为谱包络中的最大值就是共振峰。利用语音频谱傅里叶变换相应的低频部分进行逆变换，就可以得到语音频谱的包络曲线。依据频谱包络线各峰值能量的大小确定出第1第4共振峰，如图1所示。图1 （根据频谱包络确定共振峰）2.2语音信号的倒谱分析语音的产生模型实际是一个激励信号与声道冲激响应的卷积。对于浊音，激励信号可以有周期脉冲序列表示；对于清音，激励信号可以有随机噪声序列表示。语音的倒谱是将语音的短时谱取对数后再进行IDFT得到的,所以浊音信号的周期性激励反映在倒谱上是同样周期的冲激。借此,可从倒谱波形中估计出基周期。一般把倒谱波形中第二个冲激,认为即是对应激励源的基频。那如

展开阅读全文