Matlab基于倒谱和EMD的语音基音周期的提取

上传人:豆浆 文档编号:16802211 上传时间:2017-11-09 格式:DOC 页数:8 大小:33KB
返回 下载 相关 举报
Matlab基于倒谱和EMD的语音基音周期的提取_第1页
第1页 / 共8页
Matlab基于倒谱和EMD的语音基音周期的提取_第2页
第2页 / 共8页
Matlab基于倒谱和EMD的语音基音周期的提取_第3页
第3页 / 共8页
Matlab基于倒谱和EMD的语音基音周期的提取_第4页
第4页 / 共8页
Matlab基于倒谱和EMD的语音基音周期的提取_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《Matlab基于倒谱和EMD的语音基音周期的提取》由会员分享,可在线阅读,更多相关《Matlab基于倒谱和EMD的语音基音周期的提取(8页珍藏版)》请在金锄头文库上搜索。

1、-范文最新推荐-1 / 8Matlab 基于倒谱和 EMD 的语音基音周期的提取在语音信号处理中,常用的语音特性是基于 Mel 频率的倒谱系数(MFCC)以及一些语音信号的固有特征,如基音周期等。倒谱法可以较好地将语音信号中的激励信号和声道响应分离,并只需要用一些倒谱系数就能较好地描述语言信号的声道响应,在语音信号处理中占有很重要的位置。而倒谱解卷积法受加性噪声影响比较大,抗噪声性能不是很好。针对这一存在问题,利用 EMD 方法在理论上可以应用于任何类型的信号的分解,在处理非平稳及非线性数据上 , 具有非常明显的优势这一优点。本文中提出一种基于倒谱和EMD 的语音基音周期提取的改进算法。并在

2、Matlab中予以实现。关键字:基音周期 倒谱法 EMD8664TitlePitch Period Extraction of Speech Signals basedon Cepstrum and EMDAbstractIn voice signal processing, MFCC and some inherent characteristics of voice signals, such as the frequency of pitch. Cepstrum can be used to separate the excitation signal and channel respo

3、nse, and can represent channel response with only a dozen cepstral coefficients. As a result, it has been a very important role in voice signal processing. While cepstrum deconvolution method is largely influenced by additive noise,and anti-noise performance is not very good.The EMD method can be ap

4、plied to decompose any type of signals,and thus,having a very distinct advantage in handing non-stationary and non-linear data.For this problem,in this paper,an improved algorithm of pitch period extraction of speech signals based on cepstrum and EMD is proposed. Its implementation in MATLAB are des

5、cribed in detail.Key words:pitch periodCepstrumEMD-范文最新推荐-3 / 8目 次1 引言 1 1 引言1.1 背景由于语言是人们在日常生活中的主要交流手段,因此语音信号处理在现代信息社会中占用重要地位。随着语音信号处理技术在实际生活中的应用的不断发展,语音信号处理技术已经被广泛地接受和使用。由于语音比其他形式的交互方具有更多的优势,因此这项技术已经越来越贴近人们的生活。目前,语音信号处理技术处于蓬勃发展时期,不断有新的产品被研制开发,市场需求逐渐增加,具有良好的应用前景。1.2 语音特性的提取语音信号处理虽然包括语音通信,语音合成和语音识别等

6、方面的内容,但其前提和基础是对语言信号进行分析。语音的压缩与恢复是语音信号处理的关键技术。近年来有关这方面的研究不断发展成熟,并形成一系列的标准。在语音信号的各种分析合成系统中,需要提取频谱包络参数,推测音源参数(清浊音的判定以及浊音周期等) 。只有将语音信号分析表示成其本质特性的参数,才有可能利用这些参数进行高效的语音通信,才能建立用于语音合成的语音库,也才能建立用于识别的模板或知识库。汉语是一种声调语言,其声调和音素一样具有区分语义的作用。而声调识别又必须以语音基音周期估计为基础。因此基音周期是汉语语音信号处理及应用中需要的最基本的特征参数之一。自上个世纪 70 年代至今,已经发展出多种基

7、音频率提取方法,目前普遍采用的是自相关函数法、倒谱解卷积法和小波算法。根据所分析的参数不同,语音信号分析可分为时域,频域,倒谱域等方法。-范文最新推荐-5 / 8由于语音信号并不是严格的周期信号,因此自相关法只能得到基音的估计值。而倒谱解卷积法受加性噪声影响比较大,抗噪声性能不是很好。小波算法受大尺度平滑作用和噪声的影响,基音定位容易产生偏差和漏报。 (2) 从语音信号中去除声道的影响,直接取出仅与声带振动有关的声源信息并非易事。而声道共振峰可能强烈改变声门波形的结构,从而严重影响激励信号的谐波结构,会给基音检测造成困难。 (3) 语音信号是准周期的,且共振峰结构和噪声有时会影响波峰和过零率,

8、很难准确定位基音周期的开始和结束。 (4) 区分清音语音和低电平浊音段是导致基音检测困难的另一个重要因素。在许多情况下,清音语音与低电平浊音段之间的过度段是非常细微的,确认它是极其困难的。 (5) 在实际应用中,背景噪声强烈影响基音检测的性能。 (6)基音周期变化范围较大,从低音男声的 80Hz 直到女孩的 500Hz,这也给基音周期的检测带来了一定的困难。另外,浊音信号可能包含有三四十次谐波分量,而基波分量往往不是最强的分量。因为语音的第一共振峰通常在 Hz 范围内,这就是说, 次谐波成分往往比基波分量还强。丰富的谐波成分使语音信号的波形变的很复杂,给基音检测带来困难,经常发生基频估计结果为

9、实际基音频率的二三次倍频或二次分频的情况。2.2 基音周期提取方法目前基音的提取方法大致可以分为三类:(1)波形估计法。直接由语音波形来估计基音周期,分析出波形上的周期峰值。包括并行处理法,数据减少法等。-范文最新推荐-7 / 8(2)相关处理法。这种方法在语音信号处理中广泛使用,这是因为相关处理法抗波形的相位失真能力强,另外它在硬件处理上结构简单。包括波形自相关法,平均幅度差分函数法(AMDF ) ,简化逆滤波法(SIFT)等。(3)变换法。将语音信号变换到频域或倒谱域来估计基音周期,利用同态分析方法将声道的影响消除,得到属于激励部分的信息,进一步求取基音周期,比如倒谱法。虽然倒谱分析算法比

10、较复杂,但基音估计效果较好。 只有当 x(n)是一个因果最小相位序列时 才是一个因果稳定序列。x(n)应满足两个条件。第一,x(n)=x(n)u(n)。第二,X(Z)=Zx(n) 的零极点皆成为 的极点。这样,只有当 X(Z)的零极点皆在单位圆内时才能使 的极点全在单位圆内,这样才能保证 是一个因果稳定序列。只有当 x(n)是一个反因果最大相位序列时, 才是一个反因果稳定序列。它的条件与前一情况正好完全相反。这样,只要 x(n)是因果最小相位序列或反因果最大相位序列,便可以由 c(n)算出 。2.4 倒谱的特点假设所处理的语音信号是一个离散时域中的实序列x(n),由于对语音信号必须进行短时分析,x(n)的非零间隔 , 必然是一个有限间隔,为了便于分析与计算,一般设置 =0, =N-1,这时间隔内共有 N 个样点。此时 x(n)的 Z 变换 X(Z)可以表示为如下形式: Matlab 基于倒谱和 EMD 的语音基音周期的提取 (4):

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号