名师归纳总结 精品word资料 - - - - - - - - - - - - - - -细心整理 欢迎下载1. function of prefilter: suppress the component of input signal which exceed fs/,2 prevent aliasing ; suppress Interference caused by 50Hz electricit ;yprefilter is band-pass filter , in general,low and up cut-off frequency are: fH=3400Hz , fL=60 ~100Hz;2. sampling:transform time continuous signal into a time discrete signal气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射, 期间的传输通道称为 声道 ;气流流过声道时如同通过了一个具有某种谐振特性的腔体, 放大某些频率, 在频谱上形成相应位置的峰起,称为 共振峰 ;短时自相关函数 和 长时自相关函数 可以用来描述语音的 幅度特性功率谱密度: 1.语音中不同频谱重量的平均概率可以用 长时平均谱密度 来表示; 2.语音波形高频重量对语音总能量的奉献很小,但是高频重量带有重要的语音信息,平均功率谱约在250-500Hz 处最大,而高于此频率的功率谱约以每倍频程 6~10dB 下降; 3..语音信号的短时频谱并不总是低通特性;辅音有较高的频谱重量,显噪声特性;元音从总体上看是低通的,显示明显的局部特性;语音信号具有很强的 “时变特性 ” 在有些段落中它具有很强的周期性,有些段落中又具有噪声特性,而且周期性语音和噪声语音也在不断变化之中;语音信号是非平稳的,但具有 “准平稳特性 ” 在较短的时间间隔内(一般 20~200ms),可以认为语音信号的特点基本保持不变;数字语音信号处理中,通常实行短时分析技术;元音和辅音的区分 :1.从功能上来讲, 元音往往能自成音节, 辅音一般不能独立地构成音节;2.在物理属性方面,元音基本上由乐音构成,辅音就有肯定的噪音; 3.在听觉上,发元音时,声带振动, 比较洪亮; 发辅音时, 有的声带不振动, 自然不够洪亮, 有的声带即使振动,但由于在声腔中受到某种阻碍,仍是不如元音洪亮; 4.在生理属性方面,主要有三个方面的区分:第一, 发辅音的时候, 发音器官的某一部位形成阻碍,气流在只有克服阻碍才能发 出来; 发元音的时候,气流通过生门使声带发生振动,气流在其通道上不受到阻碍,只受到各种共鸣;其次,发辅音时,由于要克服某种阻碍,气流就比较强;发元音时,因无需克服阻碍,气流就比较弱;打算元音音质的因素 :主要有三个方面的因素,一、舌位的高低,二、舌位的前后,三、嘴唇的圆展;这三个因素的不同组合,便能发出不同的元音在求语音信号频谱时,频率越高, 相应的成分越小; 预加重 的目的是提上升频部分, 使信号的频谱变得平整;以便于频谱分析和声道参数分析; 一般在语音信号数字化后,通过 一个一阶数字滤波器: H〔z〕=1- z-1, 接近 1;为什么取 10- 30ms,由于依据人的发声生理结构变化的连续性, 在此时间段内, 声带、声道、口腔的特性几乎不变,语音信号近似平稳;加窗的作用 :得到连续的语音特点 抑制吉尔伯特效应 抑制频谱泄漏窗口的长度 N: 频率辨论率 f=fs/N ; f 随 N 的增加而削减,频率辨论率得到提高,但时间辨论率降低 〔与窗长成反比 〕;应依据不同的应用场合来挑选窗口的长度 N ,应包含 7 个基音周期,因此可挑选 100~300 点为宜;时域波形 :幅度-时间图;大致得出音节的起始点、清音和浊音以及浊音的基音频率频谱特性: 幅度谱图;得出基音周期、共振峰频率及其位置;语音信号的时域分析 : 短时能量及短时平均幅度分析 〔1.幅度分析的依据: 是基于语音信号幅度随时间变化; 清音段幅度小, 其能量集中于高频段;浊音段幅度较大,其能量集中于低频段;2.短时能量函数和短时平均幅度函数 作用 :〔1〕 区分清 /浊音:〔2〕 在信噪比高的情形下, 第 1 页,共 5 页 - - - - - - - - -名师归纳总结 精品word资料 - - - - - - - - - - - - - - -细心整理 欢迎下载能进行有声 /无声判决 〔3〕大致能定出浊音变为清音的时刻,或反之 〕 短时过零率分析 〔定义:信号跨过横轴的情形;对于连续信号,观看语音时域波形通过横轴的情形;对于离散信号,相邻的采样值具有不同的代数符号,也就是样点转变符号的次数 ;作用 :1.区分清 /浊音:浊音平均过零率低,集中在低频端;清音平均过零率高,集中在高频端; 2.从背景噪声中找出是否有语音,以及语音的起点 ;〕 短时相关分析 短时平均幅度差函数在实际应用中,短时平均过零率简洁受到 A/D 转换是的直流偏移、 50Hz 沟通电源的 干扰以及噪声的影响 .削减这些干扰可以有两种方法: 一种是采纳带通滤波器排除信号中的直流和 50Hz 低频重量;另一种是用过门限率来修改过零率,削减随机噪声的影响;短时自相关函数的定义 :Rn 〔k〕N 1 kxn 〔m〕 xn 〔m k〕 0 k Km 0〔1〕 说明当时域信号为周期信号时,自相关函数也是周期性函数,两者具有同样的周期;(2) Rn〔k〕 为偶函数, Rn〔k〕 = Rn〔- k〕(3) Rn〔0〕 最大, Rn〔0〕 |Rn〔k〕|, Rn〔0〕=En, 对于确定信号, Rn〔0〕 是信号能量;对于随机信号或周期信号, Rn〔0〕 是平均功率;相关函数的作用 : 1.区分清 /浊音 .浊音语音的自相关函数具有肯定的周期性;清音语音的自相关函数不具有周期性, 类似噪声, 有点如语音信号本身; 2.估量浊音语音信号的周期,即估量基音周期;短时平均幅度差函数的意义 :短时自相关函数是语音信号时域分析的重要参量,但由于乘法运算所需要的时间长; 为了防止乘法, 一个简洁的方法就是利用差值, 为此常常采纳另一种与自相关函数有类似作用的参量,短时平均幅度差函数;短时平均幅度差函数和自相关函数的关系是:Fn 〔k 〕2 〔k 〕[ Rn〔0〕R 〔k〕] 0.5〔k〕0.6 ~ 1.0n浊音是一个准周期信号, 在一帧语音内基音周期近似恒定, 因此, 短时平均幅度差函数在浊音语音的基音周期上显现微小值,而在清音语音中没有明显的微小值;语谱图 : 宽带语谱图 窄时窗,时间辨论率高,频率辨论率低 纵条纹窄带语谱图 横条纹 窄时窗,时间辨论率低,频率辨论率高LPC: 供应了猜测功能;供应了声道模型和声道模型的参数估量方法; 基本思想: 语音样本之间存在相关性,一个语音信号的样本可以用过去如干个样本的线性组合来靠近;要想使模型的假定较好的符合语音的实际产生模型主要考虑两个因素: 模型的阶数要与共振峰的个数相吻合;声门脉冲外形和口唇辐射影响的补偿; 考虑了上述两个因素的线性猜测分析, 猜测误差序列近似于白噪声序列, 说明由某一短时信号所得到的线性猜测系数能较 好的描述产生这段语音的声道特性;线性猜测阶数 P 的挑选 : P 的挑选应综合考虑谱估量精度、运算量、储备量;原就:保证有足够的极点来模拟声道的谐振结构 ,每 kHz 一个共振峰,每共振峰需要两个极点,外加几个靠近零点的极点; 体会公式:分析帧长 N 的挑选P fs1000N 小,运算量小; N 大,估量谱的精度高 ;N 可取 2~ 3 个基音周期长度; LPC 谱估量的特点 :在信号能量较大的区域(谱峰值的地方) ,LPC 谱和信号谱很接近;而在谱的谷底相差比较大;倒谱分析:由卷积信号求得参加卷积的各个信号的过程称为 解卷过程 ;解卷算法可以分为两大类:第一类 是第一为线性系统 V〔Z〕 建立一个模型,然后对模型参数依据某种正确准就进行估量, 这种方法称为参数解卷方法; 采纳的模型可以分为全极点模型(AR 模型)和零极点模型( ARMA 模型),假如采纳最小均方误差准就对 AR 模型进行估量,就得到线性猜测编码算法 〔LPC〕 ;其次类 算法称为非模型解卷;同态信号处理完成解卷 第 2 页,共 5 页 - - - - - - - - -名师归纳总结 精品word资料 - - - - - - - - - - - - - - -细心整理 欢迎下载任务就是其中最重要的一种;倒谱分析优缺点: 对语音信号的某一帧同样可以分析出它的短时倒谱参数, 总的说来, 无论对于语音通信、 语音合成或语音识别, 倒谱参数所含的信息比其他参数多, 也就是语音质量好,识别正确率高; 但其缺点是运算量比其他参数大,尽管如此, 倒谱分析方法仍不失为一 种有效的语音信号的分析方法;同态系统 可以分解为两个特点系统 (即特点系统和逆特点系统) (指取决于信号的组合规章)和一个线性系统(仅取决于处理要求)结论: 一个周期冲激的有限长度序列, 其复倒谱也是一个同周期长度的周期冲激序列, 只是其长度变为无限长度、振幅随着 K 值的增加而衰减,衰减速度比原先序列要快,明显,周期冲激序列的倒谱的这些性质对于语音信号的分析是很有用的, 这意味着除了原点之外, 可以用 “高时窗 ”来从语音信号的倒谱中提取浊音鼓励信号的倒谱, 从而使倒谱法提取音调成为 现实;.压缩编码缘由: 语音信号的压缩编码是讨论如何降低语音信号编码速率的问题;把数码率低于 64Kbit/s 的语音编码方法称为 语音压缩编码技术语音编码分类:波形编码 (从语音信号的波形动身,对波形的抽样值、猜测值、猜测误差进行编码, 它以重建语音波形为目的, 力图使重建波形接近原信号波形; 特点:利用抽样定理,复原原始信号的波形 优点: 适应才能强,重建语音质量好 缺点: 编码速率较高 类型:PCM ,自适应增量调制 (ADM ),自适应差分编码调制 (ADPCM ),自适应猜测编码 APC ;速率通常在 16------64kbit/s 范畴),参数编码 (提取语音的一些特点信息进行编码,在收端利用这些特点参数合成语音; 优点: 编码速率低;速率通常是在 4.8kbit/s 以下; 缺点: 语音的音质和自然度较差,很难辨别说话人; (有肯定的可懂度 〕 类型 :LPC 线性猜测编码) , 混合编码 (波形编码 +参数编码;介于波形编码和参数编码的一种编码;即在参数编码的基础上引入了波形编码的一些特点;可在 4----16kbit/s 范畴内达到良好的语音质量; 类型: 子带编码)衡量话音编码器的参数: 数据输出速率,推迟时间,话音质量,价格(实现代价)语音信号的冗余度: 幅度非匀称分布; 样本之间的相关性; 周期之间的相关性; 基音之间的相关性;静止系数(话音间隙) ;长期相关性( long term correlation )对大信号来说,虽然肯定量化误差较大, 但是由于:( 1)大信号显现的机会不多, ( 2)信噪比(相对误差)与小信号是一样的,所以 对总的话音质量影响不大 ;增量调制 〔delta modulation , DM〕 是一种猜测编码技术,是对。