语音信号处理课件-语音编码

资源描述

《语音信号处理课件-语音编码》由会员分享，可在线阅读，更多相关《语音信号处理课件-语音编码（69页珍藏版）》请在金锄头文库上搜索。

1、语音信号的压缩编码,一.压缩编码原因,语音信号的压缩编码是研究如何降低语音信号编码速率的问题。,以语音信号为例，模拟形式下带宽一般不到4KHz，经过调制后，所需传输带宽不会超过8KHz。,但是以8KHz抽样，并且每个样值用8位二进制代码表示时，即采用A率13折线PCM数字语音信号时，信息速率为64Kbit/s。,利用二进制理想基带传输系统传输一路这样的数字语音信号。所占系统的最小频带宽度为32KHz。,频带利用率=传输速率/带宽,二.什么是语音压缩编码？,把数码率低于64Kbit/s的语音编码方法称为语音压缩编码技术,三.语音编码分类,根据编码器的实现机理，分成三大类,波形编码,参数编码,混合

2、编码,1、波形编码,从语音信号的波形出发，对波形的抽样值、预测值、预测误差进行编码，它以重建语音波形为目的，力图使重建波形接近原信号波形。,特点：利用抽样定理，恢复原始信号的波形,优点：适应能力强，重建语音质量好,缺点：编码速率较高,类型： PCM，自适应增量调制（ADM），自适应差分编码调制（ADPCM），自适应预测编码APC,速率通常在16-64kbit/s范围,2.参数编码,提取语音的一些特征信息进行编码，在收端利用这些特征参数合成语音。,优点：编码速率低。,缺点：语音的音质和自然度较差，很难辨别说话人。（有一定的可懂度),类型:LPC线性预测编码,速率通常是在4.8kbit/s以下,

3、3.混合编码,介于波形编码和参数编码的一种编码。即在参数编码的基础上引入了波形编码的一些特征。,波形编码+参数编码,可在4-16kbit/s范围内达到良好的语音质量,类型：子带编码,语音编码技术,普通编译码器的音质与数据率,衡量话音编码器的参数,数据输出速率延迟时间话音质量价格（实现代价）,语音信号的冗余度,幅度非均匀分布样本之间的相关性周期之间的相关性基音之间的相关性静止系数（话音间隙）长期相关性（long term correlation）,t,n,xa(nT),xa(t),2.采样：将时间连续信号变成时间离散信号。采样频率通常为fs8kHz。,Ideal sampling an

4、d real sampling,对离散时间信号进行量化，在每一时刻对xa(nT)独立进行量化，把给定的幅度连续的信号变成为有限多个幅度的集合中某个幅度值的过程。,3. A/D转换,采样,量化,xa(t),xa(nT),x(n),xa1,x1,xk,xak,xak+1,xk+1,xL,xaL,xaL+1,x(n)=Qxa(nT),000,001,010,011,111,110,101,100,/2,量化误差(噪声) e(n)=x(n)- xa(nT) -/2 e(n) /2,（1）假设量化噪声是平稳的白噪声过程，有Ee(n)e(n+m)= （2）假设量化噪声与输入信号不相关，有Ee(n)x(n+

5、m)=0 m为任意值（3）在每个量化间隔上，量化噪声均匀分布，有Pe(e(n)=,1 |e(n)| /2 ,0 其他,量化信噪比,量化噪声的信噪比：SNR=x2/e2 x2语音信号序列的方差， e2噪声序列的方差，用分贝表示，SNR=10log(x2/e2）SNR = signals energy / noises energy,SNR=6.02B+4.7720log(Xmax/x)6.02B7.27Xmax表示其峰值 B为量化的比特数当语音信号的幅度服从拉普拉斯分布时，Xmax4x量化器每增加一个比特，SNR提高约6dB。当B=8,SNR=40dB，满足一般通信系统的要求。当量化噪声的

6、信噪比达到 6070dB，才能保障有高水平通话质量，这时要求量化为 1113bits。一般的音频A/D、D/A转换芯片，量化为12bits。,脉冲编码调制（PCM）,Pulse Code Modulation,PCM的量化方式,均匀量化与非均匀量化,非均匀量化,对小信号采用小的量化间隔，对大信号采用大的量化间隔，这样可以用较少的位数编码。对大信号来说，虽然绝对量化误差较大，但是因为：（1）大信号出现的机会不多，（2）信噪比（相对误差）与小信号是一致的，所以对总的话音质量影响不大。非均匀量化也是一种压缩。,律压扩与A律压扩,m 律(m -Law)压扩(G.711)主要用在北美和日本等地区的数

7、字电话通信中。,x为,x 为输入信号，规格化为1= x =1 m 为确定压缩量的参数，它反映最大量化间隔和最小量化间隔之比，取100 = m = 500。,律压扩与A律压扩,0 = |x| = 1/A,1/A = |x| = 1,A律(A-Law)压扩(G.711)主要用在欧洲和中国大陆等地区的数字电话通信中,对于采样频率为8 kHz，样本精度为13位、14位或者16位的输入信号，使用m 律压扩编码或者使用A律压扩编码，经过PCM编码器之后每个样本的精度为8位，输出的数据率为64 kb/s。这个数据就是CCITT推荐的G.711标准。,自适应差值脉冲编码调制原理（ADPCM）,差值脉冲编码（D

8、PCM）,1.编码思想,提高通信质量,必须,减小量化误差,减小量化级,当抽样值范围确定时,增加编码位数N,增加编码位数可获得大的信噪比,在编码位数固定时，减小抽样值的变化范围，也同样可以提高信噪比,即：若缩小抽样值（被编码信号）的变化范围，就可以在保证信噪比不变的情况下，减小编码的位数。这就是差值编码的中心思想,增量调制(M),增量调制 (delta modulation，DM) 是一种预测编码技术，是对实际的采样信号与预测的采样信号之差的极性进行编码，将极性变成“0”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”，则用“1”表示；相反则用“0”表示。DM

9、编码系统又称为“1位系统”。,二、差值编码模型图,在原来的抽样值中减去某一个值，然后对两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出原始值。,x(n) + d(n) c(n) d(n) x(n）-x(n) x(n)差值编码模型,译码,图中：x(n)是原始样值（n时刻的抽样值） x(n)为减去量 d(n)=x(n)-x(n) 为差值,可以看出：,（1）、d(n)越小，在相同的编码位数时信噪比越大,（2）、收发端必须有相同的减去量x(n),根据前些时刻的样值来预测现时刻的样值，只要传递预测值和实际值之差，而不需要每个样值的编码都传。这种方法就称为DPCM编码。,三、DPCM系统

10、,1、DPCM系统的概念：,举例来说,设以1/Ts的速率对信号S（t）抽样,在时刻前可得到，等一组样值.以前面N个样值作为基础对的预测值是,不同时刻样值的加权系数:,根据相关性情况，可设为常量或变量,2、实现预测的横向滤波器（N阶预测器）,在每个抽样时刻到来时，滤波器输出将会给出下一个样值的预测值。,一般来说，在抽样时刻 t=nTs 时所得的预测值与真正的样值并不相同。,N阶预测器输出：,差值脉冲编码就是对真正的样值与过去的样值为基础得到的估值之间的差值进行量化和编码。,3、DPCM系统模型框图,量化器,预测器,预测器,下张,图中：x(n)为抽样信号的实际值,d(n)=x(n

11、)-x(n),图,x(n)=x(n)+d(n),该系统的量化误差可以表示为：,e(n)=x(n)-x(n),=d(n)+x(n)-x(n)+d(n),=d(n)-d(n),上式表明：系统的传输误差就是差值（）的量化误差,4、DPCM系统的抗噪声性能分析,系统信噪比定义为：,=,=,预测器增益,量化器的量化信噪比,GP1,预测器有增益,加预测器后反而不利,GP ： DPCM系统相对于PCM系统而言的信噪比增益。,量化器产生的信噪比,即非预测的PCM系统的量化信噪比,提高系统信噪比采取的措施,减小,x(n)精确,d(n),d(n)=x(n)-x(n),最佳预测,量化误差,最佳量化,小结,一.压缩编

12、码的原因二.什么是语音压缩编码三.语音编码分类 ADPCM系统 DPCM 一.差值编码思想二.差值编码系统模型图三.DPCM系统 1.概念2.预测器模型图3.DPCM系统模型4.DPCM系统的抗噪声性能分析,自适应差值脉冲编码调制（ADPCM）,1、实质：DPCM+自适应量化和自适应预测,固定预测固定量化,2、定义,能够实现自适应预测功能，或者自适应量化功能或者同时实现两种自适应功能的DPCM系统称为ADPCM系统。,3.设计的目的,ADPCM充分利用了语音波形的统计特征和人耳听觉特性,其设计思路主要瞄准了两个目标:,a: 尽可能去掉语音信号中的冗余信号,b:以有效的方式将可用比特分

13、配给语音信号,对消除冗余后的信号,从自适应角度进行最佳编码,1.1预测的自适应,(1).极点预测器,1.预测器的结构,(用重建信号x(n)进行的预测）,+,量化器,预测器,+,X(n),X(n),d(n),d(n),编码,X(n),P（Z）,X（n）,a:极点预测器的方框图,b:预测器传递函数P(z),N阶预测器公式：,X(n)=,进行Z变换后得：,则预测器的传递函数为：,为预测系数,c:重建滤波器,+,预测器,x(n),x(n),X(n),d(n),H(Z),重建滤波器,=,分析：,=,=,（）一阶最佳线性预测,求最佳预测系数h1,N=1时；,X(n)=,h1x(n-1),则差值信号为：,d

14、(n)=x(n)-h1x(n-1),+,Ed (n)=,2,=Ex(n)- h1x(n-1) ,2,=,2,-,=,2,求使,最小的h1的值,2,令,得最佳预测系数h1opt=p1,当N=1时的最大预测增益为：,b.二阶线性预测（N=2）,d(n)=x(n)-h1x(n-1)-h2x(n-2),令,得最佳h1,h2,大于或者等于零,故二阶预测器总是优于一阶预测器,C：N阶最佳线性预测,求偏微分，并令为零,所以得到一组线性方程,差值信号在预测系数取最佳值时最小,最佳预测增益,2.自适应预测,1)前向自适应预测算法,根据短时间的相关特性R(i),求短时的最佳预测系数,特点:运算量大，延迟时间大，不能用于高速系统。,采用不断修正预测系数hi(n)的方法来减小瞬时平方差Ed(n),使hi(n)逐步的接近hiopt(n).,2）后向序贯自适应预测算法,2,LMS算法（最小均方算法）,梯度系数，它决定了预测系数自适应速率,梯度符号算法,极点预测器,零点预测器,衰减因子(抗误码因子),1.2量化的自适应,1、最佳量化,分层电平为相邻量化电平的中点,量化电平是该量化间隔内经常出现的瞬时电平值,固定量化器+可变增益放大器,2、自适应量化的基本思想,自适应量化的基本思想是使量化器的量化级（阶距）能够随着输入信号d(n)瞬时值得变化作自适应调整，从而使量化误差的均方值最小。,

展开阅读全文