声音和语音编码－金锄头文库

资源描述

《声音和语音编码》由会员分享，可在线阅读，更多相关《声音和语音编码（98页珍藏版）》请在金锄头文库上搜索。

1、第二章第二章声音和语音编码声音和语音编码本章主要内容本章主要内容1.声音概述2.声音的数字化3.电子合成音乐4.语音编码5.脉冲编码调制（PCM）6.PCM应用7.其它编码方法2.1 声音概述声音概述1.声音声音是一种连续的波，具有普通波的一切特性：反射、折射、衍射等。n声音信号是由许多频率不同的信号组成2.声波的分类（按频率频率）n次声波次声波 ( 0 ( 0 20 Hz )20 Hz )n声波声波 (20 (20 20 KHz) 20 KHz) 人类听觉范围人类听觉范围n超声波超声波 ( 20KHz ) ( 20KHz ) 强的方向性强的方向性n n应用：应用：B B超、探测仪、主动声纳

2、超、探测仪、主动声纳2.1 声音概述（续）声音概述（续）3.声音的幅度1. 1.人类能够感知的范围是：人类能够感知的范围是：0 0120dB120dB之间之间2. 2.超出超出120dB120dB人耳可能会感动疼痛人耳可能会感动疼痛1.补充：什么是什么是dB（分贝）数？（分贝）数？什么是dB（分贝）数？n n一种相对量单位，在专业音响设备的调节刻度上经常会遇一种相对量单位，在专业音响设备的调节刻度上经常会遇到，例如增益大小、衰减量、提升量、电平量等。到，例如增益大小、衰减量、提升量、电平量等。n n其定义是：其定义是：dBdB数数=20lgA/B=20lgA/Bn n但在功率级、声强级及能量级

3、中，其定义是：但在功率级、声强级及能量级中，其定义是：dBdB数数=10lgA/B=10lgA/Bn n式中，式中，A A是被比较的绝对量，例如电压、电流等；是被比较的绝对量，例如电压、电流等；B B为比较为比较的标准量。的标准量。n n采用采用dBdB数表示量值的优点是缩小了数值大小，使量值表示数表示量值的优点是缩小了数值大小，使量值表示更简单更具体，使运算简化。同时，对一些变化范围很宽更简单更具体，使运算简化。同时，对一些变化范围很宽的物理量作图表示或刻度与非常方便，一目了然。的物理量作图表示或刻度与非常方便，一目了然。2.1 声音概述（续）声音概述（续）n音宽与频带：频带宽度或称为带宽，

4、它是描述组成复合信号的频率范围。图图2.1 2.1 声音的频带声音的频带2.1.1 音频信号的指标一. 频带宽度：音频信号的频带越宽，所包含的音频信号分量越丰富，音质越好。图图2.2 2.2 声音的频带宽度声音的频带宽度2.1.1 音频信号的指标 (续)二动态范围: 动态范围越大，信号强度的相对变化范围越大，音响效果越好。音质效果音质效果音质效果音质效果 AMAM广播广播广播广播FMFM广播广播广播广播数字电话数字电话数字电话数字电话 CDCDCDCDDA DA DA DA 动态范围动态范围（dBdB） 404060605050100100动态范围20log（信号的最大强度 / 信号的

5、最小强度）单位：（dB）表2.1 声音的动态范围2.1.1 音频信号的指标 (续)三信噪比：信噪比SNR（Signal to Noise Ratio）是有用信号与噪声之比的简称。噪音可分为环境噪音和设备噪音。信噪比越大，声音质量越好本章主要内容本章主要内容1.声音概述2.声音的数字化3.电子合成音乐4.语音编码5.脉冲编码调制（PCM）6.PCM应用7.其它编码方法2.2 声音的数字化声音的数字化1.模拟信号与数字信号2.声音信号的数字化3.采样频率4.采样精度5.声音质量与数据率2.2.1 模拟信号与数字信号模拟信号与数字信号n模拟信号时间上、幅度上均连续的信号。n采样在某一时刻对

6、模拟信号的幅度进行测量，将其时间上时间上离散化n量化将采样得到的信号幅度的取值离散化。如采样得到的幅度为0,255,一种离散化的方法是取值0,1,2,255n采样采样和量化量化后得到的信号就是数字信号2.2.1 模拟信号到数字信号模拟信号到数字信号n为什么要从模拟信号过渡到数字信号？1.以前声音长途传输用电信号来模拟声波，对电以前声音长途传输用电信号来模拟声波，对电信号的处理，采用模拟电气元件，受环境影响信号的处理，采用模拟电气元件，受环境影响很大（温度、电磁场干扰），难以纠错。很大（温度、电磁场干扰），难以纠错。2.采用数字信号，采用数字信号处理器（采用数字信号，采用数字信号处理器（DSP

7、DSP）进行数学运算，受环境影响较小，可以实现容进行数学运算，受环境影响较小，可以实现容错处理。错处理。2.2.1 数字信号处理的优点数字信号处理的优点1.数字信号计算是一种精确的计算方法，不受时间和环境变化的影响；2.用数学运算来实现（模拟）原来的物理部件的功能相对比较容易3.可以通过改变数学运算的方法，实现不同的功能，而不需更换物理部件(DSP)。即只需对DSP编程。2.2.2 声音信号的数字化声音信号的数字化n声音信号的数字化步骤：1. 1.采样采样得到一个个时间上离散的幅度值得到一个个时间上离散的幅度值2. 2.量化量化得到一个个离散的幅度值得到一个个离散的幅度值n连续时间的离散化

8、通过采样，一般采用均均匀采样匀采样(uniform sampling) n连续幅度的离散化通过量化，可采用线性线性量化量化, 或非线性量化非线性量化 2.2.2 声音信号的数字化声音信号的数字化 (图图)图2.3 声音信号的数字化采样和量化采样和量化示例示例n如有一声音信号，对其进行采样和量化。如有一声音信号，对其进行采样和量化。n量化表用量化表用 1 1，2 2，3 3，4 4，5 5，6 6，7 7，8 8 ，四舍五，四舍五入方法。入方法。结果如下表结果如下表2.22.2采样序列采样序列1.531.532.202.20 3.613.614.834.83量化序列量化序列2 22 24 45

9、52.2.22.2.2声音信号的数字化声音信号的数字化n目前应用较为广泛的采样方式:1.奈奎斯特(Nyquist)采样2.正交采样3.带通采样4.Sigma-Delta()采样等2.2.2 声音信号的数字化声音信号的数字化n需要解决的两个问题：1.采样频率采样频率应该是多少？2.量化的精度精度？bps(bit per sample)2.2.3 采样频率采样频率n采样频率是指一秒钟内采样的次数。n奈奎斯特采样定理(Nyquist theory):n如果对某一模拟信号进行采样，则采样后可还如果对某一模拟信号进行采样，则采样后可还原的最高信号频率只有采样频率的一半；原的最高信号频率只有采样频率的一半

10、；n或者说只要采样频率高于输入信号最高频率的或者说只要采样频率高于输入信号最高频率的两倍，就能从采样信号系列重构原始信号。两倍，就能从采样信号系列重构原始信号。 2.2.3 采样频率采样频率奈奎斯特采样定理:nf fs s = 2 f = 2 fmaxmax f fs s为采样频率，为采样频率，f fmaxmax为信号最高频率为信号最高频率n对声音信号而言，对声音信号而言，f fmaxmax为声音信号的最高频率。为声音信号的最高频率。v在实际应用中，为了使前级抗混叠滤波器易于在实际应用中，为了使前级抗混叠滤波器易于实现，提高输入信号的信噪比，一般实现，提高输入信号的信噪比，一般f fs s取取

11、f fmaxmax的的2.52.5倍以上。倍以上。 2.2.3 采样频率采样频率n根据斯特采样定理，CD 激光唱盘采样频率为44KHz，可记录的最高音频为22KHz，这样的音质与原始声音相差无几，也就是我们常说的超级高保真音质。n声音采样的三个标准频率分别为：n44.1KHz44.1KHzn22.05KHz 22.05KHz n11.025KHz11.025KHz。 2.2.3 采样频率采样频率n人耳听觉上限是20KHz，根据奈奎斯特的理论，数码音频的取样频率应当是40 KHz，可可为何定了为何定了44.1 KHz这么一个特殊的标准？这么一个特殊的标准？1.对模拟声音信号进行处理时，对模拟声音

12、信号进行处理时，20KHz20KHz处有比较明处有比较明显的衰减，因此把信号截止频率提高到显的衰减，因此把信号截止频率提高到22 KHz 22 KHz 2.为使交流电纹波的负面影响降到最低，需要取一为使交流电纹波的负面影响降到最低，需要取一个既大于个既大于44 KHz,44 KHz,又为又为50Hz50Hz和和60Hz(60Hz(国际通行的两国际通行的两种交流电频率种交流电频率) )公倍数的数据。公倍数的数据。2.2.4 量化精度量化精度量化位数量化位数n量化位数是对模拟音频信号的幅度轴进行数字化，它决定了模拟信号数字化以后的动态动态范围范围。n由于计算机按字节运算，一般的量化位数为8位和1

13、6位。量化位越高，信号的动态范围越大，数字化后的音频信号就越可能接近原始信号，但所需要的存贮空间也越大。 2.2.4 量化精度量化精度量化位数量化位数n 例如用8位表示一个声音采样的样本，则样本值是0到255之间的256个整数值，此时采样精度就是1/256.n量化精度量化精度、存储空间存储空间、声音质量声音质量、处理处理速度速度之间的矛盾。（理解）2.2.4 量化精度量化精度信噪比表示信噪比表示n信噪比SNR(signal-to-noise ratio)公式： SNR= 10 log(Vsignal)2/(Vnoise)2 = 20 log(Vsignal /Vnoise)n说明：nV V

14、signalsignal表示信号电压表示信号电压nV Vnoisenoise表示噪声电压表示噪声电压nSNRSNR的单位为分贝的单位为分贝(dB)(dB)n如何理解信噪比公式如何理解信噪比公式如何理解信噪比公式如何理解信噪比公式 ( (思考题思考题思考题思考题) )2.2.4 量化精度量化精度信噪比计算信噪比计算n举例：假设Vnoise=1;1.采样精度为1bit时，Vsignal21，此时它的信噪比：2. SNR= 20 log(Vsignal /Vnoise)3. = 20 log( 21 / 1 )4. = 20 log 2 = 20 *0.35. = 6 dB2.2.4 量化精度量化

15、精度信噪比计算信噪比计算n举例：假设Vnoise=1;2.采样精度为8bit时，Vsignal28，此时它的信噪比： SNR= 20 log(Vsignal /Vnoise) = 20 log( 28 / 1 ) = 20* 8 *log 2 = 20 * 8 *0.3 = 48 dB2.2.4 采样精度采样精度（表）（表）表表2-3 2-3 采样位数与信噪比对照表采样位数与信噪比对照表量化位量化位量化位量化位等份等份等份等份信噪比信噪比(dB)(dB)应应应应用用用用 1 12 26 68 82562564848数字电话数字电话161665536655369696CD-DACD-D

16、A2.2.5 声音质量与数据率声音质量与数据率n声道数：有单声道和双声道之分。双声道又称为立体声，在硬件中要占两条线路，音质、音色好，但立体声数字化后所占空间比单声道多一倍。n数据率：为每秒每秒bitbit数，(bps). 数据率是计算机处理时要掌握的基本技术参数。n声音质量与数据率的对应参见教材表2-1 p11本章主要内容本章主要内容1.声音概述2.声音的数字化3.电子合成音乐电子合成音乐4.语音编码5.脉冲编码调制6.PCM应用7.其它编码方法2.3 电子合成音乐电子合成音乐 MIDIn乐器数字接口乐器数字接口MIDIMIDI（Musical Instrument Digital Mus

17、ical Instrument Digital InterfaceInterface），泛指数字音乐的国际标准，它是音乐），泛指数字音乐的国际标准，它是音乐与计算机结合的产物。与计算机结合的产物。nMIDIMIDI不是把音乐的波形进行数字化采样和编码，而不是把音乐的波形进行数字化采样和编码，而是将数字式电子乐器的是将数字式电子乐器的弹奏过程记录下来弹奏过程记录下来弹奏过程记录下来弹奏过程记录下来，如按了，如按了哪一个键、力度多大、时间多长等等。当需要播放哪一个键、力度多大、时间多长等等。当需要播放这首乐曲时，根据记录的乐谱指令，通过音乐合成这首乐曲时，根据记录的乐谱指令，通过音乐合成器生成音乐

18、声波，经放大后由扬声器播出。器生成音乐声波，经放大后由扬声器播出。 2.3.1 MIDI术语术语一、音乐合成器音乐合成器（Musical Synthesizer）：用来产生并修改正弦波形的叠加，然后通过声音产生器和扬声器发出特定的声音。泛音的合成决定声音音质。二、复调声音复调声音：简称为复音（Polyphony），指合成器同时演奏若干音符时发出的声音。它着重于同时演奏的音符数。2.3.1 MIDI术语术语三、多音色（Timbre）：指同时演奏几种不同乐器时发出的声音。它着重于同时演奏的乐器数。四、MIDI标准1、MIDI电子乐器：能产生特定声音的合成器，其数据传送符合MIDI通信约定。2.3.

19、1 MIDI术语术语2、MIDI消息 ( message ) 或指令：乐谱的一种记录格式，相当于乐谱语言。3、MIDI接口（interface）：MIDI硬件通信协议4、MIDI通道 ( channel )：共16个通道，每种通道对应一种逻辑的合成器2.3.1 MIDI术语术语 5、MIDI文件：由控制数据和乐谱信息数据构成6、音序器 ( Sequencer )：用来记录、编辑和播放MIDI文件的软件。2.3.2 2.3.2 计算机上计算机上MIDIMIDI的产生过程的产生过程 nMIDIMIDI电子乐器通过电子乐器通过MIDIMIDI接口与计算机相连。接口与计算机相连。n计算机可通过音序器软

20、件来采集计算机可通过音序器软件来采集MIDIMIDI电子乐器发出电子乐器发出的一系列指令。的一系列指令。n这一系列指令可记录到这一系列指令可记录到MIDIMIDI文件中。文件中。n在计算机上音序器可对在计算机上音序器可对MIDIMIDI文件进行编辑和修改。文件进行编辑和修改。n最后，将最后，将MIDIMIDI指令送往音乐合成器，由合成器将指令送往音乐合成器，由合成器将MIDIMIDI指令符号进行解释并产生波形，然后通过声音指令符号进行解释并产生波形，然后通过声音发生器送往扬声器播放出来。发生器送往扬声器播放出来。2.3.2 2.3.2 计算机上计算机上MIDIMIDI的产生过程的产生过程图图2

21、.4 MIDI的产生过程的产生过程2.3.3 MIDI2.3.3 MIDI合成的产生方式合成的产生方式1 1、频率调制合成频率调制合成频率调制合成频率调制合成( Frequency Modulation )( Frequency Modulation ) 通过硬件产生正弦信号，再经处理合成音乐。合通过硬件产生正弦信号，再经处理合成音乐。合成的方式是将波形组合在一起，理论上可以有无限成的方式是将波形组合在一起，理论上可以有无限多组波形，但实际上做不到。其泛音的合成与模拟多组波形，但实际上做不到。其泛音的合成与模拟比较困难，实际的质量不高。比较困难，实际的质量不高。2 2、波形表（波形表（波形表（

22、波形表（WavetableWavetable）合成）合成）合成）合成其原理是在其原理是在ROMROM中已存储各种实际乐器的声音样中已存储各种实际乐器的声音样本，需要时，调用相应样本来合成该乐器的乐音。本，需要时，调用相应样本来合成该乐器的乐音。ROMROM的容量越大，合成效果越好，价格也越贵。的容量越大，合成效果越好，价格也越贵。 2.3.4 两种音频文件的比较表表2-4 MIDI2-4 MIDI和和WAVEWAVE文件的比较文件的比较MIDIMIDIWAVEWAVE文件内容文件内容 MIDI MIDI指令指令数字音频数据数字音频数据音源音源 MIDI MIDI乐器乐器Mic,Mic,磁带

23、磁带,CD,CD唱唱盘盘, ,音响音响容量容量小小与音质成正比与音质成正比效果效果与声卡质量有关与声卡质量有关与编码指标有关与编码指标有关适用性适用性易编辑易编辑声源受限声源受限数据量很小数据量很小不易编辑不易编辑声源不限声源不限数据量大数据量大本章主要内容本章主要内容1.声音概述2.声音的数字化3.电子合成音乐4.语音编码语音编码 (教材第三章教材第三章)5.脉冲编码调制6.PCM 应用7.其它编码方法2.4 语音编码语音编码实现方法n波形编码波形编码将波形直接变换成数字码流。将波形直接变换成数字码流。n n特特点点：比比特特率率较较高高、解解码码后后质质量量较较高高、延

24、延时时较较小小。可可以分为：以分为：n n时域波形编码，如时域波形编码，如PCMPCM、ADPCMADPCM、 MM等；等；n n频域波形编码，如子带编码（频域波形编码，如子带编码（SBCSBC）、）、自适应变换编码等。自适应变换编码等。n参数编码参数编码从从信信源源信信号号的的某某个个域域中中提提取取特特征征参参数数，并并变变换换成成数字码流。数字码流。n n特特点点：比比特特率率较较低低、解解码码后后质质量量较较低低、延延时时较较大大。如如：各种声码器。各种声码器。线性预测编码线性预测编码(LPC)(LPC)2.4 语音编码语音编码实现方法n混合编码将以上二种方法混合，将以上二种方法混

25、合，l l特特点点：以以较较低低的的比比特特率率获获得得较较高高的的质质量量，延延时时适适中中，复杂。复杂。l l如：如：GSMGSM的语音编码。的语音编码。语音编码历史：数字电话（语音编码历史：数字电话（1）波形编码波形编码 PCMPCM原理（原理（3737年，法年，法Alec ReeresAlec Reeres）1.1.电子管电子管PCMPCM（4646年，年，BellBell实验室）实验室）2.2.晶体管晶体管PCMPCM（6262年，市话扩容，年，市话扩容，64kb/s64kb/s）3.3.单片单片IC PCMIC PCM（7070年代，微波、卫星、光纤）年代，微波、卫星、光纤）

26、增量编码原理（增量编码原理（4646年，法年，法De LoraineDe Loraine）1.1.自适应增量自适应增量 CVSDCVSD（6060年代末，军用，年代末，军用，3232、16kb/s16kb/s） Continuously Variable Slope Delta Modulator Continuously Variable Slope Delta Modulator 连续变化斜率增量调制器连续变化斜率增量调制器其其他他编编码码（7070年年代代，ADPCMADPCM、SubBandSubBand、ATCATC、APCAPC等）等）在在16kb/s16kb/s以以上上得得到

27、到较较好好的的话话音音质质量量。特特点点：话话音音质质量量好好，且且编编码码速率高。速率高。语音编码历史：数字电话（语音编码历史：数字电话（2）参数编码参数编码波形编码通道声码器（波形编码通道声码器（3939年，年，DudlyDudly，二次大战保密电话），二次大战保密电话） LPC LPC声码器（声码器（6767年，年，AtalAtal、SchroederSchroeder）共振峰声码器（共振峰声码器（7171年，年，RabinerRabiner、SchaferSchafer、ElanaganElanagan）波形插值（波形插值（9191年，年，W.B. KleijnW.B. Kl

28、eijn）特点：编码速率低，自然度差。特点：编码速率低，自然度差。混合编码器混合编码器利用线性预测、利用线性预测、VQVQ、A-B-SA-B-S、感觉加权、后滤波等技术。、感觉加权、后滤波等技术。规则脉冲激励线性预测（规则脉冲激励线性预测（RPELP 1985 DeprettereRPELP 1985 Deprettere、KroonKroon）码本激励线性预测（码本激励线性预测（CELP 1985 ManfredCELP 1985 Manfred、SchroederSchroeder、AtalAtal）特点：话音质量高、编码速率低，但算法复杂。特点：话音质量高、编码速率低，但算法复

29、杂。语音编码的优点语音编码的优点提高传输的质量便于处理使用灵活，便于多种媒体（视频、音频、文字、数据）相结合应用易于加密适合大规模集成可靠性高、体积功耗小价格便宜表表表表2.2 2.2 语音编码的应用语音编码的应用语音编码的应用语音编码的应用压缩的必要性压缩的必要性表表2.3 几种类型信号的参数几种类型信号的参数88.125KB/s（一般了解）（一般了解）（一般了解）（一般了解）语音压缩依据1) 1) 冗余度冗余度冗余度冗余度时域样点之间相关（短时、长时）时域样点之间相关（短时、长时）频域谱的非平坦性（谱包络、谱离散）频域谱的非平坦性（谱包络、谱离散）统计特性统计特性2) 2) 人

30、耳听觉特性人耳听觉特性人耳听觉特性人耳听觉特性人耳分辨能力人耳分辨能力人人耳耳对对不不同同频频段段声声音音的的敏敏感感程程度度不不同同，通通常常对对低低频频比对高频更敏感比对高频更敏感人耳对语音信号的相位不敏感人耳对语音信号的相位不敏感人耳掩蔽效应人耳掩蔽效应 Masking Effect Masking Effect （一般了解）（一般了解）（一般了解）（一般了解）语音压缩依据说明：对人耳听不到或感知极不灵敏的声音分量都不妨视为冗余。利用听觉心理特性、感觉加权、量化、去除多余分量、后滤波、。（一般了解）（一般了解）（一般了解）（一般了解）语音编码性能评价（1）1) 编码速率：编码速率：（K

31、bpsKbps、Kb/sKb/s）信号带宽：信号带宽：可懂度、自然度、透明度。可懂度、自然度、透明度。 2003400Hz,507000Hz,1020000HZ 2003400Hz,507000Hz,1020000HZ 采样速率采样速率：8KHz,16KHz,32KHz,44.1/48KHz8KHz,16KHz,32KHz,44.1/48KHz。编码位数编码位数：R R（b/b/样点），总速率样点），总速率I I（kb/skb/s）。）。（一般了解）（一般了解）（一般了解）（一般了解）语音编码性能评价（2）2 2）重建语音质量）重建语音质量n n客观评价：客观评价：信噪比信噪比分段

32、信噪比分段信噪比（一般（一般15dB15dB以上较好，以上较好，20dB20dB以上相当好）以上相当好）n 主观评价主观评价: MOS: MOS分（分（Mean Opinion ScoreMean Opinion Score）n n 51 51分：分： Excellent Excellent、GoodGood、FairFair、PoorPoor、BadBadn n如：如： 4 4分：长途通信质量分：长途通信质量（一般了解）（一般了解）（一般了解）（一般了解）语音编码性能评价（语音编码性能评价（3）3) 3) 编解码延时（编解码延时（msms）公众网（公众网（25ms25ms）回声控制或

33、回声抵消回声控制或回声抵消正常通话秩序正常通话秩序与重建质量关系与重建质量关系4) 4) 算法复杂度算法复杂度硬件、成本硬件、成本浮点、定点浮点、定点 5) 5) 其他其他抗随机误码和突发误码能力抗随机误码和突发误码能力抗丢包和丢抗丢包和丢帧能力帧能力对不同信号编码能力对不同信号编码能力级联或转级联或转接能力接能力（一般了解）（一般了解）（一般了解）（一般了解）本章主要内容本章主要内容1.声音概述2.声音的数字化3.电子合成音乐4.语音编码5.脉冲编码调制6.PCM应用7.其它编码方法2.5 脉冲编码调制脉冲编码调制 PCMn概念：在一定的时间间隔内，连续测量概念：在一定的时间

34、间隔内，连续测量信号的幅度值，并对测量值编码。信号的幅度值，并对测量值编码。n原理原理：（：（见下图）见下图）2.5 脉冲编码调制脉冲编码调制 PCM步骤n三个步骤三个步骤: 1.1.抽抽样样即采样即采样2.2.量量化化测量采样值测量采样值3.3.编编码码对量化值进行处理并记录对量化值进行处理并记录2.5.1 PCM 量化概念量化概念1、定义：将幅度连续变化的信号变成变成幅度离散信号的处理过程称为量化。2、量化器的基本参数 1 1）量化范围）量化范围如如V1V1，V2V2，语音信号为双极性对，语音信号为双极性对称信号，通常量化范围是称信号，通常量化范围是-V-V，+V+V2 2）

35、量化级数）量化级数NN，在，在V1V1，V2V2内分内分NN个段落。个段落。2.5.2 PCM 量化参数量化参数3 3）量化间隔）量化间隔i，也称量阶，量化级，也称量阶，量化级 4 4）量化值）量化值 5 5）编码位数）编码位数n n，二进制编码时，需满足，二进制编码时，需满足 2 2n n N N 6 6）量化方法）量化方法均匀量化：均匀量化：量化间隔相等；量化间隔相等；非均匀量化：量化间隔不相等。非均匀量化：量化间隔不相等。 2.5.3 量化器特性量化器特性 1）量化器特性曲线：量化器的输入和输出之间的关系曲线2）量化器误差特性曲线：量化器的输入与量化误差之间的关系曲线。2.5.3

36、均匀量化器的特性曲线和误差曲线均匀量化器的特性曲线和误差曲线2.5.3 均匀量化的特点及其应用均匀量化的特点及其应用特点： 1）量化信噪比与信号功率成正比 2）编码位数多。应用：用于信号分布范围小且较均匀的场合。如遥测、遥控、仪表等方面。结结论论：在在通通信信系系统统中中，语语音音信信号号不不适适合合采采用均匀量化编码用均匀量化编码改进方法：采用非均匀量化。 2.5.4 非均匀量化非均匀量化非均匀量化基本思想：在对输入信号进行量化时候，大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔。非均匀量化有两种方法： 1. 律压扩 2. A 律压扩2.5.4 压扩压缩与扩展压扩压缩与扩

37、展压缩与扩张的过程如下:1. f(x)压缩器均匀量化编码2. 译码扩张器f(x) 2.5 2.5 律压缩律律压缩律1. 律压缩律律曲线为越大，小信号的压缩律越高。 2.5 2.5 A律压缩律律压缩律2 . A律压缩律 A律压缩曲线为 2.5 分段量化折线压缩律 n 由于连续曲线的压缩律电路实现较为困难，通常用折线折线来近似。n 常用的有A13折线和15折线。 2.5 A13A13折线画法折线画法A13折线画法如下：1） x轴采用对折方式分16份2） y轴均匀分割16份3）将x,y轴对应的坐标点连接起来，得到16段折线。简称为A13折线。n应用：中国，欧洲等 2.5 A13A13折线画法

38、折线画法（图）（图）82条线段2.5 1515折线压缩律折线压缩律 15折线压缩律是在曲线上取坐标点，然后连成折线而得。 2.5 1515折线画法折线画法画法如下：1）x轴坐标点为，非均匀分割16份2）y轴均匀分割16份3）将x,y轴对应的坐标点连接起来，得到16段折线。称为15折线。 n应用：日本，美国，加拿大等。本章主要内容本章主要内容1.声音概述2.声音的数字化3.电子合成音乐4.语音编码5.脉冲编码调制（PCM）6.PCM应用7.其它编码方法2.6 PCM2.6 PCM在通信中的应用在通信中的应用 nPCMPCM编码早期的最重要应用就是编码早期的最重要应用就是话音通信中的多话音

39、通信中的多话音通信中的多话音通信中的多路复用路复用路复用路复用。一般来说，电信网中传输媒体费用约占。一般来说，电信网中传输媒体费用约占总成本的总成本的65%65%，设备费用约占成本的，设备费用约占成本的35%35%，因此提，因此提高线路利用率是一个重要课题高线路利用率是一个重要课题. .n提高线路利用率通常用下面两种方法：提高线路利用率通常用下面两种方法： (1) (1) 频分多路复用频分多路复用FDM (frequency-division multiplexing)FDM (frequency-division multiplexing)(2)(2)时分多路复用时分多路复用TDM (tim

40、e-division multiplexing) TDM (time-division multiplexing) 2.6.12.6.1频分多路复用频分多路复用FDMFDMn把传输信道的频带把传输信道的频带分成分成好几个窄带，每个窄好几个窄带，每个窄带传送一路信号带传送一路信号:n例如，一个信道的频带为例如，一个信道的频带为1400 Hz1400 Hz，把这个信道分，把这个信道分成成4 4个子信道：个子信道：820-990 Hz, 1230-1400 Hz, 1640-820-990 Hz, 1230-1400 Hz, 1640-1810 Hz1810 Hz和和2050-2220 Hz2050

41、-2220 Hz，相邻子信道间相距，相邻子信道间相距240 240 HzHz，用于确保子信道之间不相互干扰。每对用户用于确保子信道之间不相互干扰。每对用户仅占用其中的一个子信道。这是仅占用其中的一个子信道。这是模拟载波通信模拟载波通信模拟载波通信模拟载波通信的的主要手段主要手段。2.6.2 2.6.2 时分多路复用时分多路复用TDMTDMn把传输信道按时间来分割按时间来分割，为每个用户指定一个时间间隔，每个间隔里传输信号的一部分，这样就可以使许多用户同时使用一条传输线路。这是数字通信的主要手段数字通信的主要手段。n例如，话音信号的采样频率例如，话音信号的采样频率f f8000 Hz8000 H

42、z，它的采，它的采样周期样周期125 m s125 m s，这个时间称为，这个时间称为1 1帧帧(frame)(frame)。在。在这个时间里可容纳的话路数有两种规格：这个时间里可容纳的话路数有两种规格：2424路路制和制和30/3230/32路制。路制。24路制的重要参数如下n 每秒钟传送每秒钟传送80008000帧，每帧帧，每帧125 m s125 m s。n 12 12帧组成帧组成1 1复帧复帧( (用于同步用于同步) )。n 每帧由每帧由2424个时间片个时间片( (信道信道) )和和1 1位同步位组成。位同步位组成。n 每个信道每次传送每个信道每次传送8 8位代码，位代码，1 1帧有

43、帧有24 8 24 8 1 1193193位位( (比特比特) )。n 数据传输率数据传输率R R800019380001931544 kbps1544 kbps。n 每一个话路的数据传输率每一个话路的数据传输率80008=64 kbps80008=64 kbps。n 律律参看：教材参看：教材参看：教材参看：教材P32 P32 图图图图 3 3101030路制的重要参数如下n 每秒钟传送每秒钟传送80008000帧，每帧帧，每帧125 m s125 m s。n 16 16帧组成帧组成1 1复帧复帧( (用于同步用于同步) )。n 每帧由每帧由3232个时间片个时间片( (信道信道) )组成。组

44、成。n 每个信道每次传送每个信道每次传送8 8位代码。位代码。n 数据传输率：数据传输率：R R800032880003282048 kbps2048 kbps。n 每一个话路的数据传输率每一个话路的数据传输率80008=64 kbps80008=64 kbps。n A A律律应应用用n 时分多路复用时分多路复用(TDM)(TDM)技术已广泛用在数字电话网中，技术已广泛用在数字电话网中，为反映为反映PCMPCM信号复用的复杂程度，通常用信号复用的复杂程度，通常用“ “群群(group)”(group)”这个术语来表示，也称为数字网络的等级。这个术语来表示，也称为数字网络的等级。n PCM

45、PCM通信方式发展很快，传输容量已由一次群通信方式发展很快，传输容量已由一次群( (基基群群) )的的3030路路( (或或2424路路) )，增加到二次群的，增加到二次群的120120路路( (或或9696路路) )，三次群的，三次群的480480路路( (或或384384路路) )，。本章主要内容本章主要内容1.声音概述2.声音的数字化3.电子合成音乐4.语音编码语音编码 (教材第三章教材第三章)5.脉冲编码调制6.PCM 应用7.其它编码方法 7 .其它编码方法其它编码方法1.DM /ADM2.APCM/DPCM /ADPCM 3.LPC4.RPE-LTP2.7.12.7.1增量调制与自

46、适应增量调制增量调制与自适应增量调制 n 由于由于DMDM编码的简单性，编码的简单性，使它成为数字通信和压使它成为数字通信和压缩存储的一种重要方法缩存储的一种重要方法，它鼓励了很多人对最早，它鼓励了很多人对最早发明的发明的DMDM系统做了大量的改进和提高工作。系统做了大量的改进和提高工作。n 最早的最早的DMDM系统是在系统是在19461946年发明的。年发明的。n 后来的自适应增量调制后来的自适应增量调制ADMADM系统采用十分简单系统采用十分简单的算法就能实现的算法就能实现32 kbps32 kbps至至48 kbps48 kbps的数据率，而且的数据率，而且可提供高质量的重构话音，它的可

47、提供高质量的重构话音，它的MOSMOS评分可达到评分可达到4.34.3分左右。分左右。2.7.12.7.1增量调制增量调制(DM) (DM) n 增量调制也称增量调制也称调制调制DM(delta modulation)DM(delta modulation)，它是，它是一种预测编码技术，是一种预测编码技术，是PCMPCM编码的一种变形。编码的一种变形。n DM DM是对实际的采样信号与预测的采样信号之差是对实际的采样信号与预测的采样信号之差的极性进行编码，将极性变成的极性进行编码，将极性变成“0”“0”和和“1”“1”这两种可这两种可能的取值之一。能的取值之一。n 如果实际的采样信号与预测的采

48、样信号之差的极如果实际的采样信号与预测的采样信号之差的极性为性为“ “正正” ”，则用，则用“1”“1”表示；相反则用表示；相反则用“0”“0”表示，或者表示，或者相反。相反。n 由于由于DMDM编码只须用编码只须用1 1比特对话音信号进行编码，比特对话音信号进行编码，所以所以DMDM编码系统又称为编码系统又称为“1“1比特系统比特系统” ”2.7.12.7.1增量调制增量调制(DM) (DM) （图）（图）2.7.1 2.7.1 自适应增量调制ADM 1.ADM定义：一种自动调节量阶的增量调制。当信号斜率大时，量阶大，当信号斜率小时，量阶小。 ADM具有动态范围大的特点。 2.7.2 2

49、.7.2 差值脉冲编码调制（DPCM）nDPCM：根据前些时刻的样值来预测现时刻的样值，只要传递预测值和实际值之差，而不需每个样值的编码都传。n举例说明DPCM过程： 2.7.2 2.7.2 DPCM 框图2.7.22.7.2差值脉冲编码调制（DPCM）（图）2.7.22.7.2差值脉冲编码调制 (说明)n由于差值序列信息可以代替原始序列中的有效信息，二差值信号的能量远小于原样值，这就可以使量化电平数减小，从而大大地压缩了数码率。在接收端，只要把差值序列叠加在预测序列之上，即可以恢复原始信号。2.7.2 2.7.2 自适应DPCM系统 - ADPCMn由于DPCM系统的输入信号是随机变化的，要

50、使DPCM系统有最好的性能，需采用自适应的方法。n自适应：语音信号的动态范围较大，只有采用自适应系统，才能得到最佳的性能。2.7.2 ADPCM2.7.2 ADPCMnADPCM系统的自适应包含两个方面：n自自适适应应预预测测：预测系数能匹配于语音信号瞬时变化最自适应调整，得到较高的预测增益G的过程。n自自适适应应量量化化：量化器的量化量化间隔能随着信号的瞬时值变化做自适应调整，得到较高的信噪比。2.7.2 ADPCM 2.7.2 ADPCM 框图框图2.7.42.7.4线性预测编码（LPC）n基本原理：1.LPC通过分析话音波形来产生声道激励和转移函数的参数参数。2.对这些参数进行编码编码

51、。3.在接收端在接收端使用这些参数重构话音。2.7.4 2.7.4 LPCLPC的基本原理的基本原理图图语音语音线性预测分析清、浊音判别，基音提取量化与编码解码器语音合成2.7.4 LPC2.7.4 LPC主要缺点主要缺点1）损失了语音的自然度2）抗噪声能力下降3）谱包络的估值可能产生很大的失真。原因：原因：主要是未将编码端的余数（误差）信号发送到接收端。2.7.4 2.7.4 改善方法改善方法n采用较复杂的激励模型代替简单的清/浊音判决模型；n另一种方法是利用一部分余数信息。2.7.5 2.7.5 规则脉冲激励长期预测 LPC编码（RPELTP） nRPELTC-LPC编译码系

52、统框图 :2.7.5 RPE-LTP 2.7.5 RPE-LTP 与与 LPC LPC比较比较nLPC编码器在保证一定可懂度条件下，使编码速率在2.44.8Kb/snRPELTC在编码速率为13Kb/s，有相当好的语音质量。应用：目前应用：目前应用：目前应用：目前GSMGSM采用采用采用采用13Kb/s13Kb/s的的的的RPELTCRPELTC编码方案。编码方案。编码方案。编码方案。n本章介绍的编码算法主要应用于话音编码。对于本章介绍的编码算法主要应用于话音编码。对于本章介绍的编码算法主要应用于话音编码。对于本章介绍的编码算法主要应用于话音编码。对于声音的编码可以应用声音的编码可以应用声音的编码可以应用声音的编码可以应用MPEG AudioMPEG Audio的子带编码的子带编码的子带编码的子带编码（SBCSBC）思考题思考题 (1) (1)1、用自己的语言说出下面3种话音编译码器的基本想法。波形编译码器，波形编译码器，音源编译码器，音源编译码器，混合编译码器混合编译码器2、什么叫做均匀量化？什么叫做非均匀量化？3、什么叫做率压扩？什么叫做A率压扩？思考题思考题 (2) (2)4、自适应脉冲编码调制(APCM)的基本思想是什么？5、差分脉冲编码调制(DPCM)的基本思想是什么？6、自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么？

展开阅读全文

声音和语音编码

最新文档