各种音频编码方式的比对.doc

资源描述

《各种音频编码方式的比对.doc》由会员分享，可在线阅读，更多相关《各种音频编码方式的比对.doc（7页珍藏版）》请在金锄头文库上搜索。

1、内容简介：文章介绍了PCM编码、WMA编码、ADPCM编码、LPC编码、MP3编码、AAC编码、CELP编码等，包括优缺点对比和主要应用领域。PCM编码(原始数字音频信号流)类型：Audio制定者：ITU-T所需频宽：1411.2 Kbps特性：音源信息完整，但冗余度过大优点：音源信息保存完整,音质好缺点：信息量大，体积大，冗余度过大应用领域：voip版税方式：Free备注：在计算机应用中，能够达到最高保真水平的就是PCM编码，被广泛用于素材保存及音乐欣赏，CD、DVD以及我们常见的WAV文件中均有应用。因此，PCM约定俗成了无损编码，因为PCM代表了数字音频中最佳的保真水准，并不意味着PCM

2、就能够确保信号绝对保真，PCM也只能做到最大程度的无限接近。要算一个PCM音频流的码率是一件很轻松的事情，采样率值采样大小值声道数bps。一个采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的WAV文件，它的数据速率则为 44.1K162 =1411.2Kbps。我们常见的Audio CD就采用了PCM编码，一张光盘的容量只能容纳72分钟的音乐信息。WMA(Windows Media Audio)类型：Audio制定者：微软公司所需频宽：320112kbps（压缩1012倍）特性：当Bitrate小于128K时，WMA几乎在同级别的所有有损编码格式中表现得最出色，但似乎128k

3、是WMA一个槛，当Bitrate再往上提升时，不会有太多的音质改变。优点：当Bitrate小于128K时，WMA最为出色且编码后得到的音频文件很小。缺点：当Bitrate大于128K时，WMA音质损失过大。WMA标准不开放，由微软掌握。应用领域：voip版税方式：按个收取备注：WMA的全称是Windows Media Audio，它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3，更是远胜于RA(Real Audio)，即使在较低的采样频率下也能产生较好的音质，再加上WMA有微软的Windows Media Player做其强大的后盾，所以一经推出

4、就赢得一片喝彩。ADPCM( 自适应差分PCM)类型：Audio制定者：ITU-T所需频宽：32Kbps特性：ADPCM(adaptive difference pulse code modulation)综合了APCM的自适应特性和DPCM系统的差分特性，是一种性能比较好的波形编码。它的核心想法是：利用自适应的思想改变量化阶的大小，即使用小的量化阶(step-size)去编码小的差值，使用大的量化阶去编码大的差值；使用过去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。优点：算法复杂度低，压缩比小（CD音质400kbps），编解码延时最短（相对其它技术）缺点：声音

5、质量一般应用领域：voip版税方式：Free备注：ADPCM (ADPCM Adaptive Differential Pulse Code Modulation), 是一种针对16bit (或者更高?) 声音波形数据的一种有损压缩算法, 它将声音流中每次采样的 16bit 数据以 4bit 存储, 所以压缩比 1:4而压缩/解压缩算法非常的简单, 所以是一种低空间消耗,高质量声音获得的好途径。LPC(Linear Predictive Coding，线性预测编码)类型：Audio制定者：所需频宽：2Kbps-4.8Kbps特性：压缩比大，计算量大，音质不高，廉价优点：压缩比大,廉价缺点：计算

6、量大，语音质量不是很好，自然度较低应用领域：voip版税方式：Free备注：参数编码又称为声源编码，是将信源信号在频率域或其它正交变换域提取特征参数，并将其变换成数字代码进行传输。译码为其反过程，将收到的数字序列经变换恢复特征参量，再根据特征参量重建语音信号。具体说，参数编码是通过对语音信号特征参数的提取和编码，力图使重建语音信号具有尽可能高的准确性，但重建信号的波形同原语音信号的波形可能会有相当大的差别。如：线性预测编码（LPC）及其它各种改进型都属于参数编码。该编码比特率可压缩到2Kbit/s-4.8Kbit/s，甚至更低，但语音质量只能达到中等，特别是自然度较低。CELP(Code Ex

7、cited Linear Prediction码激励线性预测编码)类型：Audio制定者：欧洲通信标准协会（ETSI）所需频宽：416Kbps的速率特性：改善语音的质量：对误差信号进行感觉加权，利用人类听觉的掩蔽特性来提高语音的主观质量；用分数延迟改进基音预测，使浊音的表达更为准确，尤其改善了女性语音的质量；使用修正的MSPE准则来寻找 “最佳”的延迟，使得基音周期延迟的外形更为平滑；根据长时预测的效率，调整随机激励矢量的大小，提高语音的主观质量；使用基于信道错误率估计的自适应平滑器，在信道误码率较高的情况下也能合成自然度较高的语音。结论： CELP算法在低速率编码环境下可以得到令人满意

8、的压缩效果；使用快速算法，可以有效地降低CELP算法的复杂度，使它完全可以实时地实现；CELP可以成功地对各种不同类型的语音信号进行编码，这种适应性对于真实环境，尤其是背景噪声存在时更为重要。优点：用很低的带宽提供了较清晰的语音缺点：-应用领域：voip版税方式：Free备注：1999年欧洲通信标准协会（ETSI）推出了基于码激励线性预测编码（CELP）的第三代移动通信语音编码标准自适应多速率语音编码器（AMR），其中最低速率为4.75kb/s，达到通信质量。CELP码激励线性预测编码是Code Excited Linear Prediction的缩写。CELP是近10年来最成功的语音编码算法

9、。CELP语音编码算法用线性预测提取声道参数，用一个包含许多典型的激励矢量的码本作为激励参数，每次编码时都在这个码本中搜索一个最佳的激励矢量，这个激励矢量的编码值就是这个序列的码本中的序号。CELP已经被许多语音编码标准所采用，美国联邦标准FS1016就是采用CELP的编码方法，主要用于高质量的窄带语音保密通信。CELP(Code-Excited Linear Prediction) 这是一个简化的 LPC 算法，以其低比特率著称(4800-9600Kbps)，具有很清晰的语音品质和很高的背景噪音免疫性。CELP是一种在中低速率上广泛使用的语音压缩编码方案。MPEG-1 audio layer

10、 1类型：Audio制定者：MPEG所需频宽：384kbps（压缩4倍）特性：编码简单，用于数字盒式录音磁带，2声道，VCD中使用的音频压缩方案就是MPEG-1层。优点：压缩方式相对时域压缩技术而言要复杂得多，同时编码效率、声音质量也大幅提高，编码延时相应增加。可以达到“完全透明”的声音质量（EBU音质标准）缺点：频宽要求较高应用领域：voip版税方式：Free备注：MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准，它分为三个层次：-层1(Layer 1)：编码简单，用于数字盒式录音磁带-层2(Layer 2)：算法复杂度中等，用于数字音频广播(DAB)和VCD等-层3(La

11、yer 3)：编码复杂，用于互联网上的高质量声音的传输，如MP3音乐压缩10倍MUSICAM(MPEG-1 audio layer 2,即MP2)类型：Audio制定者：MPEG所需频宽：256192kbps（压缩68倍）特性：算法复杂度中等，用于数字音频广播(DAB)和VCD等，2声道，而MUSICAM由于其适当的复杂程度和优秀的声音质量，在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。优点：压缩方式相对时域压缩技术而言要复杂得多，同时编码效率、声音质量也大幅提高，编码延时相应增加。可以达到“完全透明”的声音质量（EBU音质标准）缺点：应用领域：voip版税方式

12、：Free备注：同MPEG-1 audio layer 1MP3(MPEG-1 audio layer 3)类型：Audio制定者：MPEG所需频宽：128112kbps（压缩1012倍）特性：编码复杂，用于互联网上的高质量声音的传输，如MP3音乐压缩10倍，2声道。MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术，在当时的技术条件下，MP3的复杂度显得相对较高，编码不利于实时，但由于MP3在低码率条件下高水准的声音质量，使得它成为软解压及网络广播的宠儿。优点：压缩比高，适合用于互联网上的传播缺点：MP3在128KBitrate及以下时，会出现明显的高频丢失应用领域：v

13、oip版税方式：Free备注：同MPEG-1 audio layer 1MPEG-2 audio layer类型：Audio制定者：MPEG所需频宽：与MPEG-1层1，层2，层3相同特性：MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器，层1、层2和层3的结构也相同，但它能支持5.1声道和7.1声道的环绕立体声。优点：支持5.1声道和7.1声道的环绕立体声缺点：-应用领域：voip版税方式：按个收取备注：MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器，层1、层2和层3的结构也相同，但它能支持5.1声道和7.1声道的环绕立体声。AAC(Advanced Audio

14、 Coding ，先进音频编码)类型：Audio制定者：MPEG所需频宽：96-128 kbps特性：AAC可以支持1到48路之间任意数目的音频声道组合、包括15路低频效果声道、配音/多语音声道，以及15路数据。它可同时传送16套节目，每套节目的音频及数据结构可任意规定。AAC主要可能的应用范围集中在因特网网络传播、数字音频广播，包括卫星直播和数字AM、以及数字电视及影院系统等方面。AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。具有48个主要音频通道，16 个低频增强通道，16 个集成数据流, 16 个配音，16 种编排。优点：支持多种音频声道组合，提供优质的音质缺点：-应用领域：v

15、oip版税方式：一次性收费备注：AAC于1997年形成国际标准ISO 13818-7。先进音频编码（Advanced Audio Coding-AAC）开发成功，成为继MPEG-2音频标准（ISO/IEC13818-3）之后的新一代音频压缩标准。在MPEG-2制订的早期，本来是想将其音频编码部分保持与MPEG-1兼容的。但后来为了适应演播电视的要求而将其定义成为一个可以获得更高质量的多声道音频标准。理所当然地，这个标准是不兼容MPEG-1的，因此被称为MPEG-2AAC。换句话说，从表面上看，要制作和播放AAC，都需要使用与MP3完全不同的工具。HR类型：Audio制定者：飞利浦所需频宽：8Kbps特性：以增加GSM网络容量为目的,但是会损害语音质量;由于现在网络频率紧缺,一些大的运营商已经在大城市密集地带开通此方式以增加容量。优点：系统容量大缺点：语音质量差应用领域：GSM版税方式：按个收费备注：HR半速率,是一种GSM语音编码方式。FR类型：Audio制定者：飞利浦所需频宽：13Kbps特性：是一般的GSM手机的通信编码方式,可以获得达到4.1左

展开阅读全文