各种音频编码方式的对比

上传人:hs****ma 文档编号:564905107 上传时间:2023-10-08 格式:DOCX 页数:7 大小:22.35KB
返回 下载 相关 举报
各种音频编码方式的对比_第1页
第1页 / 共7页
各种音频编码方式的对比_第2页
第2页 / 共7页
各种音频编码方式的对比_第3页
第3页 / 共7页
各种音频编码方式的对比_第4页
第4页 / 共7页
各种音频编码方式的对比_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《各种音频编码方式的对比》由会员分享,可在线阅读,更多相关《各种音频编码方式的对比(7页珍藏版)》请在金锄头文库上搜索。

1、各种音频编码方式的对比内容简介:文章介绍了 PCM编码、WMA编码、ADPCM编码、LPC编码、MP3编码、AAC编码、 CELP编码等,包括优缺点对比和主要应用领域。PCM编码(原始数字音频信号流)类型:Audio制定者:ITU-T所需频宽:1411.2 Kbps特性:音源信息完整,但冗余度过大优点:音源信息保存完整,音质好缺点:信息量大,体积大,冗余度过大应用领域:voip版税方式:Free备注:在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏, CD、DVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表 了数字音频中最

2、佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度 的无限接近。要算一个PCM音频流的码率是一件很轻松的事情,采样率值X采样大小值X声道数bps。 一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为 44.1Kx16x2 =1411.2KbpSo我们常见的Audio CD就采用了 PCM编码,一张光盘的容量只能容纳72 分钟的音乐信息。WMA(Wi ndows Media Audio)类型:Audio制定者:微软公司所需频宽:320112kbps (压缩1012倍)特性:当Bitrate小于128K时,WMA几乎在同级

3、别的所有有损编码格式中表现得最出色,但似乎128k是WMA 一个槛,当Bitrate再往上提升时,不会有太多的音质改变。优点:当Bitrate小于128K时,WMA最为出色且编码后得到的音频文件很小。缺点:当Bitrate大于128K时,WMA音质损失过大。WMA标准不开放,由微软掌握。应用领域:voip版税方式:按个收取备注:WMA的全称是Windows Media Audio,它是微软公司推出的与MP3格式齐名的一种新的音频 格式。由于WMA在压缩比和音质方面都超过了 MP3,更是远胜于RA(Real Audio),即使在较低的采 样频率下也能产生较好的音质,再加上WMA有微软的Win d

4、ows Media Player做其强大的后盾,所以 一经推出就赢得一片喝彩。ADPCM(自适应差分PCM)类型:Audio制定者:ITU-T所需频宽:32Kbps特性:ADPCM(adaptive differenee pulse code modulation)综合了 APCM 的自适应特性和 DPCM 系统 的差分特性,是一种性能比较好的波形编码。它的核心想法是: 利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值; 使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。优点:算法复杂度低,压

5、缩比小(CD音质400kbps),编解码延时最短(相对其它技术)缺点:声音质量一般应用领域:voip版税方式:Free备注:ADPCM (ADPCM Adaptive Differential Pulse Code Modulation),是一种针对 16bit (或者更高?) 声音波形数据的一种有损压缩算法,它将声音流中每次采样的16bit数据以4bit存储,所以压缩比1:4而压缩/解压缩算法非常的简单,所以是一种低空间消耗,高质量声音获得的好途径。LPC(Li near Predictive Codi ng,线性预测编码)类型:Audio制定者:所需频宽:2Kbps-4.8Kbps特性:压

6、缩比大,计算量大,音质不高,廉价优点:压缩比大,廉价缺点:计算量大,语音质量不是很好,自然度较低应用领域:voip版税方式:Free备注:参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换 成数字代码进行传输。译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建 语音信号。具体说,参数编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可 能高的准确性,但重建信号的波形同原语音信号的波形可能会有相当大的差别。如:线性预测编码(LPC)及其它各种改进型都属于参数编码。该编码比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低

7、,但 语音质量只能达到中等,特别是自然度较低。CELP(Code Excited Lin ear Prediction 码激励线性预测编码)类型:Audio制定者:欧洲通信标准协会(ETSI)所需频宽:416Kbps的速率特性:改善语音的质量: 对误差信号进行感觉加权,利用人类听觉的掩蔽特性来提高语音的主观质量; 用分数延迟改进基音预测,使浊音的表达更为准确,尤其改善了女性语音的质量; 使用修正的MSPE准则来寻找“最佳”的延迟,使得基音周期延迟的外形更为平滑; 根据长时预测的效率,调整随机激励矢量的大小,提高语音的主观质量; 使用基于信道错误率估计的自适应平滑器,在信道误码率较高的情况下也能

8、合成自然度较高的语结论: CELP算法在低速率编码环境下可以得到令人满意的压缩效果; 使用快速算法,可以有效地降低CELP算法的复杂度,使它完全可以实时地实现; CELP可以成功地对各种不同类型的语音信号进行编码,这种适应性对于真实环境,尤其是背景噪声存在时更为重要。优点:用很低的带宽提供了较清晰的语音缺点:-应用领域:voip版税方式:Free备注:1999年欧洲通信标准协会(ETSI)推出了基于码激励线性预测编码(CELP)的第三代移动通 信语音编码标准自适应多速率语音编码器(AMR),其中最低速率为4.75kb/s,达到通信质量。CELP 码激励线性预测编码是Code Excited L

9、in ear Prediction的缩写。CELP是近10年来最成功的语音编码 算法。CELP语音编码算法用线性预测提取声道参数,用一个包含许多典型的激励矢量的码本作为激励 参数,每次编码时都在这个码本中搜索一个最佳的激励矢量,这个激励矢量的编码值就是这个序列的码 本中的序号。CELP已经被许多语音编码标准所采用,美国联邦标准FS1016就是采用CELP的编码方法,主要用于 高质量的窄带语音保密通信。CELP(Code-Excited Linear Prediction)这是一个简化的LPC算法,以 其低比特率著称(4800-9600Kbps),具有很清晰的语音品质和很高的背景噪音免疫性。CE

10、LP是一种在 中低速率上广泛使用的语音压缩编码方案。MPEG-1 audio layer 1类型:Audio制定者:MPEG所需频宽:384kbps (压缩4倍)特性:编码简单,用于数字盒式录音磁带,2声道,VCD中使用的音频压缩方案就是MPEG-1层I。优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相 应增加。可以达到“完全透明”的声音质量(EBU音质标准)缺点:频宽要求较高应用领域:voip版税方式:Free备注:MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:-层1(Layer 1):编码简单,用于数字盒式录音

11、磁带-层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等-层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍MUSICAM(MPEG-1 audio layer 2,即 MP2) 类型:Audio制定者:MPEG所需频宽:256192kbps (压缩68倍)特性:算法复杂度中等,用于数字音频广播(DAB)和VCD等,2声道,而MUSICAM由于其适当的复 杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到 广泛应用。优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅

12、提高,编码延时相 应增加。可以达到“完全透明”的声音质量(EBU音质标准)缺点:应用领域:voip版税方式:Free备注:同 MPEG-1 audio layer 1MP3(MPEG-1 audio layer 3)类型:Audio制定者:MPEG所需频宽:128112kbps (压缩1012倍)特性:编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍,2声道。MP3是在综 合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度 显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压 及网络广播的宠儿。

13、优点:压缩比高,适合用于互联网上的传播缺点:MP3在128KBitrate及以下时,会出现明显的高频丢失应用领域:voip版税方式:Free备注:同 MPEG-1 audio layer 1MPEG-2 audio layer类型:Audio制定者:MPEG所需频宽:与MPEG-1层1,层2,层3相同特性:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1、层2和层3的结构也相 同,但它能支持5.1声道和7.1声道的环绕立体声。优点:支持5.1声道和7.1声道的环绕立体声缺点:-应用领域:voip版税方式:按个收取备注:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编

14、译码器,层1、层2和层3的结构也相 同,但它能支持5.1声道和7.1声道的环绕立体声。AAC(Advaneed Audio Coding,先进音频编码)类型:Audio制定者:MPEG所需频宽:96-128 kbps特性:AAC可以支持1到48路之间任意数目的音频声道组合、包括15路低频效果声道、配音/多语音 声道,以及15路数据。它可同时传送16套节目,每套节目的音频及数据结构可任意规定。AAC主要可能的应用范围集中在因特网网络传播、数字音频广播,包括卫星直播和数字AM、以及数字 电视及影院系统等方面。AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。具有48个主要 音频通道,16个低

15、频增强通道,16个集成数据流,16个配音,16种编排。优点:支持多种音频声道组合,提供优质的音质缺点:-应用领域:voip版税方式:一次性收费备注:AAC于1997年形成国际标准ISO 13818-7。先进音频编码(Advaneed Audio Coding-AAC) 开发成功,成为继MPEG-2音频标准(ISO/IEC13818-3)之后的新一代音频压缩标准。在MPEG-2制订的早期,本来是想将其音频编码部分保持与MPEG-1兼容的。但后来为了适应演播电 视的要求而将其定义成为一个可以获得更高质量的多声道音频标准。理所当然地,这个标准是不兼容 MPEG-1的,因此被称为MPEG-2AAC。换句话说,从表面上看,要制作和播放AAC,都需要使用与 MP3完全不同的工具。HR类型:Audio制定者:飞利浦所需频宽:8Kbps特性:以增加GSM网络容量为目的,但是会损害语音质量;由于现在网络频率紧缺,一些大的运营商已经 在大城市密集地带开通此方式以增加容量。优点:系统容量大缺点:语音质量差应用领域:GSM版税方式:按个收费备注:HR半速率,是一种GSM语音编码方式。FR类型:Audio制定者:飞利浦

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号