文档详情

语音编码分类及编解码标准资料

今***
实名认证
店铺
DOC
88KB
约23页
文档ID:108315508
语音编码分类及编解码标准资料_第1页
1/23

语音编码分类及编解码标准将音频或视频信号在模拟格式和数字格式之间转换的硬件(编码器/解码器);压缩和解压缩音频或视频数据的硬件或软件(压缩/解压缩);或是编码器/解码器和压缩/解压缩的组合通常,编码解码器能够压缩未压缩的数字数据,以减少内存使用量编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序这里指的变换既包括将信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作编解码器经常用在视频会议和流媒体等应用中,通常主要还是用在广电行业,作前端应用G.711类型:Audio  制定者:ITU-T  所需频宽:64Kbps  特性:算法复杂度小,音质一般  优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)  缺点:占用的带宽较高  应用领域:voip  版税方式:Free  备注:70年代CCITT公布的G.711 64kb/s脉冲编码调制PCMG.721类型:Audio  制定者:ITU-T  所需频宽:32Kbps  特性:相对于PCMA和PCMU,其压缩比较高,可以提供2:1的压缩比。

  优点:压缩比大  缺点:声音质量一般  应用领域:voip  版税方式:Free  备注:子带ADPCM(SB-ADPCM)技术G.721标准是一个代码转换系统它使用ADPCM转换技术,实现64 kb/s A律或μ律PCM速率和32 kb/s速率之间的相互转换G.722类型:Audio  制定者:ITU-T  所需频宽:64Kbps  特性:G722能提供高保真的语音质量  优点:音质好  缺点:带宽要求高  应用领域:voip  版税方式:Free  备注:子带ADPCM(SB-ADPCM)技术G.723(低码率语音编码算法)类型:Audio  制定者:ITU-T  所需频宽:5.3Kbps/6.3Kbps  特性:语音质量接近良,带宽要求低,高效实现,便于多路扩展,可利用C5402片内16kRAM实现53coder达到ITU-TG723要求的语音质量,性能稳定可用于IP语音信源编码或高效语音压缩存储  优点:码率低,带宽要求较小并达到ITU-TG723要求的语音质量,性能稳定  缺点:声音质量一般  应用领域:voip  版税方式:Free  备注:G.723语音编码器是一种用于多媒体通信,编码速率为5.3kbits/s和6.3kbit/s的双码率编码方案。

G.723标准是国际电信联盟(ITU)制定的多媒体通信标准中的一个组成部分,可以应用于IP等系统中其中,5.3kbits/s码率编码器采用多脉冲最大似然量化技术(MP-MLQ),6.3kbits/s码率编码器采用代数码激励线性预测技术G.723.1(双速率语音编码算法)类型:Audio  制定者:ITU-T  所需频宽:5.3Kbps(22.9)  特性:能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的G.723.1采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断  优点:码率低,带宽要求较小并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断  缺点:语音质量一般  应用领域:voip  版税方式:Free  备注:G.723.1算法是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法,其目标应用系统包括H.323、H.324等多媒体通信系统 目前该算法已成为IP系统中的必选算法之一G.728类型:Audio  制定者:ITU-T  所需频宽:16Kbps/8Kbps  特性:用于IP、卫星通信、语音存储等多个领域。

G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析G.728还采用了自适应后置滤波器来提高其性能  优点:后向自适应,采用自适应后置滤波器来提高其性能  缺点:比其它的编码器都复杂  应用领域:voip  版税方式:Free  备注:G.728 16kb/s短延时码本激励线性预测编码(LD-CELP)1996年ITU公布了G.728 8kb/s的CS-ACELP算法,可以用于IP、卫星通信、语音存储等多个领域16 kbps G.728低时延码激励线性预测  G.728是低比特线性预测合成分析编码器(G.729和G.723.1)和后向ADPCM编码器的混合体G.728是LD-CELP编码器,它一次只处理5个样点对于低速率(56~128kbps)的综合业务数字网(ISDN)可视,G.728是一种建议采用的语音编码器由于其后向自适应特性,因此G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析G.728还采用了自适应后置滤波器来提高其性能G.729类型:Audio  制定者:ITU-T  所需频宽:8Kbps  特性:在良好的信道条件下要达到长话质量,在有随机比特误码、发生帧丢失和多次转接等情况下要有很好的稳健性等。

这种语音压缩算法可以应用在很广泛的领域中,包括IP、无线通信、数字卫星系统和数字专用线路  G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术  G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8 kbps  优点:语音质量良,应用领域很广泛,采用了矢量量化、合成分析和感觉加权,提供了对帧丢失和分组丢失的隐藏处理机制  缺点:在处理随机比特错误方面性能不好  应用领域:voip  版税方式:Free  备注:国际电信联盟(ITU-T)于1995年11月正式通过了G.729ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的G.729A类型:Audio  制定者:ITU-T  所需频宽:8Kbps(34.4)  特性:复杂性较G.729低,性能较G.729差。

  优点:语音质量良,降低了计算的复杂度以便于实时实现,提供了对帧丢失和分组丢失的隐藏处理机制  缺点:性能较G.729差  应用领域:voip  版税方式:Free  备注:96年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729AGIPS  类型:Audio  制定者:瑞典Global IP Sound公司  所需频宽:  特性:GIPS技术可根据带宽状况自动调节编码码率,提供低码率高质量的音频GIPS的核心技术(网络自适应算法,丢包补偿算法和回声消除算法)可很好地解决语音延迟与回声问题,带来完美音质,提供比还清晰的语音通话效果  优点:很好地解决语音延迟与回声问题,带来完美音质,提供比还清晰的语音通话效果  缺点: 不是Free  应用领域:voip  版税方式:每年支付一笔使用权费用  备注:GIPS音频技术是由来自瑞典的全球顶尖的语音处理高科技公司--"GLOBAL IPSOUND"提供的专用于互联网的语音压缩引擎系统GIPS技术可根据带宽状况自动调节编码码率,提供低码率高质量的音频GIPS的核心技术(网络自适应算法,丢包补偿算法和回声消除算法)可很好地解决语音延迟与回声问题,带来完美音质,提供比还清晰的语音通话效果。

Apt-X  类型:Audio  制定者:Audio Processing Technology 公司  所需频宽:10Hz to 22.5 kHz,56kbit/s to 576 kbit/s(16 bit 7.5 kHz mono to 24-bit, 22.5kHz stereo)  特性:主要用于专业音频领域,提供高品质的音频其特点是:  ①采用4:1:4的压缩与放大方案;  ②硬件低复杂度;  ③极低的编码延迟;  ④由单芯片实现;  ⑤单声道或立体声编解码;  ⑥只需单设备即可实现22.5kHz的双通道立体声;  ⑦高达48kHz的采样频率;  ⑧容错性好;  ⑨完整的AUTOSYNC™编解码同步方案;  ⑩低功率消耗  优点:高品质的音频,硬件复杂度低,设备要求低  缺点:不是Free  应用领域:voip  版税方式:一次性付费  备注:子带ADPCM(SB-ADPCM)技术NICAM  NICAM(Near Instantaneous Companded Audio Multiplex 准瞬时压扩音频复用)  类型:Audio  制定者:英国BBC广播公司  所需频宽:728Kbps  特性:应用范围及其广泛,可用它进行立体声或双语广播  优点:应用范围及其广泛,信噪比高,动态范围宽、音质同CD相媲美,故名丽音,因此NICAM又称为丽音  缺点:不是Free,频宽要求高  应用领域:voip  版税方式:一次性付费  备注:NICAM也称丽音,它是英文Near-Instantaneously Companded Audio Multiplex的缩写,其含义为准瞬时压扩音频复用,是由英国BBC广播公司开发研究成功的。

  通俗地说NICAM技术实际上就是双声道数字声技术,其应用范围及其广泛,最典型的应用便是电视广播附加双声道数字声技术,利用它进行立体声或双语广播,以充分利用电视频道的频谱资源这是在常规电视广播的基础上无需增加许多投资就可以实现的在进行立体声广播时,它提高了音频的信号质量,使其接近CD的质量而且还可以利用NICAM技术进行高速数据广播及其他数据传输的增殖服务,这在当今的信息化社会中似乎就显得尤为重要了!MPEG-1 audio layer 1  类型:Audio  制定者:MPEG  所需频宽:384kbps(压缩4倍)  特性:编码简单,用于数字盒式录音磁带,2声道,VCD中使用的音频压缩方案就是MPEG-1层Ⅰ  优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加可以达到“完全透明”的声音质量(EBU音质标准)  缺点:频宽要求较高  应用领域:voip  版税方式:Free  备注:MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:  --层1(Layer 1):编码简单,用于数字盒式录音磁带  --层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等  --层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍MUSICAM(MPEG-1 audio layer 2,即MP2)  类型:Audio  制定者:MPEG  所需频宽:25。

下载提示
相似文档
正为您匹配相似的精品文档