音频编解码知识培训资料【课件】

上传人:桔**** 文档编号:577808704 上传时间:2024-08-22 格式:PPT 页数:21 大小:653.53KB
返回 下载 相关 举报
音频编解码知识培训资料【课件】_第1页
第1页 / 共21页
音频编解码知识培训资料【课件】_第2页
第2页 / 共21页
音频编解码知识培训资料【课件】_第3页
第3页 / 共21页
音频编解码知识培训资料【课件】_第4页
第4页 / 共21页
音频编解码知识培训资料【课件】_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《音频编解码知识培训资料【课件】》由会员分享,可在线阅读,更多相关《音频编解码知识培训资料【课件】(21页珍藏版)》请在金锄头文库上搜索。

1、音频编解码知识培训资料音频编解码知识培训资料 定制人员定制人员: :徐超徐超目录目录概述概述性能指标性能指标实现方法实现方法本司产品所涉音频编解码介绍及使用说明本司产品所涉音频编解码介绍及使用说明总结总结概述概述音频编码(压缩)技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码 。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。 直接采用PCM码流进行存储和传输存在非常大的冗余度。事实上,在无损的条件下对声音至少可进行4:1压缩,即只用

2、25的数字量保留所有的信息 .性能指标性能指标速率:高速率、中速率、低速率 压缩比质量:客观评价 主观评价延时:质量和延时的关系 不同业务对延时的要求复杂性:算法的复杂性及软硬件实现的复杂性 实现方法实现方法波形编码将波形直接变换成数字码流。特点:比特率较高、解码后质量较高、延时较小。可以分为:时域波形编码,如PCM、ADPCM等;频域波形编码,如:子带编码(SBC)。参数编码从信源信号的某个域中提取特征参数,并变换成数字码流。特点:比特率较低、解码后质量较低、延时较大。如:各种声码器。混合编码将以上二种方法混合,特点:以较低的比特率获得较高的质量,延时适中,复杂。如:G723.1,G728,

3、G729语音编码等。 音频编解码介绍与使用说明音频编解码介绍与使用说明 我们公司产品中所涉及的音频编解码器有: G.711G.722G.723.1G.728G.729G.7221.CMP3AAC-LC及AAC-LDG.719 下面分别予以介绍. G.711G.7111.简介简介 G.711是ITU-T制定的一个语音压缩标准. 输入PCM码流为采样率为8000Hz,压缩处理后输出64kbps的码流. 把每个16位PCM样本数据压缩为 8位, 压缩率为2:1. G.711 标准下有两种压缩算法。一种是-law,主要运用于北美和日本;另一种是A-law,主要运用于世界上其他地区。2.使用说明使用说明

4、n输入码流属性: 采样率为8000Hz, 位宽为16比特的单声道PCM码流.n每帧处理的帧长: 240个样本(时长为30ms)n压缩比: 2:1n码率: 64Kbps G.722G.7221.简介简介 ITU G.722 于 1988 年标准化,是第一个用于 16 KHZ 采样率的标准化宽带语音编码算法。该编解码器将 8 KHz 的频带分为两个子频带,并用 ADPCM 算法在子频带中进行编码。输入PCM码流为采样率为16000Hz, 是一种支持三种比特率64, 56和48kbps的多码率语音编码算法。2.使用说明使用说明n输入码流属性: 采样率为16000Hz, 位宽为16比特的单声道PCM码

5、流.n每帧处理的帧长: 576个样本(时长为36ms)n压缩比: 4:1n码率: 64Kbps G.723.1G.723.11.简介简介 G.723.1是ITU-T制定的一个语音压缩标准. 输入PCM码流为采样率为8000Hz, 支持两种编码比特率5.3和6.3kbps。算法复杂度较高, 音频质量比较低.但是压缩率较高, 可达到1:24。2.使用说明使用说明n输入码流属性: 采样率为8000Hz, 位宽为16比特的单声道PCM码流.n每帧处理的帧长: 240个样本(时长为30ms)n压缩比: 1:20(码率为6.3kbps), 1:24(码率为5.3kbps)n我司产品中当前已很少使用. G.

6、728G.7281.简介简介1992年9月, CCITT(ITU一个永久性机构组织:国际电报电话咨询委员会)发布了语音编解码标准.这个语音编码草案是由AT&T提交给CCITT的.G.728是一种低延时语音压缩标准, 输入PCM码流为采样率为8000Hz, 压缩比为1:8,并且有0.625 ms 的编码算法延时。2.使用说明使用说明n输入码流属性: 采样率为8000Hz, 位宽为16比特的单声道PCM码流.n每帧处理的帧长: 80个样本(时长为10ms)n压缩比: 8:1n码率为: 16Kbps G.729G.7291.简介简介G.729协议在1996年3月通过的8Kbps的语音编解码协议。输入

7、PCM码流采样率为8000Hz, 压缩比为1:16。G.729编解码器具有很高的语音质量和很低的延时。2.使用说明使用说明n输入码流属性: 采样率为8000Hz, 位宽为16比特的单声道PCM码流.n每帧处理的帧长: 80个样本(时长为10ms)n压缩比: 16:1n码率为: 8Kbps G.7221.CG.7221.C1.简介简介 G.722.1.C是一个高质量低复杂度、带宽为14khz的宽带音频编码器算法, 输入PCM码流采样率为32000Hz, 传输码流比特率有24Kbps、 32Kbps和48Kbps三种。2.使用说明使用说明n输入码流属性: 采样率为32000Hz, 位宽为16比特的

8、单声道PCM码流.n每帧处理的帧长: 640个样本(时长为20ms)n压缩比: 约21:1(码率为24Kbps), 16:1(码率为32bps), 11:1(码率为48Kbps)n码率为有三种: 24Kbps、 32Kbps和48Kbps(说明:我司一般采用的码率为: 24Kbps) MP3(1)MP3(1)1.简介简介 在1991年, MP3由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer3,所以人们把它简称为MP3。 MPEG-1 Layer 3允许使用

9、的码率是32、40、48、56、64、80、96、112、128、160、192、224、256和320 Kbps,允许的采样频率是32、44.1和48kHz。44.1kHz是最为经常使用的速度(与CD的采样速率相同)。MPEG-2包括其它一些位速:6、12、24、32、40、48、56、64、80、96、112、128、144、160kbit/s。 MP3(2)MP3(2)2.使用说明使用说明说明说明:下面几点说明仅针对我们公司的下面几点说明仅针对我们公司的mp3库。库。n输入码流属性: 采样率为32000Hz, 位宽为16比特的双声道PCM码流.(说明: 实际上我们的mp3编码是一种伪双声

10、道编码, 即编解码内部是单声道编解码,编码前处理先把双声道处理成单声道;在解码器中, 解码后处理把解出的一个声道复制到另一个声道)n每帧处理的帧长: 2304个样本(时长为36ms)n压缩比: 约20 : 1n码率: 5055Kbps AAC-LCAAC-LC及及AAC-LD(1)AAC-LD(1)1.简介简介 AAC(Advanced Audio Coding),中文称为“高级音频编码”,出现于1997年,基于 MPEG-2的音频编码技术。由Fraunhofer IIS、杜比实验室、AT&T、Sony(索尼)等公司共同开发,目的是取代MP3格式。2000年,MPEG-4标准出现后,AAC 重

11、新集成了其特性,加入了PNS技术和LTP技术,为了区别于传统的 MPEG-2 AAC 又称为 MPEG-4 AAC。 AAC有多种编解码方案,参见表1. AAC-LCAAC-LC及及AAC-LD(2)AAC-LD(2) 文件方案MPEG2 AAC LC低复杂度(简单TNS,无预测和增益控制)Low ComplexityMPEG2 AAC Main主方案(除增益控制之外)MPEG2 AAC SSR可变取样率Scalable Sampling RateMPEG4 AAC LC低复杂度(PNS)MPEG4 AAC Main主方案(PNS)MPEG4 AAC SSR可变取样率Scalable Samp

12、ling RateMPEG4 AAC LTP长时预测规格(PNS + LTP)Long Term PredictionMPEG4 AAC LD低延迟规格Low DelayMPEG4 AAC HE高效率规格(SBR(V1) + PS(V2)High Efficiency表表1AAC的所有编解码方案的所有编解码方案AAC-LCAAC-LC及及AAC-LDAAC-LD2.AAC使用说明使用说明说明说明:表表2列表列表说明仅针对我们公司的说明仅针对我们公司的AAC-LC及及AAC-LD库。库。表2 AAC-LC及AAC-LD使用说明表 项目项目标准标准采样率采样率(Hz)位宽位宽(bit)单声道单声道

13、/双声道双声道每帧输入每帧输入样本数样本数输出码率输出码率(bps)压缩比压缩比AAC_LC16k16单102448k约5:116k16双204848k约11:132k16单102472k约7:132k16双204872k约14:148k16单1024128k6:148k16双2048128k12:1AAC_LD24k16单51232k12:124k16双102464k12:132k16单51248k约11:132k16双102496k约11:148k16单51264k12:148k16双1024128k12:1G.719G.7191.简介简介 2008 年 5 月 ITU-T 批准了新型的

14、G.719 全带宽(full-band)编解码器。这种编解码器依据的就是 Polycom 的Siren 22 以及 Ericsson 的先进音频技术。其覆盖的音频频带达到22KHz,且对带宽的要求低,仅为32Kbps-128Kbps,可留出更多的可用带宽来提高视频质量。G.719 帧时长20 毫秒,算法延迟 40 毫秒。这是目前超宽频带编解码器可提供的最低时延,让实时沟通更加自然。2.使用说明使用说明n输入码流属性: 采样率为48000Hz, 位宽为16比特的单声道PCM码流.n每帧处理的帧长: 960个样本(时长为20ms)n压缩比: 12:1(码率为 64Kbps时)n码率: 64Kbps

15、(我们公司产品中选用的码率我们公司产品中选用的码率) 总结总结 右表为我们公司音频编解码器的一个总结性列表, 从中可以方便的查到各个编解码器支持的输入码流属性、码率及压缩比等信息。说明说明:此仅供科达开发人员内部使用。项项目目标标准准采样率采样率(Hz)位宽位宽(bit)单声道单声道/双声道双声道输入码率输入码率(bps)输出码率输出码率(bps)压缩比压缩比G.7118K16单128k64k2:1G.72216k16单256k48k,56k,64k4:1G.723.18k16单128k5.3k,6.3k24:120:1G.7288k16单128k16k8:1G.7298k16单128k8k1

16、6:1G.722.1.C32k16单512k24k,32k,48k约21:116:1约11:1Mp332k16双1024k可变(5055k)约20:1AAC_LC16k16单256k48k约5:116k16双512k48k约11:132k16单512k72k约7:132k16双1024k72k约14:148k16单768k128k6:148k16双1536k128k12:1AAC_LD24k16单384k32k12:124k16双768k64k12:132k16单512k48k约11:132k16双1024k96k约11:148k16单768k64k12:148k16双1536k128k12:1G.71948k16单76864k12:1谢谢结束,谢谢大家!结束,谢谢大家!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号