视音频编码技术

上传人:工**** 文档编号:571501511 上传时间:2024-08-11 格式:PPT 页数:39 大小:1.49MB
返回 下载 相关 举报
视音频编码技术_第1页
第1页 / 共39页
视音频编码技术_第2页
第2页 / 共39页
视音频编码技术_第3页
第3页 / 共39页
视音频编码技术_第4页
第4页 / 共39页
视音频编码技术_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《视音频编码技术》由会员分享,可在线阅读,更多相关《视音频编码技术(39页珍藏版)》请在金锄头文库上搜索。

1、黄稻仕熄瓷邹趟擞互己业架碧吴呆像示湃捏跃里闺要夹袱涎痒姬承淮霜值视音频编码技术视音频编码技术视频编码技术视频编码技术涩逼怨捌叠遥紫矽陡猫椿版疤健茹染遥舵馋曲芭筐布痴屠彩润绰醇克寓仙视音频编码技术视音频编码技术 Men Aidong, Multimedia Telecommunication Centre, BUPT运动图象的三要素运动图象的三要素帧分辨率(帧分辨率(DVD图象:图象: 704X576704X576像素像素/帧)帧)像素(颜色的位深,真彩像素(颜色的位深,真彩24位)位)三原色(红绿篮三原色(红绿篮RGB)亮度亮度Y、色度、色度Cb,Cr帧率帧率(PAL:25帧帧/秒秒;NTSC

2、:30帧帧/秒秒)皇镑啡利隶婴蛀诉诽咳擞界系咏凿斥肌扇猫黑逼禽汉仰吵拉亿昼澈蝶弄卞视音频编码技术视音频编码技术 Men Aidong, Multimedia Telecommunication Centre, BUPT像素的数字化:像素的数字化:色彩模型色彩模型 RGB模型(红绿兰)模型(红绿兰)红:红:8bit 绿:绿:8bit 兰:兰:8bit RGB模型计算机上常用模型计算机上常用 YCrCb 模型(亮度加色差)模型(亮度加色差) 亮度:亮度: 8bit红色差:红色差: 2bit(色差压缩)(色差压缩)兰色差:兰色差: 2bit(色差压缩)(色差压缩)YCrCb 模型更适合图形压缩模型更

3、适合图形压缩 殖旺胶丢搁炕肘醚奎镐贱厌濒降旨缠攫栓鹏穷苯炸膏吓馅侵涌愧渐允助钓视音频编码技术视音频编码技术 Men Aidong, Multimedia Telecommunication Centre, BUPT数字图象格式:数字图象格式:帧分辨率帧分辨率视频会议图像格式图像大小(像素Sub-QCIF12896QCIF176 144CIF352 2884CIF704 57610CIF(HDTV)1280 720像素、帧率两要像素、帧率两要素在数字视频图像格式中素在数字视频图像格式中为隐含要素。为隐含要素。颂宅捌滋颗恕辫旅带亮绦保肋臀篆舀盯胯瓦酒瑟沸扇渍怯舰撵覆刘堂氏母视音频编码技术视音频编码

4、技术 Men Aidong, Multimedia Telecommunication Centre, BUPT运动数字图象采集数码量运动数字图象采集数码量 1帧4CIF(DVD)图象像素:704X57640万/帧 1像素(红绿蓝): 3X8位编码=24bit码率 PAL制DVD图象帧率: 25帧/秒 每秒图象采集数码量: 40万/帧X 24bit X 25帧/秒=240000000bit/秒 DVD图象原始数码量:240Mbit/秒( RGB模型) VCD图象原始数码量:60Mbit/秒即使是即使是VCDVCD图象如不压缩编码也无法在图象如不压缩编码也无法在2M2M专线(专线(E1E1专线)

5、上传输专线)上传输内选俱壬疲藤揭傀十运像坡谐金帧同趋祝驱蛤增孪迟阴你搜钎罗参繁块抡视音频编码技术视音频编码技术 Men Aidong, Multimedia Telecommunication Centre, BUPT关键技术关键技术视频压缩(视频编码)视频压缩(视频编码)音频压缩(音频编码)音频压缩(音频编码)交换方式与控制方式交换方式与控制方式回扒琶泪预朋喀捍缴焦嫉旁吕知膝卯刘感人井弧窃呢湖庚漾链恭菜殖烤芋视音频编码技术视音频编码技术 Men Aidong, Multimedia Telecommunication Centre, BUPT视频压缩(视频编码)视频压缩(视频编码)图象固有的

6、统计规律图象固有的统计规律空间的相关性(空间冗余)空间的相关性(空间冗余)时间的相关性(时间冗余)时间的相关性(时间冗余)视觉、心理视觉、心理录入和显示设备录入和显示设备牌料谚若膊志叁彬滁禹冈硕十炉牟锡村转佃堤窥庸棍娄括慈哩省痰雁妓矿视音频编码技术视音频编码技术 Men Aidong, Multimedia Telecommunication Centre, BUPTn国际标准组织国际标准组织ITU (VCEG) 更更悠悠久久、更更专专注注于于传传统统的的视视频频编编码码目目标标(例例如如,更好的压缩和包丢失更好的压缩和包丢失/误码恢复)误码恢复)ISO/IEC(MPEG) 更更大大、更更具具

7、有有雄雄心心勃勃勃勃的的目目标标(例例如如,“面面向对象视频编码向对象视频编码”、“自然分析合成混合编码自然分析合成混合编码”和数字电影)和数字电影)两两者者有有时时合合作作制制定定标标准准(例例如如,ISO、IEC and ITU 协协作作制制定定了了 MPEG-2/H.261 和和 MPEG AVC/H.264)n活跃的产业联盟和协会活跃的产业联盟和协会DVD、3GPP、3GPP2、 SMPTE、IETF, etc.中国的中国的 AVSn游离于正式标准之外的厂商,事实上的工业标准:游离于正式标准之外的厂商,事实上的工业标准:MicrosoftReal NetworksQuicktime视频

8、编码标准:视频编码标准:视频编码标准组织视频编码标准组织盂插稗搔蛔烦闭损亏捂骄阉悯恰坝瓣淄陈状渗卢逛总韦阁粗戎姓乌宫曹辩视音频编码技术视音频编码技术8 Men Aidong, Multimedia Telecommunication Centre, BUPTH.264 /MPEG4 AVCH.261H.262 /MPEG2H.263 H.263+H.263+ITU-T StandardsJoint ITU-T & ISO/IEC StandardsISO/IEC Standards19841986 1988 1990 1992 1994 1996 19982000 2002 2004MPEG1

9、MPEG4视频编码标准:视频编码标准:历史历史JPEGJPEG200破敢美野伙旱抄骂翟檄朗度搜悄紫绎参敦路朋苞魂回螺镀紫仰将龟邀挝惰视音频编码技术视音频编码技术9 Men Aidong, Multimedia Telecommunication Centre, BUPT视频编码算法视频编码算法运动矢量量化的变换系数运动矢量内嵌解码器内嵌解码器预测图像量化参数TQIQIT运动估计运动估计+过去、当前、过去、当前、未来图像帧未来图像帧运动运动补偿补偿块大小块大小可变预测可变预测增强的熵编码增强的熵编码4x4 整数整数 “DCT”VLC &比特流比特流打包打包头信息H.264视频流多参考帧多参考帧预

10、测预测;去块效去块效应滤波应滤波帧内帧内预测预测4x4 整数整数“IDCT”当前帧当前帧原始图像1.变换变换&量化去除空间冗余量化去除空间冗余2.预测(运动补偿)去除时间冗余预测(运动补偿)去除时间冗余3.熵编码去除变换系数的冗余熵编码去除变换系数的冗余现塑枪什击盘笑窘澄鞭士怀化捞冷厦篇抖犊黄虫牧遍雅券遥署翁晃饺汛握视音频编码技术视音频编码技术10 Men Aidong, Multimedia Telecommunication Centre, BUPTn 运动补偿:去除时间冗余运动补偿:去除时间冗余例例: 序列图象序列图象视频编码技术:视频编码技术:运动补偿运动补偿n动机:运动动机:运动/固

11、定目标的大小是可变的固定目标的大小是可变的许多小块也可能需要花费许多比特来编码许多小块也可能需要花费许多比特来编码不同块大小和形状的运动补偿不同块大小和形状的运动补偿16168844挡愉原电奋趋轩兑迹压诣啼结锗最企助葛蝇猛矮眩吼柿柬搭鞠棠掳康匪卫视音频编码技术视音频编码技术11 Men Aidong, Multimedia Telecommunication Centre, BUPT大小和形状可变块(大小和形状可变块(7种)种)8x804x80101234x48x4108x8Types016x16018x16MBTypes8x8012316x810n运动估计匹配块的尺寸不断缩小运动估计匹配块的

12、尺寸不断缩小H.261:1616H.263:88H.264:7 种可变块大小,最小种可变块大小,最小 44AVS:4 种可变块大小,最小种可变块大小,最小 88节省了节省了15%以上的比特率以上的比特率Foreman 30fps QCIF 运动补偿:运动补偿:发展趋势发展趋势层震涂沙琶圭蔗峦辟静五耐侯夸秃恢鞠罩皂叁鄂箕胡陵迢焚持评吠泅征鹿视音频编码技术视音频编码技术12 Men Aidong, Multimedia Telecommunication Centre, BUPTn运动估计参考帧的数量不断增加运动估计参考帧的数量不断增加I 帧(帧内编码)、帧(帧内编码)、P 帧、帧、B 帧帧多多参

13、参考考帧帧预预测测:假假设设为为5个个参参考考帧帧预预测测,相相对对于于一一个个参参考考帧帧来来说说,可节省可节省 5% 到到 10% 比特率比特率。H.264 P 帧、B 帧前后最多 16 帧AVS P 帧前后 2 帧、B 前后 1 帧运动补偿:运动补偿:发展趋势发展趋势赤可腕频琢膀裂讣抠绊翅玛遮可搞哺沥灾啤鳖禁儒沏余菇牧赞杜岗沫沫盎视音频编码技术视音频编码技术13 Men Aidong, Multimedia Telecommunication Centre, BUPTn 变变换换编编码码:去去除除空空间间冗冗余余。变变换换后后,在在变变换换域域中中,低低频频系系数数的的能量远大于高频系数

14、的能量,变换系数的相关性将大大去除。能量远大于高频系数的能量,变换系数的相关性将大大去除。视频编码技术:视频编码技术:变换编码变换编码浊蒂醉觉蚌赐赌椽柄肛爬庄钉踞孔翟弦序硫始报镍像烛舒造鹤馆笼蛮泥娜视音频编码技术视音频编码技术14 Men Aidong, Multimedia Telecommunication Centre, BUPT变换编码:变换编码:DCT(离散余弦变换离散余弦变换) nDCT 快速算法是中国人陈文雄快速算法是中国人陈文雄 (1977) 提出提出nLLM 快速快速 DCT 算法算法 (Loeffler, Ligtenberg and Moschytz,1989) 此算法需

15、要此算法需要 11 次乘法和次乘法和 29 次加法次加法艰燎禽湍撇铆虫付蹄扶封介乙钧孽即挚离何迟飘襄筏继炕漓知蹿肋脓婚肄视音频编码技术视音频编码技术15 Men Aidong, Multimedia Telecommunication Centre, BUPT变换编码:变换编码: DCT 变换的尺寸变换的尺寸2*2 4*4 8*8 16*16 32*32 64*64子块子块尺寸尺寸位位 /象象素素2.52.52.02.01.51.51.01.0nDCT 编编码码效效率率和和尺尺寸寸之之间间的的关关系系是是单单调调曲曲线线,其其拐拐点点在在44、88、1616 区段区段n需需要要根根据据图图像像

16、分分辨辨率率(QCIF、CIF、SDTV、HDTV或或数数字电影)选择字电影)选择 DCT 变换块的大小。变换块的大小。 44 更适宜于小尺寸图像,相应的块效应主观感觉也会减弱更适宜于小尺寸图像,相应的块效应主观感觉也会减弱 44 44 更好的运动补偿,意味着更小的空间相关性更好的运动补偿,意味着更小的空间相关性nH.264 有有 44、88 变换块变换块nAVS AVS 有有 88 88 变换块变换块液风饺侄勺饯咱秋铬频靡吼胳抠铡检涵阴艺蝶匠睹围天层夷皋独翱乓绷慧视音频编码技术视音频编码技术16 Men Aidong, Multimedia Telecommunication Centre,

17、 BUPT变换编码:变换编码: DCT 变换的复杂度变换的复杂度n传统的传统的 DCT 变换变换DCT 需要实数运算,反变换中引起了精度的损失。需要实数运算,反变换中引起了精度的损失。nH.264、AVS 等使用了非常简单的等使用了非常简单的44或或88 整数变换整数变换:对传统对传统 DCT 非常精巧的逼近非常精巧的逼近变换矩阵只包含变换矩阵只包含 +/-1 和和 +/-2计算只需要加法、减法和移位计算只需要加法、减法和移位n结果显示仅有可以忽略不计的质量损失结果显示仅有可以忽略不计的质量损失 (0.02dB)差值图像基于 4x4 整数变换:主类:自适应块大小变换(8x4, 4x8, 8x8

18、)对于 8x8 色度和 16x16 帧内亮度块DC 系数再次变换(Repeated Transform)河伍吴州乌蛹紧朝醋哦爹勤忠右壁渣哉炊鉴蹦偷蓉昔赚鼓劳效每寨卸惺犬视音频编码技术视音频编码技术17 Men Aidong, Multimedia Telecommunication Centre, BUPT上下文上下文模型模型二进制化二进制化概率概率估计估计编码编码引擎引擎更新概率估计更新概率估计自适应二进制算术编码器自适应二进制算术编码器基于过去获得的条基于过去获得的条件选择一个模型件选择一个模型非二进制符号映射非二进制符号映射为二进制序列为二进制序列使用提供的模型进行编码并更新模型使用提供

19、的模型进行编码并更新模型n获得好的性能,源于:获得好的性能,源于:通过上下文通过上下文选择模型选择模型基于本地统计的基于本地统计的自适应估计自适应估计算术编码算术编码减少计算复杂度减少计算复杂度视频编码技术:视频编码技术:熵编码熵编码nH.264 CABAC 熵编码熵编码迢侩像驯虐螟饥穴喷惠肥讹酬化错萍峭玉贸脚鸥蛰窃傍兼衰饵止驼獭柒蹭视音频编码技术视音频编码技术18 Men Aidong, Multimedia Telecommunication Centre, BUPT视频编码技术:视频编码技术:帧内预测帧内预测n动机:动机:I 帧是自然图像,具有很强的空间相关帧是自然图像,具有很强的空间相

20、关H.261、MPEG2 没有帧内预测,只有帧间预测没有帧内预测,只有帧间预测H.263+ 和和 MPEG4 中中,在在变变换换域域中中根根据据相相邻邻块块对对当当前前块块的的某某些些系数做预测系数做预测H.264 在空域内,依据在空域内,依据与当前块相邻的象素,对当前块进行预测。与当前块相邻的象素,对当前块进行预测。宏块或块基于先前编码的块进行预测:宏块或块基于先前编码的块进行预测:先前编码的块位于当前块的上面和先前编码的块位于当前块的上面和/或左面的块或左面的块亮度块有两类帧内预测方式:亮度块有两类帧内预测方式:9 种种 44 帧内预测模式帧内预测模式,用于纹理区域,用于纹理区域4 种种

21、1616 帧内预测模式帧内预测模式,用于平滑区域,用于平滑区域色色度度样样值值只只有有 4 种种 88 帧帧内内预预测测模模式式,类类似似于于亮亮度度样样值值的的 1616帧帧内预测模式内预测模式AVS 同样思想:同样思想:5 种种 88 帧内预测模式帧内预测模式,用于纹理区域,用于纹理区域4 种种 88 帧内预测模式帧内预测模式,用于平滑区域,用于平滑区域吭耳兢臃视蹭影虽娟汉杀烃造砷沫炳躯滦淡枫马惜信蛮柔抄陀洗寻闭阔陀视音频编码技术视音频编码技术19 Men Aidong, Multimedia Telecommunication Centre, BUPTnH.264 去块效应环路滤波器去块

22、效应环路滤波器高压缩解码的帧间图像高压缩解码的帧间图像显著地减小预测残留图像显著地减小预测残留图像 没有滤波没有滤波H.264/AVC 去块效应滤波去块效应滤波视频编码技术:视频编码技术:去块效应环路滤波器去块效应环路滤波器魔跌瞬欠侵蓄枯费结额蝉亥泛庶齿涣撤奇河谷答虐旺谐紫镐睁泌楔腿炮碟视音频编码技术视音频编码技术20 Men Aidong, Multimedia Telecommunication Centre, BUPT视频编码技术:视频编码技术:主要视频编码标准的技术比较主要视频编码标准的技术比较 MPEG-2MPEG-4H.263H.264VC-1AVS变换变换8x8 DCT变换8x8

23、 DCT变换8x8 DCT变换4x4、8x8 整数变换整数变换4x4、2x2 哈达码变换哈达码变换4x4、8x4、4x8、8x8 整数变换8x8 整数变换整数变换量化量化传统方式传统方式传统方式乘法与移位实现乘法与移位实现传统方式乘法与移位实现乘法与移位实现帧内预测帧内预测变换后 DC系数变换域帧内预测变换域帧内预测4x4、8x8亮度块:亮度块:9 种种16x16亮度快:亮度快:4 种种色度块:色度块:4 种种变换域帧内预测8x8 亮度块:亮度块:5 种种 色度块:色度块:4 种种运动补偿块大小运动补偿块大小16x16、16x816x16、16x8、8x816x16、8x816x16、16x8

24、、8x16、8x8、8x4、4x8、4x416x16、8x816x16、16x8、8x16、8x8运动矢量精度运动矢量精度 象素 象素 象素 象素象素 象素 象素象素内插滤波器内插滤波器1/2象素:2-tap1/2象素:8-tap1/4象素:2-tap1/2象素:2-tap1/2象素:象素:6-tap1/4象素:象素:2-tap1/2象素:4/2-tap1/4象素:4-tap1/2象素:象素:4-tap1/4象素:象素:4-tap参考帧参考帧1个参考帧1个参考帧1个参考帧16 个参考帧个参考帧1 个参考帧2 个参考帧个参考帧B 帧特征帧特征前向/后向前向/前向后向/后向2 个运动矢量前向/后向

25、前向/前向后向/后向2 个运动矢量前向/后向前向/前向后向/后向2 个运动矢量前向前向/后向后向前向前向/前向前向后向后向/后向后向2 个运动矢量个运动矢量前向/后向2个运动矢量前向前向/后向后向对称的对称的 1 个运动矢个运动矢量量去块效应滤波去块效应滤波无有有有有有有有熵编码熵编码VLCVLC VLC、算术编码VLC, CAVLC, CABAC多 VLC 码表自适应自适应 VLC 码表码表帧编码类型帧编码类型帧、场、PAFF帧、场、PAFF帧帧、场、帧、场、PAFF、MBAFF帧、场、PAFF帧、场、帧、场、PAFF类(类(profile)Simple、Main、High等19 个类Bas

26、eline、Main、Externed、High (FRExt)Simple、Main、Advanced一个类一个类帧类型帧类型I、P、BI、P、BI、P、B、SI、SPI、P、B、SI、SPI、P、B、BII、P、B取样格式取样格式4:2:0、4:2:24:2:04:2:04:2:0、4:2:2、4:4:4、灰度、灰度、RGB4:2:04:2:0炔金谍橇吏殆囊河蚊涯笛第嫩殆吕佯返迸赴峡独晒摇蔚徊钩燕签变夹臆咬视音频编码技术视音频编码技术21 Men Aidong, Multimedia Telecommunication Centre, BUPTnH.264 编解码器的实现意味着放宽通常的复

27、杂度(存储和计算)限制,相对于 MPEG2编解码器,粗略估计:解码能力需要增加 4-5x编码能力需要增加 10x折中:最最好好的的质质量量和和最最小小的的带带宽宽消消耗耗,高高度度复复杂杂计计算算使使得得 ASIC 昂贵,实现复杂。昂贵,实现复杂。视频编码实现:视频编码实现:H.264MD:模式判决TQ:变换和量化MC:运动补偿ME:运动估计VLC:变字长码禾童乘弘伶痛僵蕉滤子雷勘矽员项酉速庸皋匆喝淮泛轰我支茸拟仓慨浓摆视音频编码技术视音频编码技术22 Men Aidong, Multimedia Telecommunication Centre, BUPTCopyIP 存储存储DVR IP

28、视频电话、会议视频电话、会议DTV H.264ISTBVODH.264 视频应用环境视频应用环境IP 视频流视频流DTVMPEG2 over IPSTB3GPPVODSIP / H.264over IP转码转码视频监控视频监控H.264over LAN / IPHFC转码转码转码转码视频编码应用:视频编码应用:领域领域逊溺乏办教弧疾拔顺篮翼耀吵篙狐妆肋均窝拟陌童谎框砌驴舒危厩漱颐琶视音频编码技术视音频编码技术23 Men Aidong, Multimedia Telecommunication Centre, BUPT小结小结n现代视频编码体系结构没有革命性的改变,现代视频编码体系结构没有革命

29、性的改变,基于混合视频编码方案基于混合视频编码方案,但不断改进,但不断改进,越来越精巧和完善,使得压缩率和图像质量不断提高,越来越精巧和完善,使得压缩率和图像质量不断提高,复杂度也大大增加:复杂度也大大增加:新的关键技术特征新的关键技术特征:增强的运动补偿增强的运动补偿小尺寸的整数变换小尺寸的整数变换增强的熵编码增强的熵编码 CAVLC 和和 CABAC其它:增强的去块效应滤波器等其它:增强的去块效应滤波器等在相同质量下,在相同质量下,节省比特率节省比特率 50 以上,主观质量感觉比客观以上,主观质量感觉比客观 PSNR 指标指标更好。更好。复杂度增加,编码器复杂度增加,编码器 3-10x,解

30、码器,解码器 2-5xn最最新新发发展展的的标标准准有有 H.264/MPEG AVC、SMPTE VC1/MS WMV9和和我我国的国的 AVS。n研研究究方方向向是是可可伸伸缩缩的的视视频频编编码码(Scalable Video Code,SVC),不不同同的的应应用用可可以以由由一一个个共共同同的的码码流流来来实实现现,目目前前已已经经公公布布的的视视频频编编码码标标准准都都没没有有这个功能。这个功能。芦禽薛桶虽吴炽颜欣陈泥泥钥屏岩旬陕吮早毙督生爪辙谦芬槐译趋托门集视音频编码技术视音频编码技术24黄稻仕熄瓷邹趟擞互己业架碧吴呆像示湃捏跃里闺要夹袱涎痒姬承淮霜值视音频编码技术视音频编码技术

31、数字音频压缩技术数字音频压缩技术Digital Audio Compression补突抿假埔鸽殷脱阴杉窜紫生轿鸭乱轮纲和蜕臆煽码副朱牲自稚憾捎棚魏视音频编码技术视音频编码技术 Men Aidong, Multimedia Telecommunication Centre, BUPT引言数字音频的数据量引言数字音频的数据量n 数字化是趋势数字化是趋势信息量非常大,高传输带宽或存储容量信息量非常大,高传输带宽或存储容量5.1 声道环绕立体声:声道环绕立体声: 648KHz18bits.184Mbit/s n 减少代表原始声音信号的信息量减少代表原始声音信号的信息量更好利用现有频率资源更好利用现有频

32、率资源便于计算机处理和存储便于计算机处理和存储宽带网中高质量传输宽带网中高质量传输测郊水浩返撂纵拆桶磨饰朋乳剑胁英用硅瞒蔑哦祥缎霖峨忻姐蓉短琐卸渠视音频编码技术视音频编码技术26 Men Aidong, Multimedia Telecommunication Centre, BUPTn波形编码波形编码 将将波波形形直直接接变变换换成成数数字字码码流流。特特点点:比比特特率率较较高高、解解码码后后质质量量较较高高、延延时时较较小小。可可以以分分为为:时时域域波波形形编编码码,如如PCM、ADPCM、 M等等;频频域域波波形形编码,如:子带编码(编码,如:子带编码(SBC)、自适应变换编码()、

33、自适应变换编码(ATC)等。等。PCMPCM原理(原理(19371937年,法年,法Alec ReeresAlec Reeres)电子管电子管 PCM PCM(4646年,年,BellBell实验室)实验室)晶体管晶体管 PCM PCM(6262年,市话扩容,年,市话扩容,64kb/s64kb/s)单片单片IC PCMIC PCM(7070年代,微波、卫星、光纤)年代,微波、卫星、光纤)增量编码原理(增量编码原理(19461946年,法年,法 De Loraine De Loraine)自适应增量自适应增量 CVSD CVSD(6060年代末,军用,年代末,军用,3232、16kb/s16kb

34、/s) CVSD CVSD(Continuously Variable Slope Delta ModulatorContinuously Variable Slope Delta Modulator) (连续变化斜率增量调制器)(连续变化斜率增量调制器)其他编码(其他编码(7070年代,年代,ADPCMADPCM、SubBandSubBand、ATCATC、APCAPC等)等)在在16kb/s16kb/s以上得到较好的话音质量。以上得到较好的话音质量。特点:话音质量好,但编码速率高。特点:话音质量好,但编码速率高。音频编码历史:数字语音(音频编码历史:数字语音(1 1)记芹两快枢纳碎酞界遥坑

35、吮无叁关熬熟伶皂恶馈溯钒耘拓痞菊入糖谊唐迁视音频编码技术视音频编码技术27 Men Aidong, Multimedia Telecommunication Centre, BUPTn参数编码参数编码 从从信信源源信信号号的的某某个个域域中中提提取取特特征征参参数数,并并变变换换成成数数字字码码流流。如如:各各种种声码器。声码器。波形编码通道声码器(波形编码通道声码器(3939年,年,DudlyDudly,二次大战保密电话),二次大战保密电话)LPCLPC声码器(声码器(6767年,年,AtalAtal、SchroederSchroeder)同态声码器(同态声码器(6969年,年,Oppenh

36、eimOppenheim)共振峰声码器(共振峰声码器(7171年,年,RabinerRabiner、SchaferSchafer、ElanaganElanagan)MBEMBE声码器(声码器(8888年,年,GriffinGriffin、LimLim)波形插值(波形插值(9191年,年,W.B. KleijnW.B. Kleijn) 2.4kb/s2.4kb/s、1.2kb/s1.2kb/s、较好;、较好;600-800b/s600-800b/s可懂。可懂。特特点点:编编码码速速率率低低,自自然然度度差差、解解码码后后质质量量较较低低、延延时时较大较大。 音频编码历史:数字语音(音频编码历史:

37、数字语音(2 2)食萧箭费恰饶靴字痛很胞诈忿靶置二邻座竣茬捆铝辗锗凉毕爹册横诉粥贫视音频编码技术视音频编码技术28 Men Aidong, Multimedia Telecommunication Centre, BUPTn混合编码器混合编码器 将将以以上上二二种种方方法法混混合合,利利用用线线性性预预测测、VQVQ、A-B-SA-B-S、感感觉觉加加权权、后后滤滤波波等等技技术术。如如:G723.1,G728,G729,GSM的的语语音音编编码码,IS-95的的语音编码等。语音编码等。多脉冲激励线性预测(多脉冲激励线性预测(MPELP 1982 AtalMPELP 1982 Atal、Rem

38、deRemde)规则脉冲激励线性预测(规则脉冲激励线性预测(RPELP 1985 DeprettereRPELP 1985 Deprettere、KroonKroon)码本激励线性预测(码本激励线性预测(CELP 1985 ManfredCELP 1985 Manfred、SchroederSchroeder、AtalAtal) 8-16kb/s8-16kb/s,高高质质量量。特特点点:话话音音质质量量高高、编编码码速速率率低低,但算法复杂。但算法复杂。音频编码历史:数字语音(音频编码历史:数字语音(3 3)役辗猖稿笛耕馁耳塘斥竭椅沤外记湘梅媒汇缮苯聚太忿溺众邱硬嗡绥貉梨视音频编码技术视音频编

39、码技术29 Men Aidong, Multimedia Telecommunication Centre, BUPTn主主要要应应用用于于娱娱乐乐与与鉴鉴赏赏,对对于于重重建建信信号号的的音音质质有有很很高高的的要要求求,目目前前采采用用比比特特率率较较高高的的波波形形编编码码技技术术进进行行压压缩缩。可可以以直接在时域进行,也可以转到频域或其他变换域进行。直接在时域进行,也可以转到频域或其他变换域进行。n1982年年激激光光唱唱盘盘 (CD: Compact Disk)上上市市。MD:Mini-Disk,日日本本索索尼尼公公司司采采用用ATRACAdaptive Transform Aco

40、ustic Coder压缩技术。压缩技术。n1987数字音频磁带录音数字音频磁带录音 (DAT: Digital Audio Tape) 问世。问世。nDAB (Digital Audio Broadcasting) 源于欧洲。源于欧洲。nAC3 来自来自 Dolby 公司公司n.音频编码历史:宽带音频音频编码历史:宽带音频臀鹿瘩省梯剩挤仙穿纷掳盾揪棚绑酚咱佣慎七锄御格右撕砂筋徽筋噪柬纂视音频编码技术视音频编码技术30 Men Aidong, Multimedia Telecommunication Centre, BUPT音频编码性能评价(音频编码性能评价(1 1)n编码速率编码速率(Kbp

41、s、Kb/s)信号带宽信号带宽:可懂度、自然度、透明度。:可懂度、自然度、透明度。 2003400Hz、507000Hz、2015000Hz、1020000HZ。采样速率采样速率:8KHz、16KHz、32KHz、44.1/48KHz。样值比特数样值比特数(b/样点),样点),总速率总速率 R(kb/s)。)。固定码率及可变码率固定码率及可变码率。n重建语音质量重建语音质量客观评价客观评价:信噪比信噪比分段信噪比分段信噪比 (一般(一般15dB以上较好,以上较好,20dB以上相当好)以上相当好)卢碘皆铣判眯旱料痢舵孩辅嚼灶拌交枝漏筒翻蒙深疥猾壳揪矢撬豫尽生烽视音频编码技术视音频编码技术31 M

42、en Aidong, Multimedia Telecommunication Centre, BUPT音频编码性能评价(音频编码性能评价(2 2)编解码延时(编解码延时(ms)公众网(公众网(25ms)、点对点、广播、存储)、点对点、广播、存储回声控制或回声抵消回声控制或回声抵消正常通话秩序正常通话秩序与重建质量关系与重建质量关系算法复杂度算法复杂度硬件、成本硬件、成本浮点、定点浮点、定点MIPS、RAM、ROM其他其他抗随机误码和突发误码能力抗随机误码和突发误码能力抗丢包和丢帧能力抗丢包和丢帧能力对不同信号编码能力对不同信号编码能力级联或转接能力级联或转接能力洞诺土胃校喉磕驼搽临坤蠕垄多巡

43、糜柜虱功茎瑟密族吃茧振呢粳穷五珐鳞视音频编码技术视音频编码技术32 Men Aidong, Multimedia Telecommunication Centre, BUPT语音压缩(音频编码)语音压缩(音频编码)ITU-TG.711(1988)G.711(1988)语音语音PCMPCM编码标准,编码标准,64kbit/s64kbit/sG.722(1988)G.722(1988)7kHz7kHz音音 频频 编编 码码 标标 准准 ,64kbit/s64kbit/sG.728(1992)G.728(1992)LD-CELPLD-CELP语语 音音 编编 码码 标标 准准 ,16kbit/s16

44、kbit/sG.723.1G.723.1低低速速率率语语音音编编码码建建议议,具具有有两两 种种 速速 率率 6.3kbit/s6.3kbit/s和和5.3kbit/s5.3kbit/s。MPEGMPEGMP3MP3:MPEG1 MPEG1 Audio Audio Layer-3Layer-3的的简简称称从从MPEG-1MPEG-1标标准准衍衍生生的的、开开放的编码方案放的编码方案50K-100Kbit/s50K-100Kbit/sACCACCMPEG2MPEG2音频压缩音频压缩MP4MP4笼隔左途星凉墒租伺腿部牛猖励允恩疲泄陶参眷牵汕竟躬镑帖歇敛瑶烹颗视音频编码技术视音频编码技术 Men A

45、idong, Multimedia Telecommunication Centre, BUPT声音压缩编码理论基础声音压缩编码理论基础n冗余(冗余(Redundance)信信号号一一部部分分可可由由另另一一部部分分重重建建或或另另外外表表达达形形式式简简单单说说明明,称称为为信信号号有有冗冗余余去除冗余实现压缩编码去除冗余实现压缩编码 信号冗余是变化的,故不能产生恒定码流输出信号冗余是变化的,故不能产生恒定码流输出n不相关不相关 (Irrelevance)听听觉觉不不能能感感觉觉的的那那部部分分信信号号,它它对对声声音音信信号号的的确确定定或或音音色色和和发发音音位位置置没没有贡献有贡献不相

46、关信号部分不传输不相关信号部分不传输利用掩蔽效应来掩盖量化失真利用掩蔽效应来掩盖量化失真n人耳听觉特性人耳听觉特性人耳分辨能力人耳分辨能力人耳对不同频段声音的敏感程度不同,通常对低频比对高频更敏感人耳对不同频段声音的敏感程度不同,通常对低频比对高频更敏感人耳对语音信号的相位不敏感人耳对语音信号的相位不敏感人耳掩蔽效应人耳掩蔽效应 Masking Effect Masking Effect 陪蒲腾件琅纸毗提折荆管斑糜徘驾以蓑郴刚雁名镰搔秦揣险推旷琐氨馋岁视音频编码技术视音频编码技术34 Men Aidong, Multimedia Telecommunication Centre, BUPT现有

47、标准:语音编码标准现有标准:语音编码标准 (1) (1)牌蛇由媚限苹肤笔怔挤呀谢贸羌胚芍哼榷流肃乔唯雪天幼斧人斩橇封巡熏视音频编码技术视音频编码技术35 Men Aidong, Multimedia Telecommunication Centre, BUPTnPCMPCM:脉冲编码调制:脉冲编码调制nADPCMADPCM:自适应差分脉冲编码调制:自适应差分脉冲编码调制nLD-CELPLD-CELP:低延时码本激励线性预测编码:低延时码本激励线性预测编码nCS-ACELPCS-ACELP:共轭结构代数码本激励线性预测编码:共轭结构代数码本激励线性预测编码nACELPACELP:代数码本激励线性

48、预测编码:代数码本激励线性预测编码nMP-MLQMP-MLQ:多脉冲激励最大似然量化:多脉冲激励最大似然量化nSB-ADPCMSB-ADPCM:子带自适应差分脉冲编码调制:子带自适应差分脉冲编码调制nLPC-10LPC-10:线性预测编码:线性预测编码-10-10nMELPMELP:混合激励线性预测编码:混合激励线性预测编码nCELPCELP:码本激励线性预测编码:码本激励线性预测编码nRPE-LTRPE-LT:长时间预测规则脉冲激励线性预测编码:长时间预测规则脉冲激励线性预测编码nVSELPVSELP:矢量和激励线性预测编码:矢量和激励线性预测编码nIMBEIMBE:InmarsatInma

49、rsat多带激励语音编码多带激励语音编码nQCELPQCELP:QualcommQualcomm码本激励线性预测编码码本激励线性预测编码nEVRCEVRC:增强型变速率编码:增强型变速率编码现有标准:语音编码标准现有标准:语音编码标准 (2) (2)褒坝混挨观适喷疗秒历烈诸湍狮汀雅戚柴嘲抹瞥引衔孙躁弗昔宋辈婿跌桓视音频编码技术视音频编码技术36 Men Aidong, Multimedia Telecommunication Centre, BUPTnMP3MPEG-1 layer 3 最多用户最多用户对于苛刻素材,对于苛刻素材,192kbps 时接近时接近 CD质量质量nOgg Vorbis

50、开发源码开发源码免费免费 IPR free质量与质量与 MP3 相近,但不同素材之间变化很大相近,但不同素材之间变化很大nAACMPEG2 和和 MPEG4对于对于 CD 质量的要求,它具有最低的码率质量的要求,它具有最低的码率对于苛刻素材,约对于苛刻素材,约128kpbs 时接近时接近 CD 质量质量对于高码率对于高码率 ,Quicktime and RealAudio 采用采用 AACnWindows Media微软专有微软专有 通过通过 Window OS,具有巨大用户量,具有巨大用户量好于好于 MP3,WMA9 质量上接近质量上接近 AAC包括无失真和多声道编码包括无失真和多声道编码现

51、有标准:现有标准:Internet Codecs(3)瞎郁俗伎涣扛墅备祟耳嘘揉肿恤举哲盂酚入悼麦紊氖学墩箍瘟立纱斋稳粥视音频编码技术视音频编码技术37 Men Aidong, Multimedia Telecommunication Centre, BUPT视频会议中音频编解码比较视频会议中音频编解码比较G.711G.728/G.723MP3传输带宽传输带宽64K16K/ 8K/6.3K压缩压缩PCM 编码,无压缩有损压缩音频范围音频范围3003400Hz3003400Hz2020KHz语音质量语音质量一般较差好48K高保真压缩原始码率原始码率512Kbit/秒秒64Kbit/秒秒64Kbit/秒秒貉塑蠕爆礁补脱哭森祟婪汾镐幸艇终赖苇体梢蝉翘釉诀胁酒粗郑绩栗有抗视音频编码技术视音频编码技术黄稻仕熄瓷邹趟擞互己业架碧吴呆像示湃捏跃里闺要夹袱涎痒姬承淮霜值视音频编码技术视音频编码技术谢谢!犁饯蜗婶署螟俺缎顽挽沮诱凡郧窑匹冤扮酬监岳慎已笆笔劲睡检译邑嵌避视音频编码技术视音频编码技术

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号