1• 视频编解码基础知识 –视频编解码标准发展历程 –视频编解码基本原理• AVS+视频编解码技术 –AVS+视频标准框架 –AVS+高层结构 –AVS+编码技术介绍• 预览AVS2视频编解码标准技术AVS TutorialAug. 20152 三大视频编码标准组织: –MPEG :动态图像专家组,是ISO(国际标准化组织)与IEC(国际电工 委员会)于1988年成立的专门针对运动图像和语音压缩制定国际标准的 组织 (ISO/IEC JTC1 SC 29 WG11) – VCEG:视频编码专家组,是世界各国政府的电信主管部门之间协调电 信事务方面的国际组织 ––国际电信联盟的电信标准化局专门从事视频 编码的专家组(ITU-T SG16 Q6) –AVS: 数字音视频编解码技术标准工作组,由中国国家信息产业部科学技术 司于2002年6月批准成立工作组的任务是:面向我国的信息产业需求, 联合国内企业和科研机构,制(修)订数字音视频的压缩、解压缩、处 理和表示等共性技术标准,为数字音视频设备与系统提供高效经济的编 解码技术,服务于高分辨率数字广播、高密度激光数字存储媒体、无线 宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用AVS TutorialAug. 20153 主流视频编码标准AVS TutorialAug. 20154ITU-TJoint ITUT&MPEGMPEG19841986198819901992 19941996 199820002002200420062008 20102012H.261MPEG-1H.262 /MPEG-2MPEG-4H.263H.263+H.263++H.264 /MPEG-4 AVCNowAVSAVS1 /IEEE.1857H.265 /HEVCAVS2 压缩效率变化情况AVS TutorialAug. 20155HD: 20 Mbps SD:5MbpsHD: 10Mbps SD: 2.5Mbps1991 1994200315050压缩比AVS1,VC-1 AVC/H.264MPEG-1HEVC/H.265 AVS2MPEG-22013HD: 5Mbps SD:1Mbps300第一代标准第二代标准第三代标准 视频编码技术发展历程:AVS TutorialAug. 20156四叉树编码单元短距离 帧内预测场景 编码 容错1985差分预测 编码调制隔行编码B帧P帧场景自适 应编码块运动估计DCT宏块混合编码 哈夫曼编码变换编码 运动矢量 预测 对象编码基于对象的 可分级编码 一般B帧高级的去块 效应滤波基于位平面的 可伸缩编码 高精度运 动补偿基于上下文 的算术编码多视编码分布式编码195019992013样本偏置多运动矢量预测方向DCT自适应 滤波AVS+标准• GY/T 257.1-2012 广播电视先进音视频编解码 第1部分:视频GY/T 257.1-2012 广播电视先进音视频编解码 第1部分:视频• GB/T 20090.2-(第二次修订)信息技术 先进音视频编码 第2部分:视频 –广播群·单目视频属 • GB/T 20090.16 信息技术 先进音视频编码 第16部分:广播视频• IEEE 1857-2013 Advanced Audio and Video Coding –Broadcasting Group ·Monocular Category7俗称AVS1俗称AVS1俗称AVS+俗称AVS+•2002.3香山科学会议 •2002.6AVS工作组正式成立,第一次工作组会议 •2003.12AVS1基准档次形成 •2006.2AVS1发布国家标准 •2012.3广电总局科技司与工信部电子信息司共同成立“AVS技术 应用联合推进工作组” •2012.7行业标准(即GY/T 257.1-2012、简称AVS+)正式颁布•2013.12AVS1国标修订版(含基准、加强、伸展、移动4个档次)发布•目前AVS1国标第二次修订版(扩展到16个档次,分为群、属)、 正在报批中• 压缩编码依据:信源-信宿特性 – 视频信息的表达冗余 – 信息保持编码•视频信息的时空冗余 − 预测编码:帧内像素预测、帧间像素预测、其它信息的时空预测 •符号的统计冗余 − 变换、扫描与熵编码 – 人眼的视觉容错特性 – 有损编码 − 变换与量化– 混合编码框架 • 预测 + 变换 + 量化 + 熵编码AVS TutorialAug. 20159• 预测 + 变换 + 量化 + 熵编码AVS Tutorial10熵编码反量化+反变换运动补偿控制数据残差系数.运动信息图像内预测/ 图像间预测控制解码器运动估计变换+量化-图像内的 纹理预测• 标准规定 – 码流的语法、语义 (第6章位流结构,第7章位流语法和语义,第 8章解析过程) – 解码方法 (第9章解码过程)• 标准未规定 – 编码方法:给行业和企业最大的自由空间,创造差异化的产品• 类(档次)、级 – 类:语法、语义及处理方法(工具)的子集 – 级:某一类中对语法元素和语法元素的参数值的限定的集合 – 高清数字电视广播:广播类@ 6.0.1.08.60级•AVS1从200余项提案中采纳了 42项形成基准档次•主要工具 –变换 – 16bit-implemented 8x8 integer transform –量化和缩放 – scaling only in encoder –自适应变换系数扫描 –帧内预测 – 5 modes –帧间预测 •运动补偿 – 16x16/16x8/8x16/8x8 modes •运动矢量预测 •各种特殊的帧间预测模式 •¼像素精度的亚像素插值– 4-taps interpolation filter –去块滤波器 –熵编码•针对广播应用4项新技术: –基于上下文的二进制对数算术编码 –加权量化 –隔行:P场同极性跳过模式编码技术 –隔行:B场增强编码模式高清6.0.1.08.60峰值码率与 缓存大小样本位宽帧率4:2:0参 数参 数级 别级 别6.0.0.08.606.0.1.08.60每行最大样本数1 9201 920每帧最大行数1 1521 152每秒最大帧数6060样本精度(位)88亮度样本速率62 668 80062 668 800最大比特率(位每秒)20 000 00050 000 000每秒最大二元符号数200 540 160501 350 400BBV缓冲区大小(位)2 457 60062 488 576每帧最大宏块个数8 1608 160每秒最大宏块个数244 800244 800帧编码时最大垂直运动矢量范围(亮度样本数)[-512,+511.875][-512,+511.875]场编码时最大垂直运动矢量范围(亮度样本数)[-256,+255.875][-256,+255.875]最大水平运动矢量范围(亮度样本数)[-2048,+2047.875][-2048,+2047.875]图像格式4:2:04:2:0 语法层次结构 •序列 •图像 •条带 •宏块 •编码块AVS TutorialAug. 201516序列:序列头开始到序列结束码或视频编辑码结束 重复序列头: 可以支持随机访问 序列类型: 逐行序列、隔行序列 语法层次结构 •序列 •图像 •条带 •宏块 •编码块AVS TutorialAug. 201517序列:序列头开始到序列结束码或视频编辑码结束 重复序列头: 可以支持随机访问 序列类型: 逐行序列、隔行序列序列头中需要描述当前序列属于哪个类和级 类和级对位流进行了各种限制,同时也就规定了对某一特 定位流解码所需要的解码器能力 AVS+高层结构 •序列 •图像 •条带 •宏块 •编码块AVS TutorialAug. 201518图像类型有3种: I图像: 仅图像内部参考 P图像: 可前向参考(可选的参考图像 最多2帧) B图像: 既可以前向参考,又可以后巷 参考(可选的参考图像前后各1帧)图像格式: 4:2:0 4:2:2 AVS+高层结构 •序列 •图像 •条带 •宏块 •编码块AVS TutorialAug. 201519编码参数配置: 全I帧模式(ALL INTRA) :不存在图像间参考,方便 编辑等随机访问要求高的应用低延时模式(LOW DELAY):仅适用I或者P帧,当 前图像不会用显示顺序在当前图像之后的图像做参 考。
不会引入较大编码延时非低延时模式(RANDOM ACCESS):可同时使用 I,B,P帧,编码效率最高(编码顺序I0,P3,B1,B2)PIPP...B1I0B2P3... AVS+高层结构 •序列 •图像 •条带 •宏块 •编码块AVS TutorialAug. 201520AB C D EFGHIJ条带:宏块组成条带,同一图像(场)内的不同条 带之间的数据不会相互使用,条带之间也不应重叠, 便于并行编解码条带的宽度和高度都为16的整数 倍图像划分成条带条带边界扩展:使用距离该 整数样本所指位置最近的图 像内的整数样本进行边界扩 展 语法层次结构 •序列 •图像 •条带 •宏块 •块AVS TutorialAug. 201521宏块:编码的基本单元,大小为16x16. 在宏块决定 预测类型(帧内/帧间预测)块: 宏块继续划分成块 每个预测块的预测类型、预测方式相同 帧内:纹理模式相同 帧间: 运动矢量,参考帧相同 预测的残差按块进行变换SequenceForemanCoastguardContainerMotherDaughterAverageSize176×144176×144176×144176×144QCIF△△PSNR (dB)-0.160.02-0.91-0.53-0.39△△Rate (%)0.04-0.010.200.120.09SequenceForemanCoastguardContainerMotherDaughterSize352×288352×288352×288352×288CIF△△PSNR (dB)-0.0630.386-0.363-0.192-0.24△△Rate (%)1.56-9.779.935.055.24SequenceTempeteMobileFlowergardenFootballSize352×288352×288352×240352×240△△PSNR (dB)-0.185-0.767-0.493-0.231△△Rate (%)4.517.548.934.15SequenceTempeteMobileFlowergardenFootballSize720×480720×576720×576720×576标清标清△△PSNR (dB)0.009-0.442-0.1970.147-0.12△△Rate (%)-0.2440.343.82-2.6710.31SequenceNightCityCrewHarbourSize1280×7201280×7201280×7201280×720高清逐行高清逐行△△PSNR (dB)0.0920.1440.270.460.20△△Rate (%)-2.85-5-9.12-12.8-6.56SequencerFlamingoFireworksKayakSize1280×7201920×10881920×10881920×1088高清隔行高清隔行△△PSNR (dB)0.0460.286-0.320.5190.16△△Rate (%)-3.05-5.465.19-8.53-2.93 22•JM5.0 •基本单元 – 变换 – 帧内/帧间预测模 式对于标清及以上分辨 率,对于标清及以上分辨 率,8x8块大小胜出块大小胜出 语法层次结构 •序列 •图像 •条带 •宏块 •块AVS TutorialAug. 201523宏块:编码的基本单元,大小为16x16. 在宏块决定 预测类型(帧内/帧间预测)。
块: 宏块继续划分成块 每个预测块的预测类型、预测方式相。