数字视频信号信源编码基础

资源描述

《数字视频信号信源编码基础》由会员分享，可在线阅读，更多相关《数字视频信号信源编码基础（115页珍藏版）》请在金锄头文库上搜索。

1、数字视频信号信源编码基础,周志泽,目录,一、数字视频编码标准概述-3 二、MPEG-2视频编码标准-7 三、H.264/AVC视频编码标准 -36 四、AVS视频编码标准-71五、AVS+视频编码标准-86,目录,一、数字视频编码标准概述,数字视频编码标准概述,数字视频通信是一个复杂且计算强度很大的工程，它要求系统能满足接收来自不同信源的视频信号的要求。数字视频通信标准标准主要是为视频通信（如电视、电话等应用）开发的，以使新馆产业能向用户提供合理价位的有效带宽应用服务。数字视频处理技术在通信、电子消费、军事、工业控制等领域的广泛应用促进了数字视频编码技术的快速发展，并催生出一系列的国际标准。近

2、年来，国际标准化组织ISO、国际电工委员会IEC和国际电信联盟ITU-T相继制定了一系列视频图像编码的国际标准，有力地促进了视频信息的广泛传播和相关产业的巨大发展。,数字视频编码标准概述,视频压缩标准的演变过程,数字视频编码标准概述,目录,二、MPEG-2视频编码标准,MPEG-2视频编码标准,MPEG是运动图像专家组(Moving Picture Experts Group)的简称，其实质上的名称为国际标准化组织（ISO）和国际电工委员会（IEC）联合技术委员会（JTC）1的第29 分委员会的第11工作组，即ISO/IEC JTC1/SC29/WG11，成立于1988年。其任务是制定世界通用

3、的视音频编码标准。因为，广播电视数字化所产生的海量数据对存储容量、传输带宽、处理能力及频谱资源利用率提出了不切合实际的要求，使数字化难以实现。为此，该专家组基于帧内图像相邻像素间及相邻行间的空间相关性和相邻帧间运动图像的时间相关性，采用压缩编码技术，将那些对人眼视觉图像和人耳听觉声音不太重要的东西及冗余成分抛弃，从而缩减了存储、传输和处理的数据量，提高了频谱资源利用率，制定了一系列MPEG标准,使数字化正在变为现实。,MPEG-2视频编码标准,MPEG-2视频编码标准,MPEG-2视频编码标准,1.系统的定义MPEG-2系统是将视频、音频及其它数据基本流组合成一个或多个适宜于存储或传输的数据流

4、的规范，如图1所示。由图1可见，符合ITU-R. 601标准的、帧次序为I1B2B3P4B5B6P7B8B9I10数字视频数据和符合AES/EBU标准的数字音频数据分别通过图像编码和声音编码之后，生成次序为I1P4B2B3P7B5B6I10B8B9视频基本流（ES）和音频ES。,MPEG-2视频编码标准,MPEG-2视频编码标准,在视频ES中还要加入一个时间基准，即加入从视频信号中取出的27MHz时钟。然后，再分别通过各自的数据包形成器，将相应的ES打包成打包基本流（PES）包，并由PES包构成PES。最后，节目复用器和传输复用器分别将视频PES和音频PES组合成相应的节目流（PS）包和传输流

5、（TS）包，并由PS包构成PS和由TS包构成TS。显然，不允许直接传输PES，只允许传输PS和TS；PES只是PS转换为TS或TS转换为PS的中间步骤或桥梁，是MPEG数据流互换的逻辑结构，本身不能参与交换和互操作。由系统的定义，可知MPEG-2系统的任务。,MPEG-2视频编码标准,MPEG-2的编码码流（ES）采用分层结构，共分六个层次视频序列层（Sequence）序列指构成某路节目的图像序列，序列起始码后的序列头中包含了图像尺寸，宽高比，图像速率等信息。序列扩展中包含了一些附加数据。为保证能随时进入图像序列，序列头是重复发送的。图像组层（GOP,Group of Picture

6、）一个图像组由相互间有预测和生成关系的一组I、P、B图像构成，但头一帧图像总是I帧。GOP头中包含了时间信息。图像层（Picture）分为I、P、B三类。PIC头中包含了图像编码的类型和时间参考信息。片(像条)层（Slice）一个像条包括一定数量的宏块，其顺序与扫描顺序一致。MPML中一个像条必须在同一宏块行内。宏块层（Macro Block）像块层（Block）像块是MPEG-2码流的最底层，是DCT变换的基本单元。MPML中一个像块由8x8个抽样值构成。,MPEG-2视频编码标准,MPEG-2视频编码标准,MPEG-2视频编码标准,MPEG标准所规定的视频编码算法在

7、实现高压缩比的同时，又能获得较高的重建图像质量，并且还要满足能够随机存取的要求。如果只采用帧内编码，则不可能在高的压缩比下获得好的图像质量，所以必须要采用帧间编码，但要能随机存取，则用帧内编码最容易实现。这就要在帧间和帧内编码之间仔细地平衡。不仅如此，MPEG视频编码算法在利用运动补偿帧间预测来减少时间冗余度时，不仅用上一帧的图像来预测当前帧图像，而且也用下一帧图像来预测当前帧图像，即双向预测。所以，MPEG标准将编码图像分为三种类型，分别称为I（Intra）帧、P（Predicated）帧和B（Bi-directional）帧。,MPEG-2视频编码标准,1I帧I帧，又称帧内编码帧，是作为预

8、测基准的独立帧。该帧采用类似JPEG算法的帧内DCT编码，只利用了本帧图像内的空间相关性，而没有利用时间相关性，所以I帧图像的压缩比相对较低。设置I帧的主要理由是：（1）当某帧找不到匹配的参考帧时，就只好进行帧内编码，场景切换或图像中的“遮挡”和“暴露”部分就是这种情况的例子；（2）解码I帧不需要参考帧，因而可以在I帧进行码流的切换和编辑等操作，提供随机存取的插入点；（3）长时间连续地进行预测编码，预测误差会不断累积，使压缩效率逐渐降低，图像质量不断下降。为防止解码图像损伤的逐渐加剧，需定时进行帧刷新，即周期性地插入I帧，以便重新开始一个新的预测编码过程。,MPEG-2视频编码标准,2P帧P帧

9、，又称前向预测编码帧。它用前面最近的I帧或P帧作为参考进行前向预测，采用带运动补偿的帧间预测编码方式。由于同时利用了空间和时间上的相关性，所以P帧比I帧的压缩效率高。P帧也可作为参考帧。 3B帧B帧，又称双向预测编码帧。它既用源视频序列中位于前面且已编码的I帧或P帧作为参考帧，进行前向运动补偿预测，又用位于后面且已编码的I帧或P帧作为参考帧，进行后向运动补偿预测。即B帧可采用帧内编码、前向预测编码、后向预测编码、或双向预测编码4种技术，其压缩比最高。但B帧不能用作对其他帧进行运动补偿预测的参考帧。,MPEG-2视频编码标准,图像编码时的顺序：IBBPBBBP 图像传送时的顺序：IPBBPBBB

10、图像恢复时的顺序：IBBPBBBP,I帧、P帧与 B 帧的示意图如下图所示。,MPEG-2视频编码标准,亮度与色度信号由输入视频分离出三基色R、G、B 转换成亮度与色度信号Y、Cb、Cr 公式 Y=0.30R+0.60G+0.10BCr=0.625(R-Y)+0.5Cb=0.5(R-Y)+0.5像块（Block）亮度和色度信号样点分别被分割成8*8的像素块，即为像块。宏块（Macro Block, MB）同一个区域的若干个像块构成一个宏块。宏块结构 4:2:0宏块 4:2:2宏块 4:4:4宏块,MPEG-2视频编码标准,MPEG-2视频编码标准,MPEG-2视频编码标准,MPE

11、G-2视频编码标准,MPEG-2视频编码标准,图像的两种特性空间相关性一帧图像内的任何一个场景都是由若干像素点构成的，因此一个像素通常与它周围的某些像素在亮度和色度上存在一定的关系，这种关系叫作空间相关性时间相关性一个节目中的一个情节常常由若干帧连续图像组成的图像序列构成，一个图像序列中前后帧图像间也存在一定的关系，这种关系叫作时间相关性图像的冗余信息两种相关性使得图像中存在大量的冗余信息。 MPEG-2图像压缩的原理去除冗余信息，只保留少量非相关信息进行传输，可以大大节省传输频带。接收机利用这些非相关信息，按照一定的解码算法，可以在保证一定的图像质量的前提下恢复原始图像。一个好的

12、压缩编码方案就是能够最大限度地去除图像中的冗余信息。,MPEG-2视频编码标准,MPEG图像视频编码器的组成框图,MPEG-2视频编码标准,MPEG-2视频压缩方案中关键技术介绍1、余弦变换DCT2、量化器3、之型扫描与游程编码4、熵编码5、运动估计6、运动补偿,MPEG-2视频编码标准,1.DCT 离散余弦变换（discrete cosine transform ) 什么是DCT 它是一种空间变换，在MPEG-2中DCT以8x8的像块为单位进行，生成的是8x8的DCT系数数据块。 DCT变换的最大特点对于一般的图像都能够将像块的能量集中于少数低频DCT系数上，即生成8x8DCT系数块中，仅

13、左上角的少量低频系数数值较大，其余系数的数值很小，这样就可能只编码和传输少数系数而不严重影响图像质量。作用 DCT不能直接对图像产生压缩作用，但对图像的能量具有很好的集中效果，为压缩打下了基础。,MPEG-2视频编码标准,2.量化器目的量化是针对DCT处理结果（即DCT系数）进行压缩。量化过程就是以某个量化步长，去除不必要的DCT系数，从而降低传输比特率。量化精度量化步长的大小称为量化精度，量化步长越小，量化精度就越细。原理量化以人眼的生理特性为依据。人眼对低频分量和亮度信号比较敏感，而对高频分量和色度信号不太敏感。因此，对亮度系数和低频分量采用较细的量化，色度系数和高频分量采用较

14、粗的量化。由于DCT系数表左上方对应于图像的低频分量，右下方对应于图像的高频分量，所以量化步长左上方小、右下方大。这样，经量化之后所得的数据一般都集中在左上方，右下方高频系数多数为零，从而达到压缩DCT系数的目的。通常情况下，一个DCT变换块中的大多数高频系数量化后都会变为零。,MPEG-2视频编码标准,3.之型扫描与游程编码目的： DCT变换产生的是一8x8的二维数组，为进行传输，还须将其转换为一维排列方式。二维到一维的转换方式（扫描方式）之型扫描(Zig-Zag) 交替扫描之型扫描最常用的一种。由于经量化后，大多数非零DCT系数集中于8x8二维矩阵的左上角，即低频分量区。之型扫

15、描后，这些非零DCT系数就集中于一维排列数组的前部，后面跟着长串的量化为零的DCT系数，这些就为游程编码创造了条件。游程编码只有非零系数被编码。一个非零系数的编码由两部分组成前一部分表示非零系数前的连零的个数(称为游程)，后一部分是那个非零系数。优点之型扫描在大多数情况下出现连零的机会比较多，游程编码的效率就比较高。当一维序列中的后部剩余的DCT系数都为零时，只要用一个“块结束”标志(EOB)来指示，就可结束这一8x8变换块的编码，产生的压缩效果是非常明显。,MPEG-2视频编码标准,4.熵编码目的量化仅生成了DCT系数的一种有效的离散表示，实际传输前，还须对其进行比特流编码，

16、产生用于传输的数字比特流。编码方法的选择定长码：即每个量化值以同样数目的比特表示，方法简单、效率较低。熵编码：是基于编码信号的统计特性，使得平均比特率下降。可以提高编码效率。霍夫曼编码是熵编码中使用较多的一种。 MPEG-2视频压缩系统中采用的就是霍夫曼编码。霍夫曼编码效果在确定了所有编码信号的概率后生产一个码表，对经常发生的大概率信号分配较少的比特表示，对不常发生的小概率信号分配较多的比特表示，使得整个码流的平均长度趋于最短。,MPEG-2视频编码标准,5.运动估计目的用于帧间编码方式，通过参考帧图像产生对被压缩图像的估计。运动估计的准确程度准确程度对帧间编码的压缩效果非常重要。如果估计作的好，被压缩图像与估计图像相减后，只留下很小的值用于传输。运动估计的算法以宏块为单位进行，计算被压缩图像与参考图像的对应位置上的宏块间的位置偏移。这种位置偏移是以运动矢量来描述的。一个运动矢量代表水平和垂直两个方向上的位移。特点运动估计时，P帧和B帧图像所使用的参考帧图像是不同的。前向预测 P帧图像使用前面最近解码的I帧或P帧作参考图像。双向预测 B帧图像使用两帧图像作为预测参考。其中一个参考帧在显示顺序上先于编码帧(前向预测)，另一帧在显示顺序上晚于编码帧(后向预测)， B帧的参考帧在任何情况下都是 I 帧或P帧。,

展开阅读全文