多媒体通信技术基础第四章

资源描述

《多媒体通信技术基础第四章》由会员分享，可在线阅读，更多相关《多媒体通信技术基础第四章（46页珍藏版）》请在金锄头文库上搜索。

1、第4章视频数据的压缩编码第4章恒定速率多媒体信息的编码4.0 引言 4.1 典型的编码器与解码器4.2 速率控制4.3 图像压缩编码的国际标准4.4 声音压缩编码的国际标准第4章视频数据的压缩编码4.0 引言我们在上一章中介绍了数据压缩编码的基本理论与技术，本章则通过实际的视频编码器和解码器的设计，来了解这些理论和技术的具体应用，以及如何在编码器输出保持码流速率的恒定。除此之外，几种典型的视频和音频压缩编码的国际表中也将在这一章中介绍。第4章视频数据的压缩编码4.1典型的编码器与解码器 4.1.1 编码器与解码器结构编码器解码器第4章视频数据的压缩编码视频图像的条（片）与宏块划分对视

2、频图像的压缩编码，是分块进行的。一帧图像，首先分成若干条（片），每条又分为许多宏块；宏块，是基本的处理单元，包含一个亮度块、两个色度信号块；第4章视频数据的压缩编码4.1.2 图像信号的预处理第4章视频数据的压缩编码视频信号并不是逐帧单独压缩、传送，只有其中一部分帧是这样传送，对于那些剩余的帧，只发送实际图像和预测图像的差值（DFD）；运动估值：预测精度取决于对相邻帧间运动的估值；运动补偿：由于估值并不精确，需要发送额外的信息来指明运动部分的预测位置与实际位置的差别；1、运动估值/补偿4.1.3 编码过程第4章视频数据的压缩编码4.1.4 运动估值/补偿模式帧间预测编码是消除时间冗

3、余信息（即各帧图像之间的冗余信息）的一种有效方法，但在解码时，必须有前一帧图像作为参考才能解出当前帧。在有些情况下，例如在接收机刚开机、改换频道或进行录像机式的快进、快退操作时、以及在出现不能纠正的新到错误时，参考帧可能丢失，采用帧间编码的图像就无法进行解码。因此有必要隔一段时间传送I帧只采用帧内编码的图像作为参考图像，使得预测环路能在某一个参考帧丢失后，迅速获得另一个参考帧，从而恢复到正常工作状态。第4章视频数据的压缩编码如右图所表示出的这样一个图像序列，图中I帧表示帧内编码图像，P帧和B帧分别表示采用前向预测和双向预测的图像。P帧由于与其相邻的前1个P帧或I帧来预

4、测， B帧则由前、后相邻的I帧或P 帧预测。使用B帧是为了提高压缩比，但B帧不能作为P帧和后续B帧的参考图像。两个 I帧之间的图像构成一个组成为GOP（Group of Picture）。在一组图像中，P帧和B帧的数目可以根据实际应用的需要选择。举例说明第4章视频数据的压缩编码第4章视频数据的压缩编码1、用于场图像的168预测这种方法是将图像的宏块分成上、下2个168的半块，对每个半块分别进行场间预测。第4章视频数据的压缩编码 4.2速率控制4.2.1 速率控制策略第4章视频数据的压缩编码1、SM3速率控制压缩编码标准MPEG1的仿真模型SM3（Simulation Mo

5、del 3 ）提供了一个简单的速率控制方法。这种方法的基本思想是，首先根据图像序列编码所产生的码流的平均速率应该与信道速率匹配的原则，为每帧图像预先规定好编码的比特数，这称为目标比特分配；然后，在每一帧的编码过程中，通过调整每一个条的量化台阶的大小，使该帧编码实际产生的比特数接近量化参数Qj和该宏块图像的活跃程度（即亮度变化的剧烈程度）两个因素最后确定的。将1616的亮度块划分成4个88的子块，定义该亮度块的空间活动度（Activity Function）为第4章视频数据的压缩编码其中Var_sblk为该宏块中的子块像素值的方差。将actj归一化，得到：式中，avg_act为前

6、1帧的actj的均值。用N_ actj对比特率要求导出的参考量化参数Qj加权，得到该宏块的量化参数值：第4章视频数据的压缩编码第4章视频数据的压缩编码4.2.2 视频缓存证实器第4章视频数据的压缩编码第4章视频数据的压缩编码第4章视频数据的压缩编码4.3 图像压缩编码的国际标准4.3.1 静止图像压缩编码标准JPEGJPEG（Joint Photographic Experts Group）是ISO为制定有关静态图像压缩标准而成立的一个专家组, 现已公布了JPEG标准, 标准号为ISO CD10918。 JPEG作为一种静态图像压缩编码的国际标准, 在实际中得到广泛的应用。 JPE

7、G图像压缩技术具有如下特点: 能够大范围地调节图像压缩率及其相应的图像保真度, 解码器可参数化。使用户在具体应用时可以选择所期望的压缩率/质量比。第4章视频数据的压缩编码能够应用于任何连续色调数字源图像（实际应用中可能遇到的图像有很多种, 故不限制图像的尺寸、色彩级差、像素长宽比等条件）, 不限制图像的景象内容（如复杂性、色彩范围或统计特性）。能够在具有一定能力的CPU上实现所要求的功能, 以利于操纵复杂的计算软件, 并用可接受的硬件成本实现具有高性能要求的应用。第4章视频数据的压缩编码规定了4种运行模式, 以满足各种需要: 顺序方式: 按从左到右、从上到下的顺序对图像进行

8、扫描和编码（先8X8分块，再分别进行DCT、量化、熵编码）。这种模式是基准模式, 各种JPEG实现都要支持这种模式。渐进方式: 对于变换时间较长的扫描器, 按由粗到细的过程 , 以复合扫描顺序进行图像编码。无损方式: 保证准确地恢复图像所有样本值的图像编码。与有损模式相比, 其压缩比低。分层方式: 以多种分辨率进行图像编码, 可直接获得低分辨率图像, 重建复原全图。第4章视频数据的压缩编码JPEG编码方法图2.4 DCT编码和解码过程（a）DCT编码过程; （b） DCT解码过程第4章视频数据的压缩编码4.3.2 视听会议压缩编码标准H.261为了满足在综合数字网络（

9、ISDN）上开展可视通信业务的需要, ITU专门成立了一个可视电话编码规范小组来制定有关视频信号传输编码标准, 并先后完成了H.261和H.263标准的制定工作。 H.261是“p64 kb/s视频编解码器”标准, 其中p的取值范围在130之间, p64 kb/s是速率, 各个通道的数码率为64 kb/s。由于H.261主要是为可视电话和电视会议制定的, 因此, 标准中所建议的视频编码算法应具有实时处理能力, 延时应控制到最小程度。当p=1或2时, 由于数码率较低, 仅能用于桌面上进行面对面直观通信。而当p6时, 由于提高了数码率, 能够传输较复杂的图像, 图像质量也得到改善, 因此更适合

10、电视会议。第4章视频数据的压缩编码表2.2 CIF和QCIF编码格式参数举例 GIFQCIF行数/帧像素数/行行数/帧像素数亮度Y 288360(352)144180(176)色度Cb144180(176)7290(88)色度 Cr 144180(176)7290(88)H.261只对CIF、QCIF两种图像格式进行处理，帧率最高为29.97 帧/秒，最低为10帧/秒；第4章视频数据的压缩编码H.261压缩编码，主要由具有运动补偿的帧间预测、块DCT和霍夫曼编码组成；一般除初始帧为 I 帧外，后续帧为P帧；而且，为了防止信道误码引起的差错积累，每132帧要进行一次帧内编码；第

11、4章视频数据的压缩编码图 4-30 H.261的编码层次第4章视频数据的压缩编码它分为4个层次: 画面、块组（GOB）、宏块（MB）和块。其中, 每个CIF画面有12个GOB, 每个块组由311个宏块组成, 每个宏块由4个88亮度块（Y）和两个88色度块（Cb和Cr各1个）组成, 一个块由88像素点（DCT编码单位）组成。一个QCIF图像有3个GOB, 是CIF的四分之一。这种以块为单位的层次结构对高压缩比视频编码算法来说是至关重要的。每个画面层的数据中都有一个图像标题, 图像标题后是GOB的数据。图像标题包括一个20位的图像起始码以及其它信息。例如, 视频编码格式（CIF或QCIF

12、）、临时标记（帧编号）等。GOB层有一个块组标题, 紧随其后的是宏块数据。块组标题包括一个16位的GOB起始码以及其它信息。例如, GOB的位置、GOB量化信息等。第4章视频数据的压缩编码H. 261 视频编码算法图 H.261编码与解码处理过程 (a) 视频编码器; (b)视频解码器第4章视频数据的压缩编码MPEG标准MPEG（Moving Picture Experts Group）是ISO为制定有关动态图像压缩标准而成立的一个专家组, 现已经公布了多个版本的MPEG标准: MPEG-1、 MPEG-2和MPEG-4, 其中MPEG-1是MPEG标准集的基础, MPEG-2和M

13、PEG-4都是在MPEG-1基础上所作的改进和扩展, 以满足不同的应用要求和环境。 MPEG标准是一个通用标准, 既考虑了应用要求, 又独立于具体的应用。MPEG标准可用于下列数字存储媒体上: 光盘（CD-ROM）、数字录音带（DAT）、磁盘、可写光盘以及通信网络 (综合业务数字网、分组交换网以及局域网等)。第4章视频数据的压缩编码MPEG标准不仅考虑了视频数据压缩, 而且还考虑了音频数据压缩以及二者之间的同步问题。作为MPEG视频压缩算法, 必须具有与存储相适应的性质, 即能够随机访问、快进/快退检索、倒放、音像同步、容错能力、延时限制、可编辑性以及灵活的视频窗口格式。实现这些

14、特性对各种应用都是十分重要的, 因而也构成了MPEG视频压缩算法的基本特征。第4章视频数据的压缩编码4.3.3 数字声像存储压缩编码标准MPEG1 1. MPEG-1 图像组织结构MPEG-1视频压缩算法所面临的一个矛盾是: 在保证图像质量的前提下, 仅靠帧内编码很难达到高压缩比; 而满足随机访问条件的最好方法则是帧内编码。为使高压缩比和随机访问这两方面要求都能得到满足, MPEG-1采取了预测和插值两种帧间编码技术。第4章视频数据的压缩编码为此, MPEG-1将图像编码帧分成三类: I帧（Introcoded frame, 内帧）: 它采用与JPEG相类似的编码方法进行编码, 并且在

15、编码时不必参照其它的帧, 其压缩比是比较低的。 I帧可作为随机访问点以及其它图像编码帧的参照帧。 P帧（Predictively coded frame, 预测帧）: 它需要利用前面的I帧或P帧信息进行编码和解码, 同时又是后续P帧的参照帧。它利用了瞬时冗余特性, 可获得较高的压缩比。然而只有对所参照的I 帧和P帧完成解码后才能访问P帧。 B帧（Bidirectionally predictively coded frame, 双向预测帧）: 它需要利用前面和后面的I帧、 P帧信息进行编码和解码, 但它本身不可作为参照帧。由于B帧使用了双向运动补偿预测技术, 故它的压缩比是最高的。第

16、4章视频数据的压缩编码图 2.8 MPEG-1视频帧编码及关系第4章视频数据的压缩编码图4-31 MPEG-1 视频流的编码层次第4章视频数据的压缩编码4.3.4 通用视频及伴音压缩编码标准MPEG-2（H.262）支持2100 Mb/s速率的数字视频传输。可用于支持高清晰度电视（HDTV）格式。定义一种层次可伸缩的规范, 用于支持全球范围的TV/HDTV、视频传输系统以及其它需要高级编码的应用。向下兼容现存的MPEG-1和H.261标准。扩展了MPEG-1的运动补偿预测方法, 并且允许其它的DCT系数。定义了可伸缩的、层次化的编码算法, 使普通TV和HDTV系统可以使用相同的数据流。第4章视频数据的压缩编码MPEG-2标准主要由四部分组成: MPEG-2视频、 MPEG-2音频、MPEG-2系统和MPEG-2一致性测试规范。从概念上讲, MPEG-2和MPEG-1很相似,

展开阅读全文