多媒体数据压缩编码标准.ppt

资源描述

《多媒体数据压缩编码标准.ppt》由会员分享，可在线阅读，更多相关《多媒体数据压缩编码标准.ppt（123页珍藏版）》请在金锄头文库上搜索。

1、1,第4讲多媒体数据压缩编码标准,2,4.1 静态图像压缩标准 JPEG,3,4.1.1 JPEG标准的主要内容,ISO/IEC 10918号标准“多灰度连续色调静态图像压缩编码”即JPEG标准，选定ADCT作为静态图像压缩的标准化算法。该标准为保证通用性，包含以下两种方式：空间方式可逆编码空间方式对于基本系统和扩展系统来说，被称为独立功能。 DCT方式非可逆编码，包含基本系统(必须保证的功能)和扩展系统(扩充功能),4,基本系统是实现DCT编码与解码所需的最小功能集，大多数的应用系统只要用此标准，就能基本上满足要求。扩展系统是为了满足更为广阔领域的应用要求而设置的。,5

2、,4.1.2 JPEG静态图像压缩算法 1. 基于DPCM的无失真编码,预测器,熵编码器,表说明,无失真编码器,源图像数据,压缩图像数据,图1 无失真编码简化框图,6,基于DPCM的无失真编码优点是硬件易实现，重建图像质量好。缺点是压缩比太低，大约为2：1。,7,工作原理是对X的预测值X，将X-X进行无失真熵编码。对X的求法见图给出的预测方式。,(a) X邻域,(b) 预测方式,图2 预测器,8,2. 基于DCT的有失真压缩编码,离散余弦变换量化处理 DC系数的编码和AC系数的行程编码熵编码,9,图3 基于DCT编码过程,FDCT,熵编码器,表说明,无失真编码器,源图像数据,压缩图像数

3、据,量化器,表说明,88块,（YUV每个分量）,10,图4 解码过程,熵解码器,IDCT,表说明,解码器,逆量化器,表说明,88块,压缩图像数据,恢复的图像数据,11,离散余弦变换,(1)首先把原始图像顺序分割成88子块； (2)采样精度为P位(二进制)，把0， 2P-1范围的无符号数变换成-2P-1，2P-1范围的有符号数，作为离散余弦正变换(FDCT)的输入； (3)在输出端经离散余弦逆变换(IDCT)后又得到一系列88子块，需将数值范围-2P-1，2P-1变换回0， 2P-1来重构图像。,12,这里用的88 FDCT的数学定义为： F(u， v)=(1/4)C(u) C(v) x=

4、07y=07 f(x，y) cos(2x+1)u/16)cos(2y+1)v/16) 88 IDCT的数学定义为： f(x， y)= (1/4)u=07v=07 C(u)C(v)F(u，v) cos(2x+1)u/16)cos(2y+1)v/16) 其中：C(u)， C(v)= 1/2 当u， v=0 C(u)， C(v)=1 其他下面的编码针对FDCT输出的64个基信号的幅值(F(0，0)，F(7，7)称作DCT系数)来进行,13,量化处理,量化是一个“多到一”的过程，失真原因关键是找最小量化失真的量化器， JPEG采用线性均匀量化器，定义为对64个DCT系数除以量化步长，然后四舍五入

5、取整： FQ(u， v)=Integer RoundF(u， v)/Q(u， v) Q(u，v)是量化器步长，它是量化表的元素。量化表元素随DCT系数的位置和彩色分量不同有不同的值，量化表尺寸为88与64个变换系数一一对应。这个量化表应由用户规定(JPEG给出参考值-见后面表格)，并作为编码器的一个输入。,14,表1 亮度量化表,15,表2 色度量化表,16,量化的作用是在一定主观保真度图像质量前提下，丢掉那些对视觉影响不大的信息，通过量化可调节数据压缩比。,17,DC系数的编码,64个变换系数经量化后，坐标u=v=0的F(0， 0)称DC系数(直流分量)，它即64个空域图像采样值的平

6、均值。相邻88块之间DC系数有强相关性。JPEG对量化后的DC系数采用DPCM 编码，即对DIFF= DCi-DCi-1编码。,blocki-1,blocki,DCi-1,DCi,DC系数差分编码,18,AC系数的行程编码,其余63个交流系数(AC)采用行程编码。从左上方AC0，1开始沿对角线方向“Z”字形扫描直到AC7，7扫描结束，这样可增加行程中连续0的个数。 AC系数编码的码字用两个字节表示，如图所示：,图5 Z字形扫描,19,图6 AC系数行程编码码字,两个非0值间连续0的个数,表示下一个非0值需要的bit数,下一个非0实际值,7,4,3,0,字节1,字节2,例子：对“，3

7、，0，0，0，0，0，12，0，0，”编码，(5，4)，(12)，.,20,熵编码,为了进一步压缩数据，需对DC码和AC行程编码的码字再做基于统计特性的熵编码。 JPEG建议的熵编码是Huffman编码和自适应二进制算术编码。熵编码可分成两步进行：把DC码和AC行程码转换为中间符号序列给这些符号赋以变长码字,21,AC系数熵编码的中间格式,熵编码的中间格式由两个符号组成：符号1： (行程，尺寸) 符号2： (幅值) 第一个信息参数“行程”表示前后两个非0的AC系数之间连续0的个数。第二个信息参数“尺寸”是后一个非0的AC系数幅值编码所需比特数。,22,行程取值范围为115，超过1

8、5时用扩展符号1 (15， 0)来扩充， 63个AC系数最多增加3个扩展符号1。编码结束时用(0，0)表示。 “尺寸”取值范围为010。 “幅值”用以表示非0的AC系数的值，范围为-210， 210-1(最长10bit)，结构形式如下表所示。,23,1 -1，1 2 -3.-2，2.3 3 -7.-4，4.7 4 -15.-8，8.15 6 7 8 9 -511.-256，256511 10 -1023.-512，5121023,表3 符号2结构,24,DC系数的熵编码,对于直流分量DC也有类似于AC系数的编码格式符号1：(尺寸) 符号2：(幅值) “尺寸”表示DC差值的幅值编码所需的比

9、特数，而“幅值”表示DC差值的幅值，范围为-211，211-1。可在表3中多加一级，幅值尺寸以1到11比特表示。将63个AC系数表示成为符号1和符号2序列，其中连续0的长度超过15时，有多个符号1；块结束(EOB)时仅有一个符号1(0，0)。,25,“4，0，0，0，0，0，0，0，0，3，0”. 4，3之间有31个0. (15，0)，(15，0)，(1，0)，(3) 可变长度熵编码就是对上述序列进行变长编码。对DC系数、AC系数中的符号1采用Huffman表中的变长码编码(VLC)，这里Huffman变长码表必须作为JPEG编码器输入。符号2用码字长度在表3中给出的变长整数VL

10、I码编码。VLI是变长码，但不是Huffman码。VLI的长度存放在VLC中， JPEG提供VLI码字表供用户使用,26,JPEG提供2套Huffman码表：亮度和色度。每套又有DC表和AC表各1个。共有4个表。表定义（亮度DC系数码表） 16B说明码字长度： X00 01 05 01 01 01 01 01 01 00 00 00 00 00 00 00 第i个(1-16)元素值表示长度为i的Huffman码个数。紧跟一组值说明亮度表分类： X00 01 02 03 04 05 06 07 08 09 0A 0B,27,表4 亮度DC系数表,28,表5 色度DC系数表,29,表6 JP

11、EG压缩效果评价,30,3. 基于DCT的累进操作方式编码,顺序方式：每个图像分量的编码一次扫描完成的；累进方式：图像分量编码要经过多次扫描才完成。累进方式第一次扫描只进行一次粗糙图像的扫描压缩，以相对于总的传输时间快得多的时间传输粗糙图像，并重建一帧质量较低的可识别图像；在随后的扫描中再对图像作较细的压缩，这时只传递增加的信息，可重建一幅质量提高一些的图像。这样不断累进，直到满意的图像为止。,31,需在量化器的输出与熵编码的输入之间，增加一个足以存储量化后DCT系数的缓冲区，对缓冲区中存储的DCT系数多次扫描，分批编码。有以下两种累进方式：频谱选择法扫描中只对64

12、个DCT变换系数中某些频带的系数进行编码、传送，随后对其他频带编码、传送，直到全部系数传送完毕为止。按位逼近法沿着DCT量化系数有效位(表示系数精度的位数)方向分段累进编码。如第一次扫描只取最高有效位的n位编码、传送，然后对其余位进行编码、传送。,32,4. 基于DCT的分层操作方式,分层方式是对一幅原始图像的空间分辨率，分成多个分辨率进行“锥形”的编码方法，水平(垂直)方向分辨率的下降以2的倍数因子改变。,图7 分层操作方式,33,分层操作方式的过程,(1)把原始图像空间分辨率降低。 (2)对已降低分辨率的图像采用基于DCT的顺序方式、累进方式或无失真预测编码中的任何一种编码方法进

13、行编码。 (3)对低分辨率的图像解码，重建图像，使用插值滤波器，对它插值，恢复图像的水平和垂直分辨率。 (4)把分辨率已升高的图像作为原始图像的预测值，对它们的差值采用基于DCT的顺序方式、累进方式或用无失真方式进行编码。 (5)重复(3)、(4)直到图像达到完整的分辨率编码。,34,4.1.2 JPEG2000简介,基于Internet网络的多媒体应用，给图像编码提出了新的要求. 2000年12月公布的新的JPEG 2000标准(ISO 15444)，其目标是在高压缩率的情况下，如何保证图像传输的质量。 JPEG中采用DCT变换考察整个时域过程的频域特征或整个频域过程的时域特征。JPE

14、G2000采用以小波变换为主的多分辨率编码方式。 JPEG2000统一了面向静态图像和二值图像的编码方式，是既支持低比率压缩又支持高比率压缩的通用编码方式。,35,该算法主要特点如下： (1)高压缩率。与JPEG相比，可修复约30的速率失真特性。JPEG和JPEG2000在压缩率相同时， JPEG2000的信噪比将提高30左右； (2)无损压缩。预测编码作为对图像进行无损编码的成熟方法被集成在JPEG2000中； (3)渐进传输。JPEG2000可实现以空间清晰度和信噪比为首的各种可调节性，从而实现渐进传输，即具有“渐现”特性. (4)感兴趣区域压缩。JPEG2000 支持所谓的“感兴趣区域

15、”。,36,4.2 运动图像压缩标准MPEG,37,4.2.1 MPEG标准简介,MPEG标准是面向运动图像压缩的一个系列标准。最初MPEG专家组的工作项目是3个，即在1.5Mbps， 10Mbps，40Mbps传输速率下对图像编码，分别命名为MPEG-1，MPEG-2， MPEG-3。MPEG-3后被取消. 为了满足不同的应用要求， MPEG又将陆续增加其他一些标准MPEG-4，MPEG-7，MPEG-21。,38,MPEG算法编码过程和解码过程是一种非镜象对称算法(不对称)，解码过程要比编码过程相对简单些。 MPEG-1和MPEG-2只规定了解码的方案，重点将解码算法标准化。因而用

16、硬件实现MPEG算法时，人们首先实现MPEG的解码器，如C-Cube公司CL450解码器系列。最近几年，随着MPC性能的提高，软件解压功能也逐渐得到支持。,39,4.2.2 MPEG-1系统,“用于数字存储媒体运动图像及其伴音速率为1.5Mbps的压缩编码”简称MPEG-1，作为ISO/IEC 11172号建议于1992年通过。主要用于在CD-ROM存储运动视频图像，它针对标准分辨率(NTSC制为352240； PAL制为352288)的图像进行压缩，每秒30帧画面，具备CD音质。它还用于数字电话网络上的视频传输，如非对称数字用户线路(ADSL)、视频点播、教育网络等。使用MPEG-1的压缩算法，可将一部120分钟长的电影压缩到1.2GB

展开阅读全文

多媒体数据压缩编码标准.ppt

最新文档