多媒体数据压缩编码标准.ppt

上传人:灯火****19 文档编号:137320967 上传时间:2020-07-07 格式:PPT 页数:123 大小:827KB
返回 下载 相关 举报
多媒体数据压缩编码标准.ppt_第1页
第1页 / 共123页
多媒体数据压缩编码标准.ppt_第2页
第2页 / 共123页
多媒体数据压缩编码标准.ppt_第3页
第3页 / 共123页
多媒体数据压缩编码标准.ppt_第4页
第4页 / 共123页
多媒体数据压缩编码标准.ppt_第5页
第5页 / 共123页
点击查看更多>>
资源描述

《多媒体数据压缩编码标准.ppt》由会员分享,可在线阅读,更多相关《多媒体数据压缩编码标准.ppt(123页珍藏版)》请在金锄头文库上搜索。

1、1,第4讲 多媒体数据压缩编码标准,2,4.1 静态图像压缩标准 JPEG,3,4.1.1 JPEG标准的主要内容,ISO/IEC 10918号标准“多灰度连续色调静态图像压缩编码”即JPEG标准, 选定ADCT作为静态图像压缩的标准化算法。 该标准为保证通用性,包含以下两种方式: 空间方式 可逆编码 空间方式对于基本系统和扩展系统来说,被称为独立功能。 DCT方式 非可逆编码, 包含基本系统(必须保证的功能)和扩展系统(扩充功能),4,基本系统是实现DCT编码与解码所需的最小功能集, 大多数的应用系统只要用此标准, 就能基本上满足要求。 扩展系统是为了满足更为广阔领域的应用要求而设置的。,5

2、,4.1.2 JPEG静态图像压缩算法 1. 基于DPCM的无失真编码,预测器,熵编码器,表说明,无失真编码器,源图像数据,压缩图像数据,图1 无失真编码简化框图,6,基于DPCM的无失真编码优点是硬件易实现,重建图像质量好。 缺点是压缩比太低, 大约为2:1。,7,工作原理是对X的预测值X,将X-X进行无失真熵编码。对X的求法见图给出的预测方式。,(a) X邻域,(b) 预测方式,图2 预测器,8,2. 基于DCT的有失真压缩编码,离散余弦变换 量化处理 DC系数的编码和AC系数的行程编码 熵编码,9,图3 基于DCT编码过程,FDCT,熵编码器,表说明,无失真编码器,源图像数据,压缩图像数

3、据,量化器,表说明,88块,(YUV每个分量),10,图4 解码过程,熵解码器,IDCT,表说明,解码器,逆量化器,表说明,88块,压缩图像数据,恢复的图像数据,11,离散余弦变换,(1)首先把原始图像顺序分割成88子块; (2)采样精度为P位(二进制), 把0, 2P-1范围的无符号数变换成-2P-1,2P-1范围的有符号数, 作为离散余弦正变换(FDCT)的输入; (3)在输出端经离散余弦逆变换(IDCT)后又得到一系列88子块, 需将数值范围-2P-1,2P-1变换回0, 2P-1来重构图像。,12,这里用的88 FDCT的数学定义为: F(u, v)=(1/4)C(u) C(v) x=

4、07y=07 f(x,y) cos(2x+1)u/16)cos(2y+1)v/16) 88 IDCT的数学定义为: f(x, y)= (1/4)u=07v=07 C(u)C(v)F(u,v) cos(2x+1)u/16)cos(2y+1)v/16) 其中:C(u), C(v)= 1/2 当u, v=0 C(u), C(v)=1 其他 下面的编码针对FDCT输出的64个基信号的幅值(F(0,0),F(7,7)称作DCT系数)来进行,13,量化处理,量化是一个“多到一”的过程,失真原因 关键是找最小量化失真的量化器, JPEG采用线性均匀量化器,定义为对64个DCT系数除以量化步长, 然后四舍五入

5、取整: FQ(u, v)=Integer RoundF(u, v)/Q(u, v) Q(u,v)是量化器步长,它是量化表的元素。量化表元素随DCT系数的位置和彩色分量不同有不同的值,量化表尺寸为88与64个变换系数一一对应。 这个量化表应由用户规定(JPEG给出参考值-见后面表格), 并作为编码器的一个输入。,14,表1 亮度量化表,15,表2 色度量化表,16,量化的作用是在一定主观保真度图像质量前提下,丢掉那些对视觉影响不大的信息,通过量化可调节数据压缩比。,17,DC系数的编码,64个变换系数经量化后, 坐标u=v=0的F(0, 0)称DC系数(直流分量), 它即64个空域图像采样值的平

6、均值。 相邻88块之间DC系数有强相关性。JPEG对量化后的DC系数采用DPCM 编码, 即对DIFF= DCi-DCi-1编码。,blocki-1,blocki,DCi-1,DCi,DC系数差分编码,18,AC系数的行程编码,其余63个交流系数(AC)采用行程编码。 从左上方AC0,1开始沿对角线方向“Z”字形扫描直到AC7,7扫描结束, 这样可增加行程中连续0的个数。 AC系数编码的码字用两个字节表示,如图所示:,图5 Z字形扫描,19,图6 AC系数行程编码码字,两个非0值间 连续0的个数,表示下一个 非0值需要的bit数,下一个非0实际值,7,4,3,0,字节1,字节2,例子:对“,3

7、,0,0,0,0,0,12,0,0,”编码 ,(5,4),(12),.,20,熵编码,为了进一步压缩数据,需对DC码和AC行程编码的码字再做基于统计特性的熵编码。 JPEG建议的熵编码是Huffman编码和自适应二进制算术编码。 熵编码可分成两步进行: 把DC码和AC行程码转换为中间符号序列 给这些符号赋以变长码字,21,AC系数熵编码的中间格式,熵编码的中间格式由两个符号组成: 符号1: (行程,尺寸) 符号2: (幅值) 第一个信息参数“行程”表示前后两个非0的AC系数之间连续0的个数。 第二个信息参数“尺寸”是后一个非0的AC系数幅值编码所需比特数。,22,行程取值范围为115, 超过1

8、5时用扩展符号1 (15, 0)来扩充, 63个AC系数最多增加3个扩展符号1。编码结束时用(0,0)表示。 “尺寸”取值范围为010。 “幅值”用以表示非0的AC系数的值, 范围为-210, 210-1(最长10bit), 结构形式如下表所示。,23,1 -1,1 2 -3.-2,2.3 3 -7.-4,4.7 4 -15.-8,8.15 6 7 8 9 -511.-256,256511 10 -1023.-512,5121023,表3 符号2结构,24,DC系数的熵编码,对于直流分量DC也有类似于AC系数的编码格式 符号1:(尺寸) 符号2:(幅值) “尺寸”表示DC差值的幅值编码所需的比

9、特数, 而“幅值”表示DC差值的幅值, 范围为-211,211-1。可在表3中多加一级, 幅值尺寸以1到11比特表示。 将63个AC系数表示成为符号1和符号2序列,其中连续0的长度超过15时,有多个符号1; 块结束(EOB)时仅有一个符号1(0,0)。,25,“4,0,0,0,0,0,0,0,0,3,0”. 4,3之间有31个0. (15,0),(15,0),(1,0),(3) 可变长度熵编码就是对上述序列进行变长编码。 对DC系数、AC系数中的符号1采用Huffman表中的变长码编码(VLC),这里Huffman变长码表必须作为JPEG编码器输入。 符号2用码字长度在表3中给出的变长整数VL

10、I码编码。VLI是变长码,但不是Huffman码。VLI的长度存放在VLC中, JPEG提供VLI码字表供用户使用,26,JPEG提供2套Huffman码表: 亮度和色度。每套又有DC表和AC表各1个。共有4个表。 表定义(亮度DC系数码表) 16B说明码字长度: X00 01 05 01 01 01 01 01 01 00 00 00 00 00 00 00 第i个(1-16)元素值表示长度为i的Huffman码个数。 紧跟一组值说明亮度表分类: X00 01 02 03 04 05 06 07 08 09 0A 0B,27,表4 亮度DC系数表,28,表5 色度DC系数表,29,表6 JP

11、EG压缩效果评价,30,3. 基于DCT的累进操作方式编码,顺序方式: 每个图像分量的编码一次扫描完成的; 累进方式: 图像分量编码要经过多次扫描才完成。 累进方式 第一次扫描只进行一次粗糙图像的扫描压缩, 以相对于总的传输时间快得多的时间传输粗糙图像, 并重建一帧质量较低的可识别图像; 在随后的扫描中再对图像作较细的压缩, 这时只传递增加的信息,可重建一幅质量提高一些的图像。这样不断累进, 直到满意的图像为止。,31,需在量化器的输出与熵编码的输入之间,增加一个足以存储量化后DCT系数的缓冲区,对缓冲区中存储的DCT系数多次扫描, 分批编码。 有以下两种累进方式: 频谱选择法 扫描中只对64

12、个DCT变换系数中某些频带的系数进行编码、传送, 随后对其他频带编码、传送, 直到全部系数传送完毕为止。 按位逼近法 沿着DCT量化系数有效位(表示系数精度的位数)方向分段累进编码。如第一次扫描只取最高有效位的n位编码、传送, 然后对其余位进行编码、传送。,32,4. 基于DCT的分层操作方式,分层方式是对一幅原始图像的空间分辨率,分成多个分辨率进行“锥形”的编码方法,水平(垂直)方向分辨率的下降以2的倍数因子改变。,图7 分层操作方式,33,分层操作方式的过程,(1)把原始图像空间分辨率降低。 (2)对已降低分辨率的图像采用基于DCT的顺序方式、累进方式或无失真预测编码中的任何一种编码方法进

13、行编码。 (3)对低分辨率的图像解码,重建图像,使用插值滤波器,对它插值,恢复图像的水平和垂直分辨率。 (4)把分辨率已升高的图像作为原始图像的预测值,对它们的差值采用基于DCT的顺序方式、累进方式或用无失真方式进行编码。 (5)重复(3)、(4)直到图像达到完整的分辨率编码。,34,4.1.2 JPEG2000简介,基于Internet网络的多媒体应用, 给图像编码提出了新的要求. 2000年12月公布的新的JPEG 2000标准(ISO 15444), 其目标是在高压缩率的情况下, 如何保证图像传输的质量。 JPEG中采用DCT变换考察整个时域过程的频域特征或整个频域过程的时域特征。JPE

14、G2000采用以小波变换为主的多分辨率编码方式。 JPEG2000统一了面向静态图像和二值图像的编码方式, 是既支持低比率压缩又支持高比率压缩的通用编码方式。,35,该算法主要特点如下: (1)高压缩率。与JPEG相比,可修复约30的速率失真特性。JPEG和JPEG2000在压缩率相同时, JPEG2000的信噪比将提高30左右; (2)无损压缩。预测编码作为对图像进行无损编码的成熟方法被集成在JPEG2000中; (3)渐进传输。JPEG2000可实现以空间清晰度和信噪比为首的各种可调节性,从而实现渐进传输,即具有“渐现”特性. (4)感兴趣区域压缩。JPEG2000 支持所谓的“感兴趣区域

15、”。,36,4.2 运动图像压缩标准MPEG,37,4.2.1 MPEG标准简介,MPEG标准是面向运动图像压缩的一个系列标准。 最初MPEG专家组的工作项目是3个,即在1.5Mbps, 10Mbps,40Mbps传输速率下对图像编码, 分别命名为MPEG-1,MPEG-2, MPEG-3。MPEG-3后被取消. 为了满足不同的应用要求, MPEG又将陆续增加其他一些标准MPEG-4,MPEG-7,MPEG-21。,38,MPEG算法编码过程和解码过程是一种非镜象对称算法(不对称), 解码过程要比编码过程相对简单些。 MPEG-1和MPEG-2只规定了解码的方案, 重点将解码算法标准化。因而用

16、硬件实现MPEG算法时, 人们首先实现MPEG的解码器,如C-Cube公司CL450解码器系列。 最近几年,随着MPC性能的提高,软件解压功能也逐渐得到支持。,39,4.2.2 MPEG-1系统,“用于数字存储媒体运动图像及其伴音速率为1.5Mbps的压缩编码”简称MPEG-1, 作为ISO/IEC 11172号建议于1992年通过。 主要用于在CD-ROM存储运动视频图像, 它针对标准分辨率(NTSC制为352240; PAL制为352288)的图像进行压缩, 每秒30帧画面, 具备CD音质。 它还用于数字电话网络上的视频传输, 如非对称数字用户线路(ADSL)、视频点播、教育网络等。 使用MPEG-1的压缩算法, 可将一部120分钟长的电影压缩到1.2GB

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号