数字图像处理 第八章课件

上传人:豆浆 文档编号:4621994 上传时间:2017-08-06 格式:PPT 页数:147 大小:3.24MB
返回 下载 相关 举报
数字图像处理 第八章课件_第1页
第1页 / 共147页
数字图像处理 第八章课件_第2页
第2页 / 共147页
数字图像处理 第八章课件_第3页
第3页 / 共147页
数字图像处理 第八章课件_第4页
第4页 / 共147页
数字图像处理 第八章课件_第5页
第5页 / 共147页
点击查看更多>>
资源描述

《数字图像处理 第八章课件》由会员分享,可在线阅读,更多相关《数字图像处理 第八章课件(147页珍藏版)》请在金锄头文库上搜索。

1、2017/10/1,第八章 图像压缩编码,2017/10/1,8.1 概述,8.1.1 视频压缩编码的必要性 现以一路电视信号为例,看看将它数字化后的数码率,按CCIR(Consultative Committee International Radio)制定的CCIR601标准,数字化后的分辨率为720576,每秒25帧,Y:U:V为4:2:2,若以8bit表示Y信号,则每像素占16bit,数码率为165.9Mbps。以64kbps作为一个数字话路,若不加压缩,为传输一路电视要占用2592个有效数字话路。这在实际应用中是难以接受的。,2017/10/1,若用一个容量为1GB的硬盘或CDROM

2、来存贮这样的数据,则只能存贮不到1分钟的图像,并且,所需的高数据呑吐率是一般的硬盘和CDROM难以达到的。若不加压缩,HDTV信号的数码率可接近1Gbps,更加惊人。再以指纹库为例,若以(512512)8bit的灰度图像来存贮一个手指的指纹,一个40万人的指纹库,每人十指,则共需1000GB的存贮量。由这些例子就可以看出图像压缩编码的必要性。,2017/10/1,图像编码技术的进展已使这些制约因素不再成为瓶颈,从而推动了各类图像通信系统的推广和应用。 图像编码是各类图像信息传输、存贮产品的一项核心技术。,2017/10/1,8.1.2 图像压缩编码的目的 图像编码是一种信源编码,其信源是各种类

3、型的图像信息。图像压缩编码的目的是以尽量少的比特数表征图像,同时保持复原图像的质量,使它符合预定应用场合的要求。 节省图像存储器的容量、减少信道容量、缩短图像处理时间。但这是以压缩和解压的时间为代价的。,2017/10/1,8.1.3 图像压缩编码的可行性 图像数据可以进行压缩有几个方面的原因。首先,原始图像数据是高度相关的,存在很大的冗余度。数据冗余造成比特数浪费,消除这些冗余可以节约码字,也就达到了数据压缩的目的。,2017/10/1,1) 空间冗余度:大多数图像内相邻像素之间有较大的相关性。2) 时间冗余度:序列图像前后帧之间的较大的相关性。3) 频率域冗余度:多光谱遥感图像各谱间有相关

4、性。,2017/10/1,4) 符号冗余度:若用相同码长表示不同出现概率的符号也会造成比特数的浪费,这种浪费称为符号冗余度。如果采用可变长编码技术,对出现概率高的符号用短码字表示,对出现概率低的符号用长码字,就可消除符号冗余度,从而节约码字。,2017/10/1,5) 视觉冗余度:允许图像编码有一定的失真也是图像可以压缩的一个重要原因。在许多应用场合,并不要求经压缩及复原以后的图像和原图像完全相同,而允许有少量失真。只要这些失真并不被人眼所察觉,在许多情况下是完全可以接受的。这种有失真的编码提供了十分有利的条件。,2017/10/1,6) 知识冗余度:在某些特定的应用场合,编码对象的某些特性可

5、预先知道。例如,在可视电话中,编码对象为人的头肩像。这时,可以利用对编码对象的先验知识为编码对象建立模型。通过提取模型参数,对参数进行编码而不对图像直接进行编码,可以达到非常高的压缩比。这是模型编码的基本思想。,2017/10/1,图像编码技术就是要把种种压缩的可能性变为现实。,2017/10/1,8.1.4 图像压缩编码一般框图,图像编码的过程可以概括成图1所示的三个步骤,原始图像经映射变换后的数据,经量化器和熵编码器成为码流输出。,图1图像压缩编码的一般框图,2017/10/1,1) 映射变换,映射变换是图像编码的一个核心部分,它决定了量化和编码的对象类型,所以可以据此对编码方法进行分类。

6、 映射变换目的是通过映射改变图像数据的特性,使之更有利于压缩编码。,2017/10/1,这样做的一般优于直接对原图像进行量化编码。因为图像数据在相邻像素间有较大的相关性,不管原图像明暗如何,相邻像素灰度差总是分布在零附近。进一步的统计表明,差值信号的分布接近拉普拉斯分布,其标准差比原始图像的标准差要小的多,因而对它进行量化编码所需的比特数就较少。实际上,求差值的过程减少了相邻像素间的相关性,从而减少了冗余度,因此可以实现压缩。,2017/10/1,在实际应用中,映射变换的方法种类繁多,还可以更复杂。如在变换编码中,先将图像分成若干个nn大小的子块,然后进行映射变换。在这种情况下的映射变换是对各

7、子块进行某种正交变换。而量化和编码是对变换后所得系数进行的。,2017/10/1,2) 量化器 在限失真编码中要对映射后的数据进行量化。若量化是对映射后的数据逐个地进行的,则称标量量化;若量化是成组地进行的,则称为矢量量化。 量化器的引入是图像编码产生失真的根源。量化总是会造成某些信息丢失,形成失真,即量化失真或量化噪声。为使失真小,应量化精细,但压缩比就高不了。这是一对矛盾,应选用恰当的量化级数和量化曲线形状来缓解矛盾。,2017/10/1,值得注意的是,对于同样的量化失真,由不同的映射变换与反变换会引起不同性质的复原图像的失真,人眼对某些性质的失真敏感而对另一些性质的失真不敏感。,2017

8、/10/1,3) 熵编码器 这一步是用来消除符号编码冗余度的。它一般不产生失真。理想的情况是使编出的码流的平均码长等于量化后的数据的信息熵。常用的编码方法有许多种,例如分组码:行程码(RLC)和变长码(VLC);不分组码:算术码。 行程码传输的是数据块行程的长度而不是数据本身。例如要传200个0,用行程码时改为传行程码标记和行程长度值“200”。,2017/10/1,在变长码中最常用的是霍夫曼(Huffman)码,基本原则是对出现概率大的数值用短码来编,对出现概率小的数值用长码来编,从而使平均码长减少,降低码率。在实际编码器中常把RCL和Huffman码结合起来,称为Huffman行程码,在H

9、.261,JPEG,MPEG等国际标准中就用到它。而算术码则用于JPEG,H.263等国际标准中。,2017/10/1,4) 上述三个步骤之间是相互联系相互制约的 对有些编码方法,如预测编码或变换编码,映射变换后数据量并没有减少,甚至因动态范围的加大而使数据量略有增加。但它为后两步作了准备,使它们能有效发挥作用。而在模型编码中,经映射变换后得到的模型参数,其数据量已大大小于原始图像,即第一步已经实现了很大的压缩。后面的量化编码则是作进一步的压缩。其情况和变换编码有很大的不同。,2017/10/1,5) 误码可能导致码流结构的变化,从而不能正确解码 如果码流在信道中传输时产生误码,就会造成复原图

10、像质量的下降。有时一个比特的误码会造成一大片复原图像的错误,这种现象称误码扩散现象。按信息论的观点,压缩得越多、冗余度越小的码流越难抵抗误码的影响。在实用的图像编码算法中必须对误码扩散提出制约条件。一个好的熵编码器应该有自同步能力,能够在受到误码影响后经过一定的码后仍能自动回到正确解码路径上来,而不会死机或一直错下去。,2017/10/1,8.1.5 数字视频压缩编码技术,数字视频压缩编码技术大致可划分为二代:以香农信息论为基础,着眼于图像信号的统计信号特性来设计编码器的波形编码方式,如统计编码法、预测编码法、变换编码法、矢量量化编码法、子带小波编码法、神经网络编码法等,统称为第一代图像压缩编

11、码技术;而将模型编码方式,如图像的轮廓纹理方法、分形基的编码方法、模型基编码等,统称为第二代图像压缩编码技术。,2017/10/1,第一代的编码方法具有如下共同特征:接收端得到的图像中每一像素,与原始图像中对应的像素是相似的;把图像分解成一些事先确定的固定大小的像素块,这些块的划分方法与图像内容无关,例如,88为一个像素块;通过运动补偿(MC)技术减少时间冗余度,而MC并不考虑图像内容的结构;只利用了人眼视觉(HVS)很少一些特性。,2017/10/1,由于人眼视觉系统是一种最优的图像编码系统,人眼视觉特性应该与图像中传递的本质特征一致,基于模型的编码方法正是基于这一思路发展而来的。1985年

12、正式提出了第二代图像编码。,2017/10/1,从根本上讲,实行图像编码可以分成两步:第一步,把图像数据变成一个消息序列;第二步,把码字分配给这些消息。第一代方法重点在码字分配。第二代方法则着重于图像如何表示为消息序列,这时图像中被编码的实体不再是按像素或像素块(88或1616)来划分,而是按其内容进行划分。此外,第二代方法还应考虑HVS,其码率被进一步压缩,质量仍达到人们可接收水平。,2017/10/1,8.2 熵编码方法,8.2.1 基本概念 数据量是否等于信息量?,数据存在冗余(空间冗余、时间冗余 、编码冗余、结构冗余、知识冗余、视觉冗余等) 信息量与数据量的关系 I=D-du其中 I,

13、 D,du 分别是信息量、数据量、冗余量。,2017/10/1,信息和熵 信息是用不确定性的量度定的。一个消息的可能性愈小,其信息量愈多;而消息的可能性愈大,其信息量愈少。 信息量是指从N个相等可能事件中选出一个事件所需要的信息度量或含量。例如,要从64个数中选定某一个数,可先提问“是否大于32?”在64个数中选定某一个数所需的信息量是,2017/10/1,设: 从N个数中选定一个数x的概率为P(x),假定选定任意一个数的概率都相等,即 ,因此定义信息量熵:如果将信源所有可能事件的信息量进行平均,就得到信息的“熵”(entropy), 熵就是平均信息量。,2017/10/1,1) 图像熵(En

14、tropy) 熵是随机变量集合的随机性程度的度量。最小随机的情况是随机变量具有概率为1,因而结果已预先知道,H=0。,2017/10/1,最大随机的情况是所有的事件是等可能性的。在此情况下, 并且因此: 对于M个随机变量的熵可以处在0到 的范围中。,2017/10/1,设图像像素灰度级集合为(W1,W2,WK,.,WM),其对应的概率分别为P1,P2,PK,.,PM,则熵H为 (1) 熵值反映了图像的平均信息量,即图像中各个灰度级比特数的统计平均值。熵的单位是位/字符(bits per symbol)。,2017/10/1,(1)式的前提条件是像素的灰度级互不相关,即为无记忆信源熵值,称为0阶

15、熵H0(.);其含义是将一个输入序列的每一个编码所要求的平均比特数的界限。 对于有记忆信源,即后续的输入不是独立的,则对每一个输入来讲,与输入序列相联系的熵小于单独输入之熵。此时,需要考虑联合概率密度函数或条件概率: (2a) (2b),2017/10/1,其含义是将两个输入序列编码时,即连续输入两个量化级而输出一个码字,所需的比特数的下限。称为1阶熵H1(.)。同理可推得高阶熵。,2017/10/1,结论:H0(.)H1(.)H2(.) 信源熵是进行无失真编码的理论极限。低于此极限的无失真编码方法是不存在的。 使用高阶熵可以获得更高的压缩比。 在实际应用中,我们不追求较高阶熵的原因:求高阶概率所需的计算量很大;在编码器中,实际上执行的是一种映射操作,通常将高度相关的输入像素变换成一个较少相关的系数集合。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号