河北科技大学多媒体通信技术基础 第三章.ppt

上传人:今*** 文档编号:107829942 上传时间:2019-10-21 格式:PPT 页数:127 大小:4.63MB
返回 下载 相关 举报
河北科技大学多媒体通信技术基础 第三章.ppt_第1页
第1页 / 共127页
河北科技大学多媒体通信技术基础 第三章.ppt_第2页
第2页 / 共127页
河北科技大学多媒体通信技术基础 第三章.ppt_第3页
第3页 / 共127页
河北科技大学多媒体通信技术基础 第三章.ppt_第4页
第4页 / 共127页
河北科技大学多媒体通信技术基础 第三章.ppt_第5页
第5页 / 共127页
点击查看更多>>
资源描述

《河北科技大学多媒体通信技术基础 第三章.ppt》由会员分享,可在线阅读,更多相关《河北科技大学多媒体通信技术基础 第三章.ppt(127页珍藏版)》请在金锄头文库上搜索。

1、第3章 数据压缩的基本技术 数据压缩处理一般由两个过程组成: 编码过程:对原始数据进行编码压缩,以便存储和传输; 解码过程:对压缩的数据进行解压,恢复成可用的数据。 根据解压后数据的保真度,数据压缩技术可分为 无损压缩编码:解码后的数据与原始数据完全相同,无任何偏差。这种编码通常基于信息熵原理,常用的编码有哈夫曼编码、算术编码、行程编码等。压缩比比较低,一般在2:1-5:1。主要用于要求数据无损压缩存储和传输的场合,如传真机 有损压缩编码:解码后的数据与原始数据相比有一定的偏差,但仍可保持一定的视听质量和效果。它主要是在保持一定保真度下对数据进行压缩,其压缩比可达100:1。压缩比越高,其解压

2、缩后的视、音频质量就越低。,分类: a 第一代图像压缩编码方法 基于香农理论,80年代初趋于成熟,主要降低数据之间的相关性,去除冗余。 b 第二代图像压缩编码方法 基于人类视觉特性的压缩方法,其核心思想是力图发现人眼是根据哪些关键特征来识别图像、或图像序列的,然后根据这些特征来构造图像模型。 例如,根据人眼对物体的轮廓比对物体内部细节更为敏感的特点,可以利用物体(而不是像素)的集合来表示图像。,3.2 数据压缩的理论依据,3.2 数据压缩的理论依据 数据压缩的理论基础为Shannon信息论。它一方面给出了数据压缩的理论极限,另一方面又指明了数据压缩的技术途径。 Shannon理论认为:信源中所

3、含有的平均信息量(熵)是进行无失真压缩编码的理论极限。 无记忆信源:如果设计的编码方法的码字平均长度最接近熵,则说明该编码方法是最佳的。,香农三大定理是信息论的基础理论。香农三大定理是存在性定理,虽然并没有提供具体的编码实现方法,但为通信信息的研究指明了方向。 第一定理:可变长无失真信源编码定理 采用无失真最佳信源编码可使得用于每个信源符号的编码位数尽可能的少,但它的极限是原始信号源的熵;超过了这一极限就不可能实现无失真的译码。 第二定理:有噪信道编码定理 若在信息传输率R不大于信道容量C时,则存在一种编码,当码长n足够大时,它可以使信道输出端的错误概率任意小,而信息传输率无限接近C;如果RC

4、,则不能找到一种编码,使输出端错误概率任意小。 第三定理:,第三定理:保真度准则下的信源编码定理,或称有损信源编码定理 只要码长足够长,总可以找到一种信源编码,使编码后的信息传输率R(单位:bit/信源符号)略大于率失真函数R(D),而码的平均失真度不大于给定的允许失真度,即D0,一定存在一种码字个数为M2NR(D)+的信源编码,使编码后的平均失真度D=D,3.2.3信源的相关性与序列熵的关系,3.3信息率-失真理论 率失真函数R(D):p32,(3-21) 在一定允许失真D条件下的最低平均互信息量。 从信源编码的角度看:率失真函数是在允许失真不大于D时,信源编码给出的平均互信息的下界。即对信

5、源信息率压缩的极限。 从接收端看,就是在满足失真不大于D的情况下,能够再现信源信息所必须获得的最低平均信息量。,限失真信源编码定理 1设离散无记忆信源U的率失真函数为R(D),给定允许失真D,则当信息率RR(D),只要信源序列长度L足够长,一定存在一种编码方法其译码平均失真小于或等于D+ 逆定理:当RR(D) 时,无论采用什么编译码方法,平均失真总是大于D。,实际中解决的方法通常采用相反的思路,及给定信息率R,通过改变编码方法寻找尽可能小的平均失真。 例如:在最佳量化器的设计中,其中量化的分层数N给定,(相当于信息熵给定)根据一定的误差准则,如均方误差最小,可以设计出相应的最佳量化器。,3.5

6、 预测编码 目的: 去除相邻像素之间的冗余度,减小图像信息在时间上和空间上的相关性来达到数据压缩的目的。 “相邻”,可以指像素与它在同一帧图像内上、下、左、右的像素之间的空间相邻关系; 也可以指该像素与相邻的前帧、后帧图像中对应于同一空间位置上的像素(同位像素)之间时间上的相邻关系。 具体如下:对于一个图像信源,首先根据某一模型,并利用以往的样值对新样值进行预测,得出预测值,然后将预测值与实际样值相减,得到误差值,最后对误差值进行量化、编码、传输,3.5.1差分脉冲编码调制 DPCM的简化原理方框图,通过预测和差分, 将x(n)转化为差分信息 e(n),降低了信息冗余,图中预测器的输出: N为

7、预测器所采用的样值数,也称为预测器的阶数。 等于各输入样值的线性组合,本预测器称为线性预测器。 在解码器中有一个相同的预测器,收到的预测误差信号经解量化器DQ以后,与预测其的输出相加,从而恢复出原信号。 由于预测误差的量化,解码输出的y(n)是x(n) 的近似值。,修正后的预测编码器,在前面的预测器中,编码端利用原始信号为参考进行预测,而在解码端确是利用量化后的信号进行预测,这种不匹配的情况导致重建信号有y(n)与输入信号x(n) 之间存在较大误差。修正:编码器反馈环模拟了解码端结构。 增加一个反馈环,将量化误差和过去预测函数相加,作为新的预测函数,符号 编码,压缩图像,+ -,en,输入图像

8、,xn,Q-DQ,n, xn,+ +, xn, xn = n + xn,几个概念: 一维预测:被预测的样值与用作预测的样值在同一行内 二维预测:用作预测的样值位于相邻的不同行上 一维预测利用像素之间在水平方向上的相关性。在水平方向亮度变化缓慢的图像,有较好的预测效果。 如果水平方向上亮度有突变,那么一阶的一维预测经常会 给出错误的预测数值。 在这种情况下,采用下面的二维预测,会有较好的预测值。,图3-14对应于图像黑白边界处的几个像素,N阶预测器的设计问题 在最小均方误差下的最佳预测器。 下式表示预测误差信号e(n)平方值的统计平均。 若上式最小时,表示在最小均方误差意义下,预测最准确,此时色

9、预测器称为在最小均方误差意义下的最佳预测器。 最佳预测器的系数 ai可以通过求极小值的方法求得。,如果对所需要压缩的某类图像的自相关函数已经作过测量的话,则可通过求解上式所表示的方程组,获得最佳预测器的系数值。,另一个事实,预测误差的平均功率比原信号的功率R(0)要小。在相同的均方量化误差下,e(n)比x(n)要求较少的量化级数,因此,传送e(n)比传送x(n)的数据率要低。,3.5.2 序列图像中运动矢量的估值 1.运动矢量估值的必要性 序列图像在时间上的冗余情况可分如下几种: (1)对于静止不动的场景,当前帧和前一帧的图像内容是完全相同的; (2)对于运动的物体,只要知道其运动规律,就可以

10、从前一 帧图像推算出它在当前帧中的位置; (3)摄像镜头对着场景横向移动(称为滑镜头)、焦距变化等操作会引起整个图像的平移、放大或缩小。对于这种情况,只要摄像机的运动规律和镜头改变的参数已知,图像随时间所产生的变化也是可以推算出来的。,由电视图像的相关性特点,可知: 发送端不一定必须把每帧图像上所有的像素都传给收端,而只要将物体(或摄像机)的运动信息告知接收端,收端就可根据运动信息和前一帧图像的内容来更新当前帧图像,这比全部传送每帧图像的具体细节所需的数据量要小得多。 首先要做的是从图像序列中提取运动物体的信息运动估值。 为了简单起见,做出如下假设: (1)物体是刚体只在与摄像机镜头的光轴垂直

11、的平面内移动。即:物体的形变、旋转、镜头焦距的变更等因素不考虑在内;,(2)无论物体移动到任何位置,照明条件都不变,即:同一物体在所有序列图像中亮度没有变化; (3)被物体遮挡的背景和由于物体移开而新暴露出来的背景部分都未不作特殊考虑。 t 时刻运动物体的象素值 bt 可用它在时间以前的值b t-表示: 含义:t时刻的图像是t-时刻的图像经适当位移D后的结果。 运动估值的分类: a 块匹配方法 b 像素递归方法,2.块匹配方法 方法描述: a.将图像划分为许多互不重叠的子块,并认为子块内所有像素的位移量都相同。(每个子块视为一个“运动物体”) b.寻找匹配块 假设在图像序列中,t 时刻对应于第

12、k帧图像,t-时刻对应于k-1帧图像。对于k帧中的一个子块,在k-1帧中寻找与其最相似的子块,称为匹配块。K-1帧称为K帧的参考帧 c.寻找位移矢量 认为匹配块在k-1帧中的位置就是k帧块位移前的位置,根据 (3-44)式则可以得到该子块的位移矢量D。,块匹配方法中最重要的问题: (1)判别两个子块匹配的准则; (2)寻找匹配块搜索的方法。 准则a:归一化的二维互相关函数(NCCF) 当NCCF为最大值时2个子块匹配,对应的 i,j 值即构成位移矢量D。,准则b 求2帧子块亮度的均方差值MSE: 当MSE最小时表示2个子块匹配。,c. MAD准则 求帧间子块亮度差的绝对值的均值MAD: 当MA

13、D最小时表示2个子块匹配。,d.计算块亮度差的绝对值和SAD: SAD(I,j)=MN*MAD(i,j) 当SAD最小时表示2个子块匹配。 此准则较常使用。 研究结果表明,匹配判别准则的不同对匹配精度,也即是对位移适量估值的精度影响不大。,(2)搜索方法:为了节省计算量,在k-1帧中的匹配搜索只在一定范围内进行。假设在时间间隔内最大可能的水平和垂直位移量为dm个像素,则搜索范围SR为 SR(M+2 dm )*(N+ 2dm ),1)全搜索:寻找最佳的匹配块,需要将k-1帧中对应的子块在整个搜索区内沿水平和垂直方向逐个像素移动,每移动一次计算一次判决函数。总的移动次数Q为 Q(2dm+1)2 此

14、种搜索方法运算量非常大。 2)块匹配的快速搜索方法: 举例:三步法 搜索过程: 1)以待匹配块中心的同位像素为中心,在中心点和与其距离4个像素的8个邻域上计算判决函数SAD,取SAD最小的点作为下一步搜索的中心 2)以该点为中心,对于中心相距2个像素的未搜索过的邻域点进行搜索 3)以上一步中SAD最小的点为中心,对距离中心1个像素的未搜索过的邻域点进行搜索,最终找到最佳匹配位置。,几乎所有的快速搜索算法都基于如下的假设: 当偏离最佳匹配位置时,判决函数(匹配误差)值是单调上升的。因此无需搜索所有点,只要沿着误差值减少的方向进行搜索,就能找到最佳匹配位置。 保证任何情况下找到全局极值点是困难的。

15、 近几年来人们提出了许多新的快速搜索算法,这些算法的搜索策略概括如下: 1)运动矢量预测: 根据图像内容的连续性,相邻块的运动矢量一般是相近的。 2)搜索提前中止:预先设定匹配误差阈值 3)紧凑的搜索图形,3.5.3具有运动补偿的帧间预测 1.前向预测 概念:不直接传送当前帧的像素值,而传送当前帧(即第k帧)中像素x和前1帧(即k-1帧)的同位像素x之间的差值,称为帧间预测。 对隔行扫描的电视信号,也可以用前一场来预测当前场的像素(场间预测)。,当图像中存在着运动物体时简单的预测不能收到好的效果。 考虑了物体移动的帧间预测方法称为具有运动补偿的帧间预测。,基本步骤: (1)将图像分割成静止的背

16、景和若干运动的物体,各个物体可能有不同的位移。但构成同一物体的所有像素的位移相同。通过运动估值得到每个物体的位移矢量; (2)利用位移矢量计算经运动补偿后的预测值; (3)除了对预测误差进行编码、传送以外,还需要传送位移矢量以及如何进行运动物体和静止背景的分割等方面的附加信息。,实际上,将图像分割成静止区域和不同的运动区域非常困难,当实时地完成时就更加困难。 方法 将图像分割成子块,每块看成是一个物体,按块匹配的方法估计每个子块的位移矢量,将经过位移补偿的帧间预测误差DFD和位移矢量D传送给收端,收端就可以按下式从已经收到的前1帧信息中恢复出该子块: bk(z)=bk-1(z-D)+DFD(z,D),下图表示了K帧各块及它们在k-1帧中对应的匹配块之间的关系,从该块的预测误差和它的位移矢量所指向的k-1帧中的匹配块,可以恢复出k帧中的对应子块。,注意: 当子块中的像素实际上属于位移量不同的物体时,这种对整个子块用同一位移量的预测就不够准确会使预测误差增加,从而影响到数据压缩比的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号