三视频压缩编码的基本原理和方法上课用有删减

上传人:1537****568 文档编号:359547974 上传时间:2023-08-31 格式:PPT 页数:59 大小:683KB
返回 下载 相关 举报
三视频压缩编码的基本原理和方法上课用有删减_第1页
第1页 / 共59页
三视频压缩编码的基本原理和方法上课用有删减_第2页
第2页 / 共59页
三视频压缩编码的基本原理和方法上课用有删减_第3页
第3页 / 共59页
三视频压缩编码的基本原理和方法上课用有删减_第4页
第4页 / 共59页
三视频压缩编码的基本原理和方法上课用有删减_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《三视频压缩编码的基本原理和方法上课用有删减》由会员分享,可在线阅读,更多相关《三视频压缩编码的基本原理和方法上课用有删减(59页珍藏版)》请在金锄头文库上搜索。

1、视频压缩编码的基本原理和方法视频压缩编码的必要性数字化后的视频数据量十分巨大,不便于传输和存储。单纯用扩大存储容量、增加通信信道带宽的办法是不现实的。而数据压缩是个行之有效的方法,通过数据压缩手段把信息的数据量压下来,以压缩编码的形式存储和传输,即紧缩节约了存储空间,又提高了通信信道的传输效率。PAL 制式制式 25帧帧/秒秒NTSC制式制式 30帧帧/秒秒以以PAL制制25帧帧/秒为例,视频每秒钟的数据量秒为例,视频每秒钟的数据量 720 576 24 25/(1024 1024 8)=29.66MB视频压缩编码的可能性数据压缩不仅是必要的,而且也是可能的。因为在视频数据中存在着极强的相关性

2、,也就是说存在着很大的冗余度。冗余数据造成比特浪费,消除这些冗余可以节约码字,也就是达到了数据压缩的目的。在一般的图像和视频数据中,主要存在以下几种形式的冗余:数据冗余的种类 空间冗余 时间冗余 符号冗余 结构冗余 知识冗余 视觉冗余空间冗余这是静态图像存在的最主要的一种数据冗余。一幅图像记录了画面上可见景物的颜色。同一景物表面上各采样点的颜色之间往往存在着空间连贯性,但是基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间连贯性,从而产生了空间冗余。规则物体和规则背景的表面物理特性都具有相关性,也就是说某些区域中所有点的光强和色彩以及饱和度都是相同的,因此数据有很大的空间冗

3、余。时间冗余这是序列图像表示中经常包含的冗余。序列图像(如电视图像和运动图像)一般为位于时间轴区间内的一组连续画面,其中的相邻帧往往包含相同的背景和运动物体,只不过运动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多共同的地方。变化的只是其中某些地方,这就形成了时间冗余。符号冗余符号冗余也称编码表示冗余,又称信息熵冗余。信息熵指一组数据携带的平均信息量。这里的信息量是指从N个不相等可能事件中选出一个事件所需要的信息度量,即在N个事件中辨识一个特定事件的过程中需要提问的最少次数(=log2N比特)。将信息源所有可能事件的信息量进行平均,得到的信息平均量称为信息熵。符号冗余、空间冗

4、余和时间冗余统称为统计冗余,因为它们都取决于图像数据的统计特性。结构冗余数字化图像中的物体表面纹理等结构往往存在着冗余,这种冗余称为结构冗余。当一幅图有很强的结构特性,纹理和影像色调等与物体表面结构有一定的规则时,其结构冗余很大。有些图像的纹理区,像素值存在明显的分布模式,例如,方格状的地板图案等。(已知分布模式,可以通过某一过程生成图像。)知识冗余由图像的记录方式与人对图像的知识差异所产生的冗余称为知识冗余。人对许多图像的理解与某些基础知识有很大的相关性。例如,人脸的图像有固定的结构,比如说嘴的上方有鼻子,鼻子的上方有眼睛等等,这类规律性的结构可由先验知识和背景知识得到。但计算机存储图像时还

5、得把一个个像素信息存入,这就是知识冗余。根据已有知识,对某些图像中所包含的物体,可以构造其基本模型,并创建对应各种特征的图像库,进而图像的存储只需要保存一些特征参数,从而可以大大减少数据量。知识冗余是模型编码主要利用的特性。视觉冗余事实表明,人类的视觉系统对于图像的敏感性是非均匀和非线性的,它并不能感知图像的所有变化。然而,在记录原始图像数据时,通常假定视觉系统是线性的和均匀的,对视觉敏感和不敏感的部分同等对待,从而就产生了比理想编码更多的数据。当某些变化不能被视觉所感知,则忽略这些变化,我们仍认为图像是完好的。人类视觉系统的一般分辨能力估计为26灰度等级,而一般图像的量化采用28灰度等级,这

6、样的冗余称为视觉冗余。通过对人类视觉进行大量实验,发现了以下的视觉非均匀特性:视觉冗余视觉系统对图像的亮度和色彩度的敏感性相差很大。随着亮度的增加,视觉系统对量化误差的敏感度降低。这是由于人眼的辨别能力与物体周围的背景亮度成反比。由此说明:在高亮度区,灰度值的量化可以更粗糙一些。人眼的视觉系统把图像的边缘和非边缘区域分开来处理,这是将图像分成非边缘区域和边缘区域分别进行编码的主要依据。人类的视觉系统总是把视网膜上的图像分解成若干个空间有向的频率通道后再进一步处理。视频压缩编码上述各种形式的冗余,是压缩图像与视频数据的出发点。图像与视频压缩编码方法就是要尽可能地去除这些冗余,以减少表示图像与视频

7、所需的数据量图像/视频压缩编码的目的,是在保证重建图像质量一定的前提下,以尽量少的比特数来表征图像/视频信息。视频压缩编码的发展压缩编码的理论基础是信息论。从信息论的角度来看,压缩就是去除数据中的冗余。即保留不确定的信息,去除确定的信息(即可推知的信息),用一种更接近信息本质的描述来代替原有冗余的描述。视频压缩编码的发展香农(Shannon)的信息论,即以经典的集合论为基础基于某种统计概率模型来描述信源。香农信息论的缺陷:一是没有考虑信息接受者的主观特性;二是撇开了事件本身的具体含义、重要程度和引起的后果但是香农信息论具有高度的概括性和综合性,因此得到广泛的应用。MPEG,活动图像专家组活动图

8、像专家组(MPEG,Moving Picture Experts Group),一直致力于活动图像及其伴音的数据压缩编码标准化工作,制定了一系列视频和音频压缩编码的国际标准。如MPEG-1、MPEG-2、MPEG-4。MPEG-1 MPEG-1的正式名称“用于数字存储媒体的1.5Mbit/s以下的活动图像及相关音频编码”,它规定视频信息与伴音信息经压缩之后的数据速率上限为1.5Mbps,从而可以在CD-ROM、硬盘、可写光盘、数字音频磁带(DAT)等介质上进行存储,也可以在局域网、ISDN上进行视频与伴音信息的传输。MPEG-1视频编码算法是一种有损压缩算法,它适用于多种视频输入格式并且应用范

9、围很广。经过MPEG-1标准压缩后,视频数据压缩率为1/100-1/200,MPEG-1提供每秒30帧352240分辨率的图像,当使用合适的压缩技术时,具有接近家用视频制式(VHS)录像带的质量。MPEG-2MPEG-2是MPEG工作组于1994年制定的第二个国际标准,正式名称为“通用的活动图象及伴音编码”。MPEG-2是一个通用多媒体编码标准,具有更为广阔的应用范围和更高的编码质量,应用包括数字存储、标准数字电视(SDTV)、高清晰度电视(HDTV)、高质量视频通信等。根据应用的不同,MPEG-2的码率范围为1.5-100Mbit/s,一般情况下,具有码率超过4Mbit/s的MPEG-2视频

10、,其视频质量才能明显优于MPEG-1。MPEG-4MPEG-4是2003年发布的视频压缩标准,与传统的基于像素的视频压缩标准(如MPEG-1,MPEG-2,H.261,H.263等)不同,MPEG-4采用基于对象的视频编码方法,它不仅可以实现对视频图象数据的高效压缩,还可以提供基于内容的交互功能。除此之外,为了使压缩后的码流具有对于信道传输的鲁棒性,MPEG-4还提供了用于误码检测和误码恢复的一系列工具,这样采用MPEG-4标准压缩后的视频数据可以应用于带宽受限、易发生误码的网络环境中 视频编码技术的两代论视频编码技术分为两代第一代视频编码技术是基于数据统计的、去除视频数据冗余为目的的压缩编码

11、技术。MPEG-1、MPEG-2、H.261,H.263标准属于第一代视频编码技术。第一代视频编码技术并未考虑到信息接受者的主观特性、视频信息的具体含义和重要程度,只是力图去除数据冗余,这是一种低层次的编码技术。真正代表视频压缩编码方向的是基于内容的第二代视频编码技术,它所关心的是如何去除视频内容的冗余,认为人眼是视频信号的最终接收者,在进行视频编码时应充分考虑人眼视觉特性的影响。MPEG-4标准采用了基于内容的第二代视频编码技术。视频压缩编码方法的分类视频压缩编码方法有许多种,从不同的角度出发有不同的分类方法1、按解码重建图像和原始图像是否相同分类2、按压缩编码算法的原理分类3、按待编码图像

12、的不同属性分类按解码重建图像和原始图像是否相同分类分为无失真编码和限失真编码1)无失真编码又称信息保持编码、熵编码。熵指的是具体数据所含的平均信息量,定义为在不丢失信息的前提下描述该信息内容所需的最小比特数。熵编码是纯粹基于信号统计特性的一种编码方法,它利用图像信源概率分布的不均匀性,通过变长编码来减少信源数据冗余,解码后的重建图像和压缩编码前的原始图像完全相同,没有失真。2)限失真编码又称非信息保持编码、熵压缩编码,解码重建图像和原始图像有一定差别,但是这些失真被控制在一定限度内。按压缩编码算法的原理分类可将图像压缩编码方法分为基于图像统计特性、基于人眼视觉特性、基于内容(对象)和基于模型等

13、方法。在实际编码中,常常同时利用图像的统计特性和人眼视觉特性才能有效的编码基于图像统计特性的编码方法中,有预测编码、变换编码、霍夫曼编码、算术编码、游程编码等。基于人眼视觉特性和基于内容的编码方法中,有亚采样、子带编码、多分辨率编码、矢量量化、形状编码、纹理编码等。基于模型的编码方法中,有模型基编码、语义编码等。按待编码图像的不同属性分类以图像的光学特征来分,有单色、彩色、多光谱图像的压缩编码;以灰度等级来分,有二值图像与灰度图像的压缩编码;若以动静来分,有静止图像和运动图像序列的压缩编码。在实际的应用中,往往采用混合编码方法来达到最佳的压缩效果。视频压缩编码方法简介熵编码 信息论的基本概念

14、设信源X可发出的消息符号集合 A=ai=|i=1,2,3,m,并设X发出符号ai的概率为P(ai),则定义符号出现的自信息量为I(ai)=-log p(ai)通常,上式中的对数取2为底,这时定义的信息量单位为bit(比特)把上述概念应用到图像信源来计算熵值,比较直观,简便的方法是把每个像素的样本值定义为符号。若考虑实际图像中相邻像素之间存在相关性,像素之间不是相互独立的特点,用相邻两个像素(或三个以上,直至N个)组成一个子像块,以子像块作为编码的基本单元,其对应的熵为一阶熵(三阶熵、N阶熵)或称为高阶熵。有高阶熵小于低阶熵图像信源熵是图像压缩编码的一个理论极限,它表示无失真编码所需的比特率的下

15、限。比特率定义为编码表示一个像素所需要的平均比特数。熵编码或者叫熵保持编码、信息保持编码、无失真压缩编码,要求编码输出码字的平均码长,只能大于等于信源熵,否则在信源压缩编码过程中就要丢失信息。熵编码的基本原理就是去除图像信源在空间和时间上的相关性,去除图像信源像素值的概率分布不均匀性,使编码码字的平均码长接近信源的熵而不产生失真。常用的熵编码有基于图像概率分布特性的霍夫曼编码、算术编码和基于图像相关性的游程编码(RLC,run-length coding)3类Huffman编码定理 在变长编码中,对出现概率大的信源符号赋于短码字,而对于出现概率小的信源符号赋于长码字。如果码字长度严格按照所对应

16、符号出现概率大小逆序排列,则编码结果平均码字长度一定小于任何其它排列方式。Huffman定理是Huffman编码的理论基础 32实现步骤(1)将信源符号按概率递减顺序排列;(2)把二个最小概率相加作为新符号的概率,并按(1)重排;(3)重复(1)、(2),直到概率为1;(4)在每次合并信源时,将合并的信源分别赋“0”和“1”(如概率大的赋“0”,概率小的赋“1”);(5)寻找从每一信源符号到概率为1处的路径,记录下路径上的“1”和“0”;(6)写出每一符号的“1”、“0”序列(从树根到信源符号节点)。33信源符号信源符号概率概率编码过程编码过程码字码字码长码长(i)x1 x2x3x4x5x6x7x80.40 0.180.100.100.070.060.050.041 00101100000100010100010000111 33444550101010.090.130.190.23 10 0.37 0.60010011上述编码的平均码字长度上述编码的平均码字长度:R=Pii=0.401+0.183+0.103+0.104+0.074+0.064+0.055+0.045 =2.6134

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号