《视频压缩编码》由会员分享,可在线阅读,更多相关《视频压缩编码(9页珍藏版)》请在金锄头文库上搜索。
1、视频压缩编码数据压缩编码已经有很长的历史。 压缩编码的理论基础是信息论。 从信息的角度来看, 压缩就是去除数据中的冗余。 即保留不确定的信息, 去除确定的信息(即可推知的信息) ,用一种更接近信息本质的描述来代替原有冗余的描述。视频压缩的目标是在尽可能保证视觉效果的前提下减少视频数据率。 视频压缩比一般指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像, 因此其压缩编码算法与静态图像的压缩编码算法有某些共同之处, 但是运动的视频还有其自身的特性, 因此在压缩时还应考虑其运动特性才能达到高压缩的目标。在视频压缩中常需用到以下的一些基本概念:一、有损和无损压缩:在视频压缩中有损( Lo
2、ssy )和无损( Lossless )的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用RLE行程编码算法。有损压缩意味着解压缩后的数据与压缩前的数据不一致。 在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息, 而且丢失的信息不可恢复。 几乎所有高压缩的算法都采用有损压缩, 这样才能达到低数据率的目标。 丢失的数据率与压缩比有关, 压缩比越大, 丢失的数据越多, 解压缩后的效果一般越差。 此外, 某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。二、帧内和帧间压缩:帧内( Intraframe )压缩也称为空间压缩( Sp
3、atialcompression ) 。 当压缩一帧图像时, 仅考虑本帧的数据而不考虑相邻帧之间的冗余信息, 这实际上与静态图像压缩类似。 帧内一般采用有损压缩算法, 由于帧内压缩时各个帧之间没有相互关系, 所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。采用帧间 ( Interframe ) 压缩是基于许多视频或动画的连续前后两帧具有很大的相关性, 或者说前后两帧信息变化很小的特点。 也即连续的视频其相邻帧之间具有冗余信息, 根据这一特性, 压缩相邻帧之间的冗余量就可以进一步提高压缩量,减小压缩比。帧间压缩也称为时间压缩( Temporal compression
4、 ) ,它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值( Framedifferencing )算法是一种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。三、对称和不对称编码:对称性( symmetric )是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间, 对称算法适合于实时压缩和传送视频, 如视频会议应用就以采用对称的压缩编码算法为好。 而在电子出版和其它多媒体应用中, 一般是把视频预先压缩处理好, 而后再播放, 因此可以采用不对称( asymmetric ) 编码。 不对称或非对
5、称意味着压缩时需要花费大量的处理能力和时间, 而解压缩时则能较好地实时回放, 也即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。例如,压缩一段三分钟的视频片断可能需要10 多分钟的时间,而该片断实时回放时间只有三分钟。视频压缩编码标准主要由 ITU-T 和 ISO/IEC 开发。 前者已经发布了视频会议标准 H.261 、 H.262 、 H.263 ,并且准备进行远期编码标准 H.263L 的开发,以期望获得更大的编码效率。ISO/IEC的标准系列是大家熟悉的MPEGC族。包括:(1)MPEG-1(19881992),可以提供最高达1.5Mb
6、ps的数字视频,只支持逐行 扫描。MPEG-坦ISO开发的第一个视频压缩算法。主要应用是数字媒体上动态图 像与音频的存储与检索, 如速率为 1.15Mbps、 采用 SIF 分辨率 (352*240 *29.97 或者352*288 *25)的VCD MPEG-1与H.261相似,不过编码器一般需要更高 的性能,以便支持电影内容的较高运动性而不是典型的可视电话功能。与H.261相比,MPEG馀许采用B帧。另外它还采用自适应感知量化, 也 就是说,对每个频段采用单独的量化比例因子(或等步长) ,以便优化人们的视 觉感受。MPEG-1仅支持逐行视频,因此新标准 MPEG-2已经开始做出努力,同 时
7、支持分辨率及比特率更高的逐行与隔行视频。(2)MPEG-2(1990 1994),支持的带宽范围从 2Mbps 到超过 20Mbp MPEG-2 后向兼容MPEG-1但增加了对隔行扫描的支持,并有更大的伸缩性和灵活性。MPEG-雷门针对数字电视而开发,很快成为了迄今最成功的视频压缩标准。 MPEG-2既能够满足标准逐行视频的需求(其中视频序列由一系列按一定时间问 隔采集的帧构成) ,又能够满足电视领域常用的隔行视频的需求。隔行视频交替 采集及显示图像中两组交替的像素(每组称为一个场) 。这种方式尤其适合电视 显示器的物理特性。MPEG-2支持标准的电视分辨率,其中包括:针对美国和日 本采用的
8、NTSC 制式隔行 720*480 分辨率,每秒60 场,以及欧洲和其他国家采用的 PAL 制式的 720*576 分辨率,每秒50 场。MPEG-2建立在MPEG-1基础之上,并具备扩展功能,能支持隔行视频及更宽的运动补偿范围。 由于高分辨率视频是非常重要的应用, 因此 MPEG-2 支持的搜索范围远远大于MPEG-1与之前的标准相比,它显著提高了运动估计的性能 要求,并充分利用更宽搜索范围与更高分辨率优势的编码器需要比 H.261 和 MPEG-1高得多的处理能力。MPEG班的隔行编码工具包含优化运动补偿的能力, 同时支持基于场和基于帧的预测,而且同时支持基于场和基于帧的DCT/IDCT。
9、MPEG-2在30:1 左右的压缩比时运行良好。MPEG-2在4-8Mbps时达到的质量适合消费类视频应用,因此它很快在许多应用中得到普及,如:数字卫星电视、数字有线电视、DVD以及后来的高清电视等。另外,MPEG-%曾加了分级视频编码工具,以支持多层视频编码,即:时域 分级、空域分级、SNR分级以及数据分割。尽管MPEG-2中针对分级视频应用定 义了相关类别 (profile) , 不过支持单层编码的主类(Main Profile) 是当今大众市场中得到广泛应用的唯一 MPEG-2类。MPEG-2解码最初对于通用处理器及 DSP具有很高的处理要求。优化的固定功能MPEG-2解码器开发已问世,
10、由于使 用量较高,成本已逐渐降低。MPEG-2证明低成本芯片解决方案的供应是视频编 解码标准成功和普及的关键。(3)MPEG-4(19941998),支持逐行扫描和隔行扫描,是基于视频对象的编码 标准,通过对象识别提供了空间的可伸缩性。MPEG-4由ISO提出,以延续MPEG-2的成功。一些早期的目标包括:提高 容错能力以支持无线网、 对低比特率应用进行更好的支持、 实现各种新工具以支 持图形对象及视频之间的融合。 大部分图形功能并未在产品中受到重视, 相关实 施主要集中在改善低比特率压缩及提高容错性上。MPEG-4简化类(SP)以H.263为基础,为改善压缩增加了新的工具,包括: * 无限制
11、的运动矢量:支持对象部分超出帧边界时的预测。* 可变块大小运动补偿:可以在16*16 或 8*8 粒度下进行运动补偿。* 上下文自适应帧内 DCT DC/AC 预测:可以通过当前块的左右相邻块预测DC/AC DCT 系数。* 扩展量化AC系数的动态范围,支持高清视频:从 H.263的卜127:127到-2047, 2047。增加了容错功能,以支持丢包情况下的恢复,包括:* 片断重同步(Slice Resynchronization):在图像内建立片断(slice),以便 在出现错误后更快速的进行重新同步。与 MPEG-2数据包大小不同,MPEG-4数 据包大小与用于描述MB的比特数量脱离了联系
12、。因此,不管每个MB的信息量 多少,都可以在位流中按相同间隔进行重新同步。* 数据分割:这种模式允许利用唯一的运动边界标记将视频数据包中的数据分割 成运动部分和DCT数据部分。这样就可以实现对运动矢量数据更严格的检查。 如果出现错误,我们可以更清楚地了解错误之处,从而避免在发现错误情况下抛 弃所有运动数据。* 可逆VLC: VLC编码表允许后向及前向解码。在遇到错误时,可以在下一个 slice进行同步,或者开始编码并且返回到出现错误之处。* 新预测(NEWPRED)主要用于在实时应用中实现快速错误恢复,这些应用中的解码器在出现丢包情况下采用逆向通道向解码器请求补充信息。MPEG-4高级简化类(
13、ASP)以简化类为基础,增加了与 MPEG-2类似的B 帧及隔行工具(用于Level 4及以上级别)。另外它还增加了四分之一像素运动 补偿及用于全局运动补偿的选项。MPEG-4高级简化类比简化类的处理性能要求更高,而且复杂性与编码效率都高于 MPEG-2 MPEG-4最初用于因特网数据流, 例如,已经被Apple的QuickTime播放器采用。MPEG-4简化类目前在移动数 据流中得到广泛应用。MPEG-4 AS%已经流行的专有DivX编解码器的基石。(4) MPEG-7(1998-2000)是一种多媒体内容描述的标准,定义了描述、描 述语和描述方案,便于处理多媒体内容。MPEG-7T独立于M
14、PEG勺其他标准使用,MPEG-7勺描述符与所描述内容的压 缩编码或存储方式无关,任何经压缩或未经压缩的多媒体信息都可以使用 MPEG-标准来描述。数字电视视频压缩技术原理摘要:视频压缩通过减少和去除冗余视频数据的方式,达到有效发送和存储数字视频文件的目的。在压缩过程中,需要应用压缩算法对源视频进行压缩以创建压 缩文件,以便进行传输和存储。要想播放压缩文件,则需要应用相反的解压缩算 法对视频进行还原,还原后的视频内容与原始的源视频内容几乎完全相同。压缩、发送、解压缩和显示文件所需的时间称为延时。在相同处理能力下,压缩算法越 高级,延时就越长。传统的压缩编码是建立在香农(Shannon)信息论基
15、础上的,它以经典的集合论为基础,用统计概率模型来描述信源,但它未考虑信息接受 者的主观特性及事件本身的具体含义、重要程度和引起的后果。因此,压 缩编码的发展历程实际上是以香农信息论为出发点,一个不断完善的过程。从不同角度考虑,数据压缩编码具有不同的分类方式。按信源的统计特性可分为预测编码、变换编码、矢量量化编码、子带-小波编码、神经网络编码方法等。数眼的视觉特性可能基于方向滤波的图像编码、基于图像轮廓一纹理 的编码方法等。按图像传递的景物特性可分为分形编码、基于内容的编码方法等。视频压缩技术是计算机处理视频的前提。视频信号数字化后数据带宽 很高,通常在20MB/秒以上,因此计算机很难对之进行保存和处理。采用压 缩技术以后通常数据带宽右以降到1-10MB/秒,这样就可以将视频信号保存在计算机中并作相应的处理。常用的算法是由ISO制订的,即JPEG和MPEG算法。JPEG是静态图像压缩标准,适用于连续色调彩色或灰度图像,它包 括两部分:一是基于 DPCM值间线性预测)技术的无失真编码,一是基于 DCT僭散余弓g变换)和哈夫曼编码的有失真算法,前者压缩比很小,主要应 用的是后一种算法。在非线性编辑中最常用的是MJPEGT法,即MotionJPEG它是将视频信号 50帧/秒(PAL制式)变为25帧/秒,然后按照25帧/ 秒的速度使用JPEG算法对每一帧压缩。通常压缩倍数在3.5-5倍时可