格式参考论文(按照该论文格式修改)

资源描述

《格式参考论文(按照该论文格式修改)》由会员分享，可在线阅读，更多相关《格式参考论文(按照该论文格式修改)（47页珍藏版）》请在金锄头文库上搜索。

1、MPEG-4标准视频压缩算法研究摘要随着计算机技术和通信技术的发展，多媒体压缩技术有了广泛的应用。本课题的目的是对多媒体压缩技术中的视频的压缩问题进行研究。论文首先介绍了MPEG-1/2标准视频压缩和解压的理论基础，主要包括帧内编码开发同一帧内存在的空间相关性；帧间编码开发相邻帧之间存在的时间相关性：以及与之有关的I，P，B帧和运动图像序列、帧、宏块、块等概念。其次介绍了MPEG-4标准对于MPEG-1/2标准的兼容性：视频对象VOP的概念；VOP编码的主要组成部分；MPEG-4每个VOP编码使用的压缩算法是在MPEG-1/2标准的基础上开发的。再次，在VC环境下对XVID进行编译，并实现编码

2、和解码。最后文章针对XVID部分源码对MPEG-4的视频压缩编码部分主要源码进行重点的分析。关键词：帧；MPEG -4；VOP；XVID；压缩；解压目录第一章绪论11.1课题的背景和意义11.2课题完成的工作1第二章数字图像压缩理论基础22.1数字图像压缩的必要性22.2数字化信息压缩的可能性22.3图像压缩的基础22.3.1无损压缩32.3.2有损压缩32.4图像压缩的关键技术52.4.1图像分块62.4.2DCT变换62.4.3量化62.4.4熵编码72.4.5运动估计和运动补偿82.4.6解码过程92.4.7混合编码92.4.8I，P，B帧编码模式112.5常用图像的数据结构12第三

3、章MPEG-4标准143.1MPEG-4标准简述143.1.1MPEG-4标准的特点143.1.2MPEG-4标准的构成153.1.3MPEG-4的框架和级别153.2视频编码的基本内容163.2.1从矩形帧到VOP，视频编码的基本结构163.2.2MPEG-4的数据结构183.3VOP编码实现183.3.1形状编码193.3.2运动信息编码203.3.3纹理编码213.4VOP分割223.5Sprite技术背景全景图编码223.6分级编码22第四章基于XVID的主要视频算法分析244.1XVID的技术特性244.1.1多种编码模式244.1.2XVID的量化方式254.1.3运动侦测（Mot

4、ion Search）和曲线平衡分配284.1.4动态关键帧距（I-frame interval）294.1.5全局运动补偿304.2XVID中B帧技术的实现30第五章XVID编译、编码、解码的实现365.1XVID源码的编译环境365.2编码，解码的实现375.2.1编码实现375.2.2解码实现39第六章总结与展望42谢辞43参考文献4444第一章绪论1.1 课题的背景和意义近年来，多媒体技术飞速发展，在工商企业、公共场所和社会生活中的应用也越来越广泛，己经成为当今社会密不可分的组成部份。到现在为止已经发布的几个通用的压缩编码标准有：用于64K会议电视及可视电话的H.261，用于静止图

5、像压缩的JPEG，面向1.5M数字视频和音频传输和存储的MPEG-1，面向高清晰度数字电视和音频传输和存储的MPEG-2和适用于低码率视频编码的H.263。这些标准越来越成熟，覆盖的应用领域越来越广。但是这些标准应用单一，主要目标是提高压缩比，并改善音频、视频质量，采用的技术是传统的波形编码理论。与以上标准不同，MPEG-4并不仅仅着眼于定义不同码流下的压缩编码标准，而是更多的强调多媒体通信的交互性和灵活性。MPEG-4是一个包括了未来编码技术发展的开放式标准，它能够与H.263和MPEG-1/2标准兼容，并提出了新的基于内容的存取概念。它提供的码率，低端可低于64Kbps，高端可高于8Mbp

6、s。MPEG-4标准提供对多种图像分辨率的支持，不但可以对自然视频进行高效率的编码，还具有对合成音视频对象、脸部模型、网络对象的编码能力；增加了对网络交互环境的支持，与计算机信息处理6的结合更加密切。在编码方式上的重大改进是提出对象的概念，强调人与媒体对象的交互能力。及时跟踪MPEG-4发展动态，掌握其核心技术，并结合实际应用在某些关键方向上有所创新和发展，这是一项很有意义的工作。本课题介绍了MPEG-1/2标准的主要压缩方法，然后讨论了MPEG-4引入的新的压缩方法。进一步结合基于MPEG-4标准的XVID技术的实现代码，对MPEG-4压缩编码的关键技术进行了分析和研究。并在此基础上，对PG

7、M格式的视频文件进行了压缩和解压，初步掌握了MPEG-4标准的理论基础和开发应用。1.2 课题完成的工作课题主要完成了以下几方面的工作：了解多媒体视频压缩的理论基础、视频压缩技术的发展历史，以及多媒体视频压缩的主要技术。了解MPEG-4标准的主要内容，并对不同于以往的新技术进行深入分析。对XVID源码的部分视频压缩算法进行深入分析。在WINDOWS XP SP2 环境下使用Visual C+6.0对XVID源码进行编译，调试；对PGM格式的视频文件进行压缩和解压工作，初步了解XVID源码对视频文件的压缩解压原理。第二章数字图像压缩理论基础2.1 数字图像压缩的必要性数字图像具有很多优点，但也

8、存在着数据量太大的问题。一幅640480像素中等分辨率的彩色图像（24bit/像素），其数据量约为1.31Mbit/s，播放一秒钟运动图像通常要30帧，则视频信号传输速率为220Mbit/s，一张650M的光盘只能播放20多秒钟，可见对数字化信息进行压缩非常必要。要用尽可能少的数据来表达信息，节省传输和存储的开销。2.2 数字化信息压缩的可能性能对数字化信息进行压缩，主要存在以下两点原因：第一、图像信号存在大量的冗余度并且可在编解码后无失真的恢复。第二、可以利用人的视觉特性，在图像变化不被觉察的条件下以一定的失真换取数据压缩。图像信号的冗余度，主要表现为空间（帧内）和时间（帧间）相关性。所谓相

9、关性，就是能够根据给出的一部分数据判断出其相邻的数据。一帧图像内的任何一个场景都是又若干像素点构成的，因此一个像素通常与它周围的某些像素在亮度和色度上存在一定的关系，这种关系即空间相关性；一个节目中的一个情节常常由若干帧连续图像组成的图像序列构成，一个图像序列中前后帧图像间也存在一定的关系，这种关系即时间相关性。这两种相关性使得图像中存在大量的冗余信息。如果出去冗余信息，而只保留少量非相关信息进行传输，就可以大大降低信息存储容量和传输速率。与此同时，由于人眼对图像的细节分辨率、运动分辨率和对比度分辨率的感觉有一定的界限，只要在图像处理时引入的失真不是很大，就不易察觉，仍会认为图像时完好的或是足

10、够好的。因此可以在满足对图像质量一定要求的前提下，通过压缩编码方法，实现数据压缩。上述思想既是MPEG-1/2的主要理论基础，也是MPEG-4的理论基础。2.3 图像压缩的基础压缩机制通常分为两种无损压缩和有损压缩。无损压缩是指可以精确重建数据，没有信息丢失；有损压缩是指数据不能无失真的重建，有一定的信息丢失。对于有损压缩，我们允许压缩后产生质量上的误差，可以让压缩后的数据代替原始数据。任何压缩机制的根本思想都是去除数据中存在的相关性。一个好的压缩编码方案，要能够最大限度地去除图像中的冗余信息。对空间相关性，可以根据图像中某一点的像素值推断出其相邻点的像素值；对时间相关性，通过运动预测，参考前

11、一帧图像与这一帧图像的相似情况，去掉与前一帧相似的冗余数据，而只记录这一帧与上一帧不同的数据。以下介绍图像压缩编码中的基本编码方法。2.3.1 无损压缩常用无损压缩编码技术有以下几种：行程编码技术行程编码(Run-length Coding)是一种相对简单的编码技术，主要思想是将一个相同值的连续串用一个代表串长和值的组合码字(Run,Level)来代替。其中行程(Run)表示系数系列中连零系数的长度；量化电平(Level)表示连零系数之后第一个非零系数的值。行程编码适用于二值图像。行程编码的效率不如Huffman编码方法高，但它的码字结构相对简单，故在许多情况下也被采用。为达到较好的压缩效果，

12、行程编码经常和其他一些编码方法混合使用。Huffman编码压缩变字长编码的最佳编码定理：在变字长编码中，对于出现概率大的信息符号编以短字长的码，对于概率小的符号编以长字长的码。Huffman编码是根据可变长度最佳编码定理，应用Huffman算法得到的一种编码方法。它是整数编码的一种最佳码，即它的平均码长在具有相同输入概率的前提下，比其它任何一种唯一译码都短，是图像压缩中的重要编码方法。算术编码算术编码是另一种利用信源编码概率分布特性，能够趋近熵极限的编码方法。尽管它也是对出现概率大的符号采用短码，对出现概率小的符号采用长码，但其编码原理与Huffman编码并不相同，它和Huffman编码的最大

13、区别在于它不是使用整数码。算术编码的方法是将被编码的每一个信源消息按其概率大小表示成实数轴01之间的一个区域(或称之区间)，概率越大，所占间隔越大，表示这一间隔所需的二进制分数值位数就越小；反之就越大。算术编码所产生的码字实际上就是一个二进制分数值的指针，该指针指向所编符号对应的概率区间，该区间为半开区间，包括左端点，不包括右端点。2.3.2 有损压缩率失真理论指出，在给定信号允许失真度的条件下，为了减少图像传输的比特率，应尽量减小传输信号的方差。预测编码和变换编码正是根据这一理论对原始图像进行压缩，使处理后的图像信号的方差减小，最终达到压缩编码的目的。常用有损压缩编码方法有：预测编码方法对于

14、绝大多数图像来说，在局部空间和时间上是高度相关的，因而可以在己知像素的基础上，通过对当前像素预测来减少图像的数据量。即可以利用xi-1，xi-2xi-m来预测xi，的值，由于差值di的方差比原始图像系列的方差要小，因此，传输其差值只需比较少的比特数。帧内预测编码二维图像中像素间存在很强的相关性，因此可用已知的前面几个像素值来预测当前像素值。这些像素可以是前几行的或前几帧的，分别称为一维、二维和三维预测，然后对实际值与预测值的差值(预测误差)进行量化和编码。帧间预测编码视频信号的相邻核间存在极强的相关性，利用这种时间相关性进行帧间编码，可获得比帧内DPCM高得多的压缩比。采用的预测方法有：帧重复

15、、闭值法、帧内插、运动补偿预测。帧重复，对于静止或活动很慢的视频信号，可以少传一些帧；阈值法，即只传送像素亮度的帧间差值超过某一阈值的像素；帧内插，对活动缓慢的图像，可以使用前后两帧图像进行内插以得到实际图像的预测图像，然后对实际帧与预测的差值信号进行编码。正交变换编码图像经过正交变换后能够实现图像数据压缩的物理本质在于：经过多维坐标系中的适当的坐标旋转和变换，能够把散布在各个坐标轴上的原始图像数据，在新的适当的坐标系中集中到少数坐标轴上，因而有可能用较少的编码比特数来表示一幅图像，实现图像的压缩编码。绝大部分图像信号在空间域中像素之间的相关性是很大的。它们经过正交变换后，其能量主要集中在低频部分，而且经过正交变换后相关性大大降低。变换编码的基本思路就是利用上述特点，在编码时略去某些能量很小的高频分量，或在量化时对方差较小的分量分配以较少的比特数。另外，变换编码还可以根据人眼对不同频率分量的敏感程度而对不同系数采用不同的量化台阶，以进一步提高压缩比。经过变换其频谱系数将被量化(可采用标量

展开阅读全文