基于率失真优化的模式选择快速算法研究

资源描述

《基于率失真优化的模式选择快速算法研究》由会员分享，可在线阅读，更多相关《基于率失真优化的模式选择快速算法研究（58页珍藏版）》请在金锄头文库上搜索。

1、华中科技大学硕士学位论文基于率失真优化的模式选择快速算法研究姓名：尹文蕾申请学位级别：硕士专业：通信与信息系统指导教师：喻莉 20080601 华中科技大学硕士学位论华中科技大学硕士学位论文文 I 摘摘要要如今，多媒体通信已经成为社会生活中的一个重要部分，人们对视频质量的要求也越来越高。由于多媒体数据尤其是视频数据量的巨大，为了满足传输带宽需求，视频信号通常需要高度压缩，高压缩的结果导致了视频质量的下降。第二代视频压缩标准（H.264、AVS等）都采用率失真优化的策略来达到视频质量与码率的平衡。率失真优化带来了高效率编码的同时，

2、带来了编码端的高复杂度。本文首先针对率失真代价计算模型进行研究。然后结合AVS的变换量化过程，提出了变换域内的失真计算方法，并通过变换域内的失真来估算图像域内的失真；通过研究AVS熵编码的编码过程及变换量化系数的特点，用统计的方法找到了影响编码码长的主要因素，提出了利用非零变换系数估计熵编码码长的模型。实验表明，利用变换域失真估计图像域失真、利用非零系数估计码长，可以保证编码结果的PSNR 和码长的变化不大。最后，本文结合AVS的帧内和帧间模式选择过程，利用率失真代价计算的新方法提出了一种基于率失真优化的模式选择快速算法。并通过实验得到了码长估计模型中的自适应系数较合

3、适的初值。实验表明，在帧内预测模式和帧间分块模式选择过程中，通过变换域估算得到的失真和码长进行率失真代价计算, 在保证编码过程 PSNR和码长变化不大的情况下，降低了60%的率失真计算时间及20%的总编码时间。关键词关键词：率失真；变换域；熵编码；模式选择；失真度估计；码率估计华中科技大学硕士学位论华中科技大学硕士学位论文文 II Abstract Nowadays, multimedia communication has become an important part of social life. At the same ti

4、me, peoples requirements on video quality are also getting higher and higher. Due to the large number of data that multimedia and video sequences contain, video signals have to be highly compressed to reduce the redundancy for the demand of the narrow bandwidth, which leads to the decline of video q

5、uality. Second generation video compression standards, such as H.264 and AVS, have adopted a strategy of rate distortion optimizing to achieve balance between video quality and bit-rate. RDO does bring high efficiency while at the same time, brings the high-coding complexity. First, The RDO model is

6、 introduced. Based on the transform and quantization method of AVS, a new distortion calculation technique in the transform domain is proposed, and used to estimate the distortion in the pixel domain. Secondly, in response to AVS entropy coding features, the main factors of bit-rate using statistica

7、l methods are found, base on which, a new model to estimate entropy coding rate through non-zero coefficients is proposed. The experiments show that the distortion measure and rate estimation can make PSNR and bit-rate have a little change. At last, apply the new RD cost calculating technique to the

8、 intra and inter mode decision process. a new fast mode decision algorithm with rate-distortion optimization is proposed. the proper initial value of the adaptive coefficient is found through experiments. Experiments show that during the intra and inter mode decision process, The distortion and bit-

9、rate estimated in the transform domain are used to calculate the RD cost achieves about 60% reduced computation time of rate-distortion cost and saves about 20% total encoding time with little change of PSNR and bit-rate. Key Words：rate-distortion optimization; transform domain; entropy coding; mode

10、 decision; distortion measure; rate estimation 独创性声明独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除文中已经标明引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到，本声明的法律结果由本人承担。学位论文作者签名：日期：年月日学位论文版权使用授权书学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定，即：学校有权保留并向国家有关部门或机构送交论文的复印件和

11、电子版，允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密，在_年解密后适用本授权书。不保密。（请在以上方框内打）学位论文作者签名：指导教师签名：日期：年月日日期：年月日本论文属于华中科技大学硕士学位论华中科技大学硕士学位论文文 1 1 绪绪论论 1.1 课题研究背景及意义课题研究背景及意义随着信息技术的快速发展，计算机与通信、多媒体技术融合日益紧密，使得多媒体通讯成为信息产业中发展最快、规模最大的产业之

12、一。在视频通信、安全监控与工业自动化，影视娱乐等领域中，人们对数字视频的需求剧增。但是数字视频随着分辨率的增加，数据量也会剧增。在视频存储与视频传输方面都会出现诸多问题。从表 1-1 看出单纯的依靠增加存储器容量、增加网络带宽来实现数字视频的存储与传输是不现实的。因此，数字视频的压缩编码技术成为解决数字视频存储或传输最有效的方法。表 1-1 几种常用数字视频应用的原始数据速率应用种类码率（比特/秒）电话(200-3400Hz) 8000 样本数/秒 12 比特/样本 = 96kbps 宽带音频(20-2000Hz) 44100 样本数/秒 16 比特/样本 2 信道 = 1

13、.412Mbps 桌上电视(QCIF) （8+4） 176 144 30 = 9.1Mbps 会议电视（CIF）（8+4） 352 288 30 = 36.5Mbps 普通电视（CCIR601）（8+4） 720 480 30 = 167Mbps 高清电视（HDTV）（8+4） 1920 1080 30 = 1.18Gbps 数字视频的压缩编码是将数字的视频序列精简到用更少的比特数表达的过程。压缩的过程涉及两个互相关联的完整系统，即编码器和解码器。大多数视频编码方法通过减小冗余来实现压缩。冗余可以简单地看作在完整恢复数据时不必要的信息。视频数据中包含空间冗余、时间冗余、信息熵冗余、

14、结构冗余、知识冗余、视觉冗余等1。在时域，时间上相邻的视频帧之间通常会有很强的互相关性，也就是有很强的相似性，特别是当时域的采样频率非常高时，这种相关性更强。在空间域，相邻或相近的像素，其灰度值或色度分量的值总是很相近，相邻像素之间存在很强的相华中科技大学硕士学位论华中科技大学硕士学位论文文 2 关性。通常视频编码器主要包括时域模块、空域模块和熵编码模块来去除各种冗余。 1 时域模块时域模块主要是利用视频图像时间上的相似性,减小时间冗余度。对前后两帧相减(移动物体作相应位移)得到的残差数据进行编码。因为残差数据大量集中于零值附近，可以采

15、用较短的码字传送。大部分视频编码标准确性采用的是基于块的运动估计和补偿。通常将一帧图像划分为若干 16 16 的宏块，然后对宏块继续划分，以 8 8 块或者 4 4 块作为预测补偿和变换的最小单元。以当前图像块在参考图像中的对应位置为中心的一定范围内搜索当前块的最佳匹配块，即与当前块相减后残差能量最小的块。当前图像块与参考图像的最佳匹配块间的位置偏移以运动向量来描述的，一个运动向量代表水平和垂直两个方向上的位移。分块大小对运动估计的效果是有影响的。较小的块可以使运动估计更精确，产生较小的运动残差，可降低码率；另一方面，小的分块需要更多地存储和传输运动矢量，可能增加码率。同样参考帧的

16、多少对运动估计的效果也是有影响的。较多的参考帧可以在时间上选择更匹配的图像块可以在时间上选择更匹配的图像块。但是需要编码更多的运动矢量信息，参考帧信息和图像头信息,可能会增加码率。因此，需要综合码率和失真度进行考虑。 2 空域模块空域模块主要利用视频图像的帧内数据以及预测的帧间误差数据之间的相关性。图像的空间预测编码通过像素点的上方或左边相邻的已经编码块中与当前块相邻的像素值预测当前块的像素值。预测后的残差进一步通过块变换使得变换域数据的相关性减小，使大部分能量集中到少数元素中。变换的方式分为两大类，一类是基于图像的变换，其中最著名的是已经被 JPEG2000 采用23的离散小波变换 DWT。另一类是基于块的变换。变换过程包括

展开阅读全文

基于率失真优化的模式选择快速算法研究

最新文档