avsm关键技术及多平台应用研究

资源描述

《avsm关键技术及多平台应用研究》由会员分享，可在线阅读，更多相关《avsm关键技术及多平台应用研究（79页珍藏版）》请在金锄头文库上搜索。

1、湘潭大学硕士学位论文 AVS-M关键技术及多平台应用研究姓名：申青平申请学位级别：硕士专业：计算机应用技术指导教师：王毅 20070501 I 摘要随着无线网络技术和音视频技术的发展，移动多媒体应用在人们的生活中扮演越来越重要的角色。为有效利用有限的带宽资源，多媒体数据在传输之前必须进行压缩，同时为保证网络多媒体信息能够共享，数据压缩必须满足一定的规范，即编码标准。AVS-M 是我国专门针对移动多媒体应用自行制定、拥有自主知识产权的数字音视频编解码标准。AVS-M 标准产品可以应用于宽带网络流媒体、移动视频会议与移动视频监控等领域。本文的研究工作围绕该标准展开。本文首

2、先对 AVS-M 标准技术框架进行了详细描述，并将各个组成部分与当前主流的视频标准 H.264/AVC 进行了比较。然后从算法优化角度提出了一个新的算法：快速帧内亮度预测模式判决算法。该算法通过对帧内各种预测模式的 SAD 的代价进行计算并升序排序后预先确定候选预测模式集的方法实现。在 AVS-M 编解码软件优化和实现方面，首先对 AVS-M 编码参考软件进行了详细分析，在此基础上结合快速算法和单指令多数据流技术设计了一个综合的编码软件优化方案并进行了仿真验证。AVS-M 解码软件的复杂性相对固定，优化主要从减小时间复杂度和空间复杂度的角度进行，并考虑在嵌入式操作系统上的可移植性

3、。为推广 AVS-M 应用，一方面必须有高效、稳定的硬件编码器产品，另一方面解码软件必须尽可能多地支持各种类型的移动终端。因此，本文最后研究了 AVS-M 实时编码的 DSP 实现以及 AVS-M 解码软件在 BREW 等主流手机操作系统和平台上的实现。关键词：AVS-M，帧内预测，变换量化，软件优化，嵌入式操作系统 II Abstract With the development of wireless network and audio and video technology, the application of mobile multimedia plays an impo

4、rtant role in social life. In order to utilize limited bandwidth resource efficiently, multimedia should be compressed before being transmitted. At the same time, data compression must satisfy a certain criterion for sharing multimedia information in network. As a digital audio and video coding and

5、decoding standard established and owned by China, AVS, Audio and Video Standard, includes a video standard, AVS-M, specified for mobile multimedia. Products according with AVS-M could be used for broadband network streaming, mobile videoconference, mobile video surveillance, etc. The dissertation wo

6、rk is developed around AVS-M mobile video standard. The AVS-M standard framework is described in detail at first and then comparied with H.264/AVC, the main video standard internationally, for every key component. After that, a new algorithm is provided: rapid intra prediction mode decision algorith

7、m. It is implemented by the sort ascending of the result of SAD in luma block for cost computation and determining a candidate mode set in advance. For optimizing and implementing of AVS-M codec software, detailed analysis is done and then a synthetical encoding optimization scheme combined with rap

8、id algorithms and single instruction multiple data technology is carried out. Simulation results show the scheme is effective. The complexity of decoder is fixed relatively and the optimization is focused on reducing time and space complexity. At the same time, the feasibility of transplanting decod

9、er to embedded operating system is also considered. For spreading AVS-M application, there must have efficient and robust hardware encoder products and the decoder supports mobile terminals as more as possible. So at the end of this dissertation, AVS-M real-time encoding on DSP and decoding software

10、 on main operating systems and platform for handsets such as BREW is discussed in detail. Key words: AVS-M, Intra Prediction, Transform and Quantization, Software Optimization, Embedded Operating System 湘潭大学湘潭大学学位论文原创性声明学位论文原创性声明本人郑重声明：所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外，本论文不包含任何其他个人或

11、集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名：日期：年月日学位论文版权使用授权书学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定，同意学校保留并向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权湘潭大学可以将本学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名：日期：年月日导师签名：日期：年月日湘潭大学硕士论

12、文 AVS-M 关键技术及多平台应用研究第 1 页共 75 页第一章概述 1.1 视频编码技术及标准的发展 1.1.1 视频压缩技术概述自 1948 年 C.E.Shannon 提出信源编码理论 1以来，人们对图像压缩编码技术进行了广泛的研究。经过近六十年的研究和发展，出现了大量的视频压缩技术和方法，包括预测编码、矢量编码、变换编码、熵编码、基于对象的形状编码以及小波变换编码、分形编码等。根据视频压缩方法所采用的信源模型，这些压缩技术可以分为两大类：基于内容的编码方法和基于波形的编码方法 2,3,4。基于内容的编码先将视频帧分成对应于不同物体的区域，然后分别对其进行编码

13、，即对不同物体的形状、运动和纹理进行编码。在最简单情况下，利用二维轮廓描述物体的形状；利用运动矢量描述其运动状态；而纹理则用颜色的波形进行描述。当已知视频序列中的物体种类时，可采用基于知识或基于模型的编码 5。当已知物体的可能类型和行为（如人脸的高兴、生气、悲伤等表情）时，可采用语义编码 6。在这种情况下，只需要对描述物体行为的少量参数进行编码即可。由于物体本身可能的行为数目非常小，因而可获得非常高的编码效率。基于波形的编码采用了把预测编码和变换编码组合起来的基于块的混合编码方法 7。为了减少编码的复杂性，使视频编码操作易于执行，采用混合编码方法时，首先把一幅图像分成固定大小的

14、块，例如块 88（即每块 8 行，每行 8 个象素）、块 1616（每块 16 行，每行 16 个象素）等等，然后对块进行压缩编码处理。基于内容的编码方法侧重于消除视频序列的视觉冗余、结构冗余和知识冗余，可获得很高的压缩比。但是，由于技术的高复杂性而往往难于实际应用。基于波形的编码方法基于象素，在消除视觉冗余的同时还侧重于消除视频序列的时间冗余、空间冗余以及统计冗余，虽然压缩比受到一定的限制，但方法简单，易于实际应用。因此，目前基于块的混合波形编码方法得到了更为广泛的应用，下面讨论其基本原理。 1.1.2 视频压缩原理原始数字视频中包含大量的冗余信息，这些冗余信息主要可分为

15、三类： 1、视觉冗余 8。 2、时域和空域冗余 9。 3、统计（熵）冗余 10。湘潭大学硕士论文 AVS-M 关键技术及多平台应用研究第 2 页共 75 页此外，对于某些特殊类型的视频，可能还存在结构冗余和知识冗余等其他形式的数据冗余。视频压缩编码的主要目的是尽可能消除这些冗余，主要方法包括： 1、空间采样人眼视觉系统由于其频率响应随着空间频率的增长而降低，因此对色差信号的敏感性不强。利用这一特点，可以在原始数据格式（亮度 Y：色度 Cb：色度 Cr 4:4:4）的基础上对 Cb 和 Cr 在水平方向进行 2:1 降采样或者在水平和垂直方向分别进行 2:1 降采样，分别得到

16、采样格式为 4:2:2 和 4:1:1（通常记为 4:2:0）的数据，从而使数据量分别降低 33%和 50%，达到压缩数据量的目的。 2、时间预测和空间预测预测编码是数据压缩最有效的手段之一。视频中一帧图像内的数据相关性使得对于某个数据块可以利用其相邻块的数据信息进行预测，仅保留原始象素与预测象素之差，从而减小或消除空间冗余；视频中相邻图像帧之间的时间相关性使得数据块可以利用其相邻图像帧进行预测，仅保留原始象素与预测象素之差，消除或减小空间相关性。 3、变换和量化消除视频图像空间相关性更有效的手段是采用频域变换 11，其主要思想是通过正交变换进行多维坐标系的旋转，把散布在各个原坐标轴上的数据点集中到新坐标系的少数坐标轴上。常用的变换方法有 K-L 变换、DFT 变换、DCT 变换 12、 Hadamard 变换和小波变换 13等。 4、熵编码主要是利用信息熵理论，实现变长编码，即对出现概率大的符号用较短的码字表示，对出现概率小的

展开阅读全文