avsm关键技术及多平台应用研究

上传人:w****i 文档编号:111726917 上传时间:2019-11-03 格式:PDF 页数:79 大小:2.33MB
返回 下载 相关 举报
avsm关键技术及多平台应用研究_第1页
第1页 / 共79页
avsm关键技术及多平台应用研究_第2页
第2页 / 共79页
avsm关键技术及多平台应用研究_第3页
第3页 / 共79页
avsm关键技术及多平台应用研究_第4页
第4页 / 共79页
avsm关键技术及多平台应用研究_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《avsm关键技术及多平台应用研究》由会员分享,可在线阅读,更多相关《avsm关键技术及多平台应用研究(79页珍藏版)》请在金锄头文库上搜索。

1、湘潭大学 硕士学位论文 AVS-M关键技术及多平台应用研究 姓名:申青平 申请学位级别:硕士 专业:计算机应用技术 指导教师:王毅 20070501 I 摘 要 随着无线网络技术和音视频技术的发展,移动多媒体应用在人们的生活中扮演 越来越重要的角色。为有效利用有限的带宽资源,多媒体数据在传输之前必须进行 压缩,同时为保证网络多媒体信息能够共享,数据压缩必须满足一定的规范,即编 码标准。AVS-M 是我国专门针对移动多媒体应用自行制定、拥有自主知识产权的数 字音视频编解码标准。AVS-M 标准产品可以应用于宽带网络流媒体、移动视频会议 与移动视频监控等领域。本文的研究工作围绕该标准展开。 本文首

2、先对 AVS-M 标准技术框架进行了详细描述,并将各个组成部分与当前主 流的视频标准 H.264/AVC 进行了比较。然后从算法优化角度提出了一个新的算法: 快速帧内亮度预测模式判决算法。该算法通过对帧内各种预测模式的 SAD 的代价进 行计算并升序排序后预先确定候选预测模式集的方法实现。 在 AVS-M 编解码软件优化和实现方面,首先对 AVS-M 编码参考软件进行了详细 分析,在此基础上结合快速算法和单指令多数据流技术设计了一个综合的编码软件 优化方案并进行了仿真验证。AVS-M 解码软件的复杂性相对固定,优化主要从减小 时间复杂度和空间复杂度的角度进行,并考虑在嵌入式操作系统上的可移植性

3、。 为推广 AVS-M 应用,一方面必须有高效、稳定的硬件编码器产品,另一方面解 码软件必须尽可能多地支持各种类型的移动终端。因此,本文最后研究了 AVS-M 实 时编码的 DSP 实现以及 AVS-M 解码软件在 BREW 等主流手机操作系统和平台上的实 现。 关键词:AVS-M,帧内预测,变换量化,软件优化,嵌入式操作系统 II Abstract With the development of wireless network and audio and video technology, the application of mobile multimedia plays an impo

4、rtant role in social life. In order to utilize limited bandwidth resource efficiently, multimedia should be compressed before being transmitted. At the same time, data compression must satisfy a certain criterion for sharing multimedia information in network. As a digital audio and video coding and

5、decoding standard established and owned by China, AVS, Audio and Video Standard, includes a video standard, AVS-M, specified for mobile multimedia. Products according with AVS-M could be used for broadband network streaming, mobile videoconference, mobile video surveillance, etc. The dissertation wo

6、rk is developed around AVS-M mobile video standard. The AVS-M standard framework is described in detail at first and then comparied with H.264/AVC, the main video standard internationally, for every key component. After that, a new algorithm is provided: rapid intra prediction mode decision algorith

7、m. It is implemented by the sort ascending of the result of SAD in luma block for cost computation and determining a candidate mode set in advance. For optimizing and implementing of AVS-M codec software, detailed analysis is done and then a synthetical encoding optimization scheme combined with rap

8、id algorithms and single instruction multiple data technology is carried out. Simulation results show the scheme is effective. The complexity of decoder is fixed relatively and the optimization is focused on reducing time and space complexity. At the same time, the feasibility of transplanting decod

9、er to embedded operating system is also considered. For spreading AVS-M application, there must have efficient and robust hardware encoder products and the decoder supports mobile terminals as more as possible. So at the end of this dissertation, AVS-M real-time encoding on DSP and decoding software

10、 on main operating systems and platform for handsets such as BREW is discussed in detail. Key words: AVS-M, Intra Prediction, Transform and Quantization, Software Optimization, Embedded Operating System 湘潭大学湘潭大学 学位论文原创性声明学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的 研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或

11、 集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均 已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。 作者签名: 日期: 年 月 日 学位论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保 留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和借阅。 本人授权湘潭大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 涉密论文按学校规定处理。 作者签名: 日期: 年 月 日 导师签名: 日期: 年 月 日 湘潭大学硕士论

12、文 AVS-M 关键技术及多平台应用研究 第 1 页 共 75 页 第一章 概述 1.1 视频编码技术及标准的发展 1.1.1 视频压缩技术概述 自 1948 年 C.E.Shannon 提出信源编码理论 1以来, 人们对图像压缩编码技术 进行了广泛的研究。经过近六十年的研究和发展,出现了大量的视频压缩技术和 方法,包括预测编码、矢量编码、变换编码、熵编码、基于对象的形状编码以及 小波变换编码、分形编码等。根据视频压缩方法所采用的信源模型,这些压缩技 术可以分为两大类:基于内容的编码方法和基于波形的编码方法 2,3,4。 基于内容的编码先将视频帧分成对应于不同物体的区域,然后分别对其进行 编码

13、,即对不同物体的形状、运动和纹理进行编码。在最简单情况下,利用二维 轮廓描述物体的形状;利用运动矢量描述其运动状态;而纹理则用颜色的波形进 行描述。当已知视频序列中的物体种类时,可采用基于知识或基于模型的编码 5。 当已知物体的可能类型和行为(如人脸的高兴、生气、悲伤等表情)时,可采用 语义编码 6。在这种情况下,只需要对描述物体行为的少量参数进行编码即可。 由于物体本身可能的行为数目非常小,因而可获得非常高的编码效率。 基于波形的编码采用了把预测编码和变换编码组合起来的基于块的混合编码 方法 7。为了减少编码的复杂性,使视频编码操作易于执行,采用混合编码方法 时,首先把一幅图像分成固定大小的

14、块,例如块 88(即每块 8 行,每行 8 个象 素) 、块 1616(每块 16 行,每行 16 个象素)等等,然后对块进行压缩编码处理。 基于内容的编码方法侧重于消除视频序列的视觉冗余、 结构冗余和知识冗余, 可获得很高的压缩比。但是,由于技术的高复杂性而往往难于实际应用。基于波 形的编码方法基于象素,在消除视觉冗余的同时还侧重于消除视频序列的时间冗 余、空间冗余以及统计冗余,虽然压缩比受到一定的限制,但方法简单,易于实 际应用。因此,目前基于块的混合波形编码方法得到了更为广泛的应用,下面讨 论其基本原理。 1.1.2 视频压缩原理 原始数字视频中包含大量的冗余信息,这些冗余信息主要可分为

15、三类: 1、视觉冗余 8。 2、时域和空域冗余 9。 3、统计(熵)冗余 10。 湘潭大学硕士论文 AVS-M 关键技术及多平台应用研究 第 2 页 共 75 页 此外,对于某些特殊类型的视频,可能还存在结构冗余和知识冗余等其他形 式的数据冗余。 视频压缩编码的主要目的是尽可能消除这些冗余,主要方法包括: 1、空间采样 人眼视觉系统由于其频率响应随着空间频率的增长而降低,因此对色差信号 的敏感性不强。利用这一特点,可以在原始数据格式(亮度 Y:色度 Cb:色度 Cr 4:4:4) 的基础上对 Cb 和 Cr 在水平方向进行 2:1 降采样或者在水平和垂直方向 分别进行 2:1 降采样,分别得到

16、采样格式为 4:2:2 和 4:1:1(通常记为 4:2:0)的 数据,从而使数据量分别降低 33%和 50%,达到压缩数据量的目的。 2、时间预测和空间预测 预测编码是数据压缩最有效的手段之一。视频中一帧图像内的数据相关性使 得对于某个数据块可以利用其相邻块的数据信息进行预测,仅保留原始象素与预 测象素之差,从而减小或消除空间冗余;视频中相邻图像帧之间的时间相关性使 得数据块可以利用其相邻图像帧进行预测,仅保留原始象素与预测象素之差,消 除或减小空间相关性。 3、变换和量化 消除视频图像空间相关性更有效的手段是采用频域变换 11,其主要思想是通 过正交变换进行多维坐标系的旋转,把散布在各个原坐标轴上的数据点集中到新 坐标系的少数坐标轴上。常用的变换方法有 K-L 变换、DFT 变换、DCT 变换 12、 Hadamard 变换和小波变换 13等。 4、熵编码 主要是利用信息熵理论,实现变长编码,即对出现概率大的符号用较短的码 字表示,对出现概率小的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号