基于gpu的h264预测编码优化

上传人:E**** 文档编号:114123983 上传时间:2019-11-10 格式:PDF 页数:73 大小:2.92MB
返回 下载 相关 举报
基于gpu的h264预测编码优化_第1页
第1页 / 共73页
基于gpu的h264预测编码优化_第2页
第2页 / 共73页
基于gpu的h264预测编码优化_第3页
第3页 / 共73页
基于gpu的h264预测编码优化_第4页
第4页 / 共73页
基于gpu的h264预测编码优化_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《基于gpu的h264预测编码优化》由会员分享,可在线阅读,更多相关《基于gpu的h264预测编码优化(73页珍藏版)》请在金锄头文库上搜索。

1、华中科技大学 硕士学位论文 基于GPU的H.264预测编码优化 姓名:程朝 申请学位级别:硕士 专业:计算机系统结构 指导教师:周敬利 2011-01-17 I 华华 中中 科科 技技 大大 学学 硕硕 士士 学学 位位 论论 文文 摘摘 要要 H.264 是一种高性能的视频编码方法,但其在运动估计、帧内预测、插值、变 换和算术编码等方面具有很高的计算复杂度。根据其内在的并行度,通过分析并行 化的瓶颈所在, 合理地设计与分配任务, 并优化对存储器的访问, 使其能够在 CUDA 架构下充分利用 GPU 资源,从而有效地提高 H.264 编码器的速度。 H.264 预测编码的 CUDA 平台优化主

2、要分为帧间预测编码和帧内预测编码两个 部分。针对帧间预测编码中最为复杂、计算量最大的运动估计过程,采用了适合 CUDA 平台的块层级的并行化算法,将整个 H.264 运动估计算法分解成五步完成, 每一步在维持很低的存储器数据传输量的同时使计算达到高度的并行。实验结果表 明,在拥有 GPU 的协助下,帧间预测编码时间是原来的十四分之一。同时,又充分 发掘 GPU 共享存储器和显存并行传输的特点,进一步在数据读写上优化算法,最终 达到了十六倍的加速效果。 针对帧内预测过程中相邻块之间的编码依赖性,提出了一种利用原始图像作为 预测参考帧的帧内预测算法,这样所有的块都可以在同一时间预测编码,消除了相

3、邻块之间的依赖性。实验结果显示,该算法也达到了十倍以上的加速效果。 最后将上述算法在 H.264 编码器中实现,并且在 NVIDIA GTX260 GPU 平台上 验证所提出的算法,实验结果表明,经过优化的预测编码模块都达到了十几倍的加 速效果,同时整个编码器也有近五倍的速度提升,具有明显的优化效果。 关键词:关键词:H.264,运动估计,帧内预测 II 华华 中中 科科 技技 大大 学学 硕硕 士士 学学 位位 论论 文文 Abstract H.264 is an efficient video coding technology, but its motion estimation, in

4、tra prediction, interpolation, arithmetic coding and loop filter have high computational complexity. As the continuous development of graphics processing unit (GPU), using GPU as a coprocessor to assist the central processing unit (CPU) in computing massive data becomes essential .This technique is

5、called general purpose computation on GPU (GPGPU). NVIDIA Corporation announced a powerful GPU architecture called Compute Unified Device Architecture (CUDA) in June 2007. This new architecture largely improves the programming flexibility of GPGPU. In this paper, we focus on the optimization of H.26

6、4 predictive coding for the CUDA architecture. At the beginning of this paper, we make an overview on video coding and its development history, and then made an insight view of H.264 and its technical traits which make it differing from previous coding standards. We analysis the inter prediction and

7、 intra prediction of H.264 prediction coding. For the most complex motion estimation algorithm of inter prediction, we designed a set of efficient algorithm which takes five stages to complete on CUDA platform. In order to achieve the block-level parallelized intra mode selection, the original pixel

8、 values rather than the coded pixels are used for deciding the best intra prediction mode. In addition, to fully utilize the computation power of CUDA, the thread usage and memory access pattern are carefully tuned. The proposed algorithms are evaluated on the NVIDIA GTX260 GPU platform. Experimenta

9、l results show that with the help of GPU, the speed up ratios of these two modules are about 15 times faster, and the overall H.264/AVC encoding time is nearly 5 times faster than the PC only counterpart. Keywords: H.264, motion estimation, intra prediction 独创性声明独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取

10、 得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何 其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人 和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本 人承担。 学位论文作者签名: 日期: 年 月 日 学位论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。 本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密, 在

11、 年解密后适用本授权书。 不保密。 (请在以上方框内打“”) 学位论文作者签名: 指导教师签名: 日期: 年 月 日 日期: 年 月 日 本论文属于 1 华华 中中 科科 技技 大大 学学 硕硕 士士 学学 位位 论论 文文 1 绪绪 论论 随着信息社会的快速发展, 人类所产生的信息量平均每三年翻一番,“信息爆炸” 的时代已经来临。在这些信息当中,人类通过肉眼获取的信息占到总信息量的 70% 到 80%1,由于视频信息拥有丰富的内容,给人以直观生动的图像,所以成为信息传 播的理想载体。但是直接获取的原始视频如果不经过压缩,其数据量是巨大的,特 别是现在高清视频的逐渐普及,若未经压缩,数据量更是

12、惊人。以常见的 1080P 视 频为例,当其以每秒播放 30 帧的速度,YUV 比例为 4:2:0,那么码率是 712Mbit/s(192010803012=746496000)。在传输方面,那将是一个非常耗时的工 作,造成了大量网络资源的浪费,目前正蓬勃发展的无线互联网更是对此望尘莫及; 在存储方面,一个半小时的上述高清视频的数据量达到惊人的 470G,这样大的存储 空间的浪费是绝大多数用户无法接受的;在压缩方面,这么大的数据量对视频编码 软件也是一个巨大的考验。所以,研究高效的视频压缩算法或者对现有的压缩算法 进行加速处理是有必要的。 近年来,多媒体技术发展迅速,其中国际电信联盟运动图像专

13、家组(ITU-T)先后 推出了 H.26X 系列标准,而国际标准化组织视频编码专家组(ISO/IEC)也先后推出了 MPEG-X 系列标准,多媒体技术的视频标准发展如图 1.1 所示。H.264 是上述两个专 家组联合制定的标准, 该标准融合了 MPEG-4 的第十部分和 H.264, 其同等图像质量 下压缩效率提升了几乎两倍2,被公认为最有应用前景的标准。 图 1.1 视频标准的发展历史 2 华华 中中 科科 技技 大大 学学 硕硕 士士 学学 位位 论论 文文 但是,H.264 在获得巨大的性能提升的同时,也是以加大了编码器和解码器的 复杂度为代价的。尤其是编码器的运动预测模块,CPU 承

14、担了极大的计算负荷,容 易造成编码效率低下。近年来图形处理器(GPU)快速发展,并且从单纯的加速图形图 像显示逐渐转变为通用计算,取得了很好的效果。 1.1 研究背景和意义研究背景和意义 1.1.1 H.264 发展概况发展概况 目前多媒体技术发展迅速,应用范围越来越广泛,所以必须要一些组织来制定 大家共同遵循的视频标准,国际上有两个制定视频编解码标准的组织,其中之一就 是国际电信联盟(ITU-T), 它制定了包括 H.261、 H.263、 H.263+等在内的 H.26X 标准, 而另外一个则是国际标准化组织(ISO),它制定了包括 MPEG-1、MPEG-2、MPEG-4 等在内的 MP

15、EG-X 标准123。 而目前研究的热点 H.264 是上述两个组织共同成立的 联合视频小组(Joint Video Team,JVT)一起制定的下一代数字视频编码标准45,所 以所提到的H.264标准既是ITU-T所提出的H.264, 又是ISO/IEC所提出来的MPEG-4 高级视频编码(Advanced Video Coding,AVC),并且将要作为 MPEG-4 视频编码标准 第十部分。所以,可以把上述提到的 MPEG-4 Part 10、MPEG-4 AVC、ISO/IEC 14496-10、H.264/AVC 都称之为 H.264 标准。通常将其称之为 H.264 或者 H.26

16、4 视频 编码标准。 在表 1.1 中,列举了 H.264 和 MPEG-4 两种视频编码标准发展并逐渐成熟过程 中的一些主要事件。MPEG-4 在其刚刚开始发展的时候,把目标放在了升级从前的 MPEG-1 标准和 MPEG-2 标准,使得上述编码标准更加灵活有效,然而二十世纪九 十年代中期,MPEG 意识到国际电信联盟的 H.263 标准拥有更好的压缩性能,于是 确定把基于对象的编码和其相关功能作为新一代 MPEG-4 标准的特征,在 MPEG-4 视频编码标准即将发布时(19981999),ITU-T 推出了新的视频编码标准 H.26L(其中 L 表示长期)评估预案,所以在 2001 年初,尚在开发的 H.26L 标准模型被 MPEG 采 用成为其 MPEG-4 第十部分的基础6。 3 华华 中中 科科 技技 大大 学学 硕硕 士士 学学 位位 论论 文文 表表 1.1 MPEG-4 与与 H.264 的发展历史的发展历史 1993 MPEG-4 项目正式启动,H.263 初步模型出现 1995

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号