STI+Cell多核处理器在H264高清实时编码中的应用研究

上传人:jiups****uk12 文档编号:40354055 上传时间:2018-05-26 格式:PDF 页数:77 大小:958.33KB
返回 下载 相关 举报
STI+Cell多核处理器在H264高清实时编码中的应用研究_第1页
第1页 / 共77页
STI+Cell多核处理器在H264高清实时编码中的应用研究_第2页
第2页 / 共77页
STI+Cell多核处理器在H264高清实时编码中的应用研究_第3页
第3页 / 共77页
STI+Cell多核处理器在H264高清实时编码中的应用研究_第4页
第4页 / 共77页
STI+Cell多核处理器在H264高清实时编码中的应用研究_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《STI+Cell多核处理器在H264高清实时编码中的应用研究》由会员分享,可在线阅读,更多相关《STI+Cell多核处理器在H264高清实时编码中的应用研究(77页珍藏版)》请在金锄头文库上搜索。

1、上海交通大学硕士学位论文STI Cell多核处理器在H.264高清实时编码中的应用研究姓名:张云斐申请学位级别:硕士专业:控制理论与控制工程指导教师:陈黎平20080101上海交通大学硕士学位论文 III STI Cell 多核处理器在多核处理器在 H.264 高清实时编码中的应用研究高清实时编码中的应用研究 摘摘 要要 随着视频会议、 高清电视、 智能监控系统等视频业务的不断推广,需要实时视频编码的领域也越来越多。 人们对视频的尺寸和质量的要求也越来越高。 分别采用专用芯片、 高速 DSP 和通用 PC 的实现方式是目前最常见的视频编码解决方案。 高清实时编码所需要的庞大的计算量和数据通信带

2、宽,使视频编码专用芯片规模膨胀,大大增加了芯片研发的风险;也使采用 DSP 和基于 PC 的解决方案系统组建更加复杂。基于单芯片多核处理器的并行计算的不断发展使高清实时编码有了新的选择。 本文提出了采用 IBM, SONY,Toshiba 联合研发的 Cell 多核架构的.264 高清实时编码解决方案。Cell 是一个异构多核处理器,主核是一个 PowerPC,通过高速的 EIB 总线与外围 8 个支持高达 128位矢量运算的协处理器相连。峰值计算能力达 256GFLOPS,在高清编码方面有很大的潜力。 本文首先介绍了 Cell 的架构,并总结了基于 Cell 的并行程序设计的优化策略。在介绍

3、了 H.264 视频编码算法特性基础上,分析了整个视频编码过程在 GOP 和帧级,Slice 和宏块层次,以及数据级的可并行性。 上海交通大学硕士学位论文 IV 结合 Cell 的异构多核架构的特点,提出了针对 19201152 的高清视频的数据分割策略,在串行视频编码软件 X264 的基础之上设计了由主核控制协调,8 个协处理器协同工作的并行编码结构。整体结构具有可扩展性,随着编码器核心模块的不断优化,可以很方便地调整结构, 以不断减少协处理器之间的数据同步的通信开销和由于协处理器负载不均衡造成的等待。 Cell 处理器的强劲计算性能源于 8 个 128 位的矢量运算核心。 最后一部分讨论了

4、对 H.264 编码核心算法在数据级并行优化的方法, 包括整数 DCT、哈德码变换,及其反变换,量化与反量化,运动估计评判准则 SAD 和 SATD,以及对参考图像的插值运算。这些模块在数据级的并行度非常高,SIMD 优化过后,在单个协处理上的加速比一般在 5-40 倍。 H.264 高清实时编码是一个复杂的应用,编码器中所包含的并行运算的充分挖掘,自适应可扩展的并行编码结构和结合 Cell 架构的具体实现都有很多地方还需要继续深入研究。 关键词:关键词: 视频编码,并行计算,Cell B.E., H.264 上海交通大学硕士学位论文 V RESEARCH OF APPLICATION OF

5、STI CELL BROAD ENGINE ON H.264 HD ENCODING ABSTRACT With the widely use of video conference, HDTV, and intelligent surveillance systems, the real-time video encoding is needed by more and more areas. Meanwhile, the requirement for the large video size and high quality is also increased. ASIC, DSP an

6、d PC are three most common solutions of video encoding. Due to the extremely large calculation and data communication bandwidth for HD real-time encoding,the scale of ASICs for HD video encoding are enlarged greatly, which causes the development of ASIC is much riskier. And the systems based on DSP

7、and PC become even more complex for real-time HD video encoding. However, the parallel computing based on a CMP (Chip Multi-Processor) provides a new way to fulfill the task. The paper describes a method based on Cell architecture, which is developed by IBM, SONY and Toshiba, to implement HD real-ti

8、me encoding. Basically, Cell is an AMP (Asymmetric Multi-Processor), the host of which is a PowerPC connected with eight SPEs (Synergistic Processor Elements) by high speed EIB (Element Interconnect Bus) bus. Each SPE supports 128-bit vector computation. The peek performance of 上海交通大学硕士学位论文 VI Cell

9、can reach 256 GFLOPS, which satisfies the need of HD video encoding. First of all, the paper introduces the architecture of Cell. Then some strategies for parallel programming, including system structure, memory management and SIMD on Cell, are summarized. Lately, based on the analysis of the H.264

10、encoding algorithm, the paper analyzes the parallelism of H.264 encoding on the level of GOP, frame, slice and macro-block respectively. Taking the AMP architecture of Cell into account, the paper proposes a strategy of data segmentation for 19201152 HD video. The parallelized structure for H.264 en

11、coding is based on x264 which is an Open Source H.264 encoder. In the parallelized structure, the dataflow is controlled by the PPE, and eight SPEs are used to accelerate the key modules of H.264 encoding. The structure is designed to be flexible, which means it can be adjusted during the optimizati

12、on of the key modules to reduce the overhead caused by data synchronization or unbalanced overload on each SPE. The powerful performance of Cell comes from eight 128-bit vector computation units。The key modules of H.264 encoding,such as IDCT(integer DCT),inverse IDCT,Hadamard Transform, inverse Hada

13、mard Transform, quantization and dequantization, SAD (Sum of Absolute Difference), SATD (Sum of Absolute Transformed Difference) 上海交通大学硕士学位论文 VII and interpolation for reference frame of sub-pixel,are parallelized at data level,reaching as high as five to forty times speed of the original ones on a

14、single SPE. The real-time H.264 HD video encoding is a very complex application. There are many interesting areas such as exploiting the parallelism in video encoder, the design of a adaptive parallel structure and the practical implementation using multi-SPE,worth of further studying. KEY WORDS: Vi

15、deo Encoding, Parallel Computing, Cell B.E., H.264 上海交通大学硕士学位论文 I 上海交通大学上海交通大学 学位论文原创性声明学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名:张云斐 日期:2008 年 1 月 20 日 上海交通大学硕士学位论文 II 上海交通大学上海交通大学 学位

16、论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、 使用学位论文的规定, 同意学校保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和借阅。 本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密保密,在 年解密后适用本授权书。 本学位论文属于 不保密不保密。 (请在以上方框内打“” ) 学位论文作者签名:张云斐 指导教师签名:陈黎平 日期:2008 年 1 月 20 日 日期:2008 年 1 月 20 日 上海交通大学硕士学位论文 1 1 绪论 1.1 研究背景 近年来,随着计算机、网络和通信等信息技术的迅猛发展,越来越多的视频业务不断涌现,如视频广播、视频监控系统、视频会议、HDTV 等。这些业务直接促成了适应不同应用的视频编码标准的诞生, 并不断激励着各种各样的视频编码解决方案的出现。在这些业务中间,像视频会议,视频监控,以及电视直播等应用,都需要在线实时编码。随着计算技术的发展和人们消费需求的不断

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号