基于IPP性能库的视频编解码优化

资源描述

《基于IPP性能库的视频编解码优化》由会员分享，可在线阅读，更多相关《基于IPP性能库的视频编解码优化（6页珍藏版）》请在金锄头文库上搜索。

1、基于I P P 性能库的视频编解码优化基于I P P 性能库的视频编解码优化中国传媒大学信息工程学院申辉提要：本文阐述了低码率视频编码国际标准H 2 6 4 的主要内容，介绍应用于视频编解码优化中的I P P 性能库。关犍阀：H 2 6 4 代码优化I P PV i d e oC o d i n gO p r t i m i z a t i o nb a s e do nI P PP e r f o r m a n c eL i b r a r yS h e nH u i( I E S ，C o m m u n i c a t i o nU n i v e r s i t yo fC h i

2、n a ，B e i j i n g ，1 0 0 0 2 4 )A b s t r a c t ：I nt h i sp a p e r 。w ei n t r o d u c e dt h ek e ya s p e c t so ft h el o w b i t r a t ev i d e oc o d i n gs t a n d a r do fH 2 6 4 ，a n dt h eI P Pp e r f o r m a n c el i b r a r y ，曲i c hi su s e di nt h eo p t i m i z a t i o no fv i d e o

3、c o d i n g ，i Sd e s c r i b e d K e y w o r d s ：H 2 6 4 ，C o d eo p t i m i z a t i o n ，I P P 1 引言视频编码的建议从H2 6 1 到H 2 6 2 3 、肝E G 一1 2 和M P E G - 4 都想达到在尽可能低的码率下获得尽可能好的图像质量。然而，随着图像通信的发展，如何适应不同信道传输的需求，如何适应用户对视频自由选择编码的需求等问题相继出现，必须要有一个新的视频编码标准来解决这些问题，这就是新一代图像压缩编码标准H 2 6 4 。H 2 6 4 的视频编码标准在系统结构、运动估计

4、和运动补偿、变换、量化、熵编码等方面都进行了很大改进，大大提高了压缩效率，节省了码率。S 2 6 4 编码的重建图像的主观质量比H 2 6 3 要好得多。H 2 6 4 A V C 具有更高的压缩率和良好的适应传送信道的能力，适用领域广阔，可以用于远程教育、远程监控、可视电话、视频点播、视频会议、视频数据存储、数字电视广播以及移动通信等领域。目前国内外许多通信公司已经开始了H 2 6 4 “c 的开发工作，努力实现实时的编解码系统。随着处理器运算速度的不断提升和算法的不断改进，H 2 6 4 A V C 将逐渐进入实用阶段。J M 6 1 是J v T 给出的测试模型，J M 6 1 与H 2

5、 6 3 ( H L P ) 和M P E G - 2 的性能比较，在相同图像质量下，J M 6 1与H 2 6 3 ( H L P ) 相比，比特率下降了大约4 9 ，与M P E G 2 相比比特率下降了大约6 5 。H 2 6 4 A V C 优良的性能提高是以运算复杂度的提升作为代价的，H 2 5 4 A r C 与M P E G - 2 相比，编码器的复杂度提高了3 4 倍，解码器的复杂度提高了l 2 倍。在目前P c 机的硬件条件下，要实现实时编码就需要在性能上做出一定的牺牲。所以在P c 机环境下实时编解码的程序优化，以提升运行速度也成为一个重要指标。I P P 是I n t e

6、 l 成熟的图象视频处理S D K 库，主要采用M 蜮S S E 、S S E2 、S S E3 等。I n t e l 集成高性能原件( L i n u x * 和W i n d o w s * 版) 。I n t e l 集成高性能原件( I n t e lI P P ) 是一个交叉架构软俘库，提供了大量库功能，用于多媒体，音频编码，视频编码( 例如；H 2 6 4 、H 2 6 3 、M P E G - 4 ) ，图像处理( J P g G ) ，信号2 0 0 6 4 第六届全国因特网与音视频广播发展研讨台( N w c z 0 0 6 ) 3 4 1基于I P P 性能库的视频编解码

7、优化处理，语音压缩( 例如：G 7 2 3 ，G S MA M R ) ，计算机视觉密码系统以及此类处理的数学过程。i n t e lI P P在大多数I n t e l 微处理器上得到了优化，例如：I n t e lP e n t i u m 4 处理器，I n t e lC e n t r i n o 移动技术的I n t e lP e n t i u mM 处理器组件，I n t e lI t a n i u m2 处理器，I n t e lX e o n 处理器，以及基于I n t e lX S e a l e 技术的I n t e lP C A 应用处理器。通过一个跨多种架构上的单一

8、A P I ，独立软件开发商可以获得平台兼容性，减少开发成本。2H 2 6 4 视频绾解码技术H 2 6 4 A V C 编码算法包含两层：网络提取层( N A L ，N e t w o r kA b s t r a c tL a y e r ) 和视频编码层( V C L ，V i d e o C o d i n gL a y e r ) 。N A L 对编码后的视频数据进行封装，用户可以选择封装成包或流以适应传送信道。V C L 实现高效的视频压缩。V C L 仍然沿用H 2 6 3 基于块的混合编码结构，采用帧间预测减少时域冗余，采用帧内预测和变换量化减少空域冗余，采用熵编码减少码间冗余

9、，但在运动补偿、熵编码以及滤波等方面采用了许多先进技术，获得了更好的性能，包括多参考帧、帧内预测、高精度的运动补偿、块大小灵活可变、4 X 4 整数变换和更多的量化等级、自适应的熵编码方法以及更精细的去方块滤波算法。H 2 6 4 编码框图如图1 。图lH 2 6 4 编码框图H 2 6 4 的主要功能目标如下几条：( 1 ) 高压缩率：在所有的速率上，比H 2 6 3 节省5 0 的比特率，在高比特率时质量优良；( 2 ) 采用简洁的设计方式，简单的语法描述，避免过多的选项和配置，尽量利用现有的编码模块；( 3 ) 低时延，对不同的业务灵活地采用相应的时延限制；( 4 ) 加强对误码和丢包的

10、处理，增强解码器的差错恢复能力；( 5 ) 在编解码器中采用复杂度可分级设计，在图像质量和编码处理之间可分级，以适应高和低复杂性的应用；( 6 ) 提高网络适应性，采用“网络友好( N e t w o r kF r i e n d l i n e s s ) ”的结构和语法，以适应I P 网络、移动网络的应用；( 7 ) H 2 6 4 编码基本档次( B a s e l i n eP r o f i l e ) 的使用无需版权。H 2 6 4 在编码端采用多参考图像( 2 个以上) 和扩大的搜索范围对编码效率只有有限的提高，但却是晟重要的复杂度瓶颈：采用哈达马变化虽然可以提高P S N R

11、值，但同时会提高比特率和复杂度；C A B A C 能够节省一定的波特率，但是需要比基本I N L C 更多的计算量和存储容量；同时，采用双向预测技术能提高码率，但也增加了复杂度。R D O 算法可以提高P S N R 值大约0 5 d B 。码率也会降低5 ，但缺点是影响了编码速3 4 22 0 0 6 4 第六届全国因特网与音视频广播发展研讨会( N W C 2 0 0 6 )基于I P P 性能库的视频编解码优化度。在解码端，影响存取频率和解码速度的主要因素是双向预测技术，同时C A B A C ，R D O 和H a d a m a r d 变换等算法的实现也会增加解码的复杂度。对于帧

12、间预测技术，在编码器中加入率失真优化的运动估值和模式选择算法，均衡考虑编码质量和复杂度，预先估计当前编码块最可能采用的块形状和预测位置。同时在运动补偿的过程中，也不必遍历预测可利用适当的数学方法选择模式并及时跳出预测过程。同样地，对于多参考图像和扩大的搜索范围必须要采用合理的机制每种模式进行预测；也可以利用已处理的预测块信息，合理调接在编码效率和速度上做出有效的判断和权衡。为了减少运算复杂度，1 2 像素插值和1 4 像素插值应合理调度和重用，在有限的资源下达到处理速度和计算复杂度的均衡。对于帧内预测技术，其优化思想类似于帧间预测技术，利用时域上前后编码图像块以及空间上前后编码图像块的信息，在

13、编码器中加入率失真优化的模式选择算法。当然，实际开发编码器的时候也可以采用简单的加权算法而不需较复杂的R D O 计算，以减少计算量提高速度；利用已处理的编码模式信息，合理选择下一步预测模式和及时跳出预测。J 系列的测试程序是用纯C 语言写成的，庞大全面但不适于实际应用。进行优化时除了以上所说的算法层上的优化思想之外，还可以运用C 和汇编混合编码的方法进行程序优化，主要有m 和S S E 技术，以及I P P 技术都是很好的汇编优化。应用于编码过程中的那些算法简单但过程复杂的部分( 如D C T 、量化、哈达马变换等) ，可以大大提高编码速度。3 基于I P P 性能优化I P P ( I n

14、 t e g r a t e dP e r f o r m a n c eP r i m i t i v e ) 是I n t e l 个人互联网用户架构中的重要组成部分，它在操作系统之上向应用程序提供功能调用，同时又直接立足于硬件，穿越了操作系统。I P P 的最大优势在于对各个函数进行了汇编级上的优化：根据C P U 的流水线和总线特性采取措施，可提高访问速度和处理速度。I P P 库函数具有多层处理功能。对功能较弱的，可选择I P P 库的底层函数；对于较强功能，可选用一个合适的高层I P P 函数；用底层函数的组合也可替代高层函数，应算法要求还能做出改动，这使得对编解码算法优化有着很大

15、的灵活性。例如按照M P E G 4 编码规范，在M i c r o B l o c k 层和B l o c k 层，用I P P 做出算法优化( 如图2 ) ，可以达到大幅度提高编解码效率和提升系统实时性的目的。图2 编解码的算法结构I P P 是构建在底层的函数库，因而可以充分利用不同类型处理器的多媒体功能，如x 8 6 体系架构中的埘x ，S S E 和S S E 2 技术，I t a n i u m 系列和X S c a l e 系列自带的指令集等。I P P 库中的同一个函数有针对不同处理器的多个版本，在调用的时候，它会自动检测所用处理器的类型，从而选用对应的指令版本，因此用户在使用

16、的时候不必考虑硬件特性，只要通过简单的A P I 就可以实现跨平台的开发。I P P 库中提供专用和2 0 0 6 4 第六届全国因特网与音视频广播发展研讨会( N W C 2 0 0 6 ) 3 4 3基于I P P 性能库的视频绾解码优化通用两种函数。视频编码的通用函数包括D C T ，S A D 计算等，因此只要把编码器B l o c k F u n c t i o n s 模块的函数用I P P 库中的相应函数代替，即可在编码过程中调用I P P 库的函数，从而提高程序的运行效率。在H 2 6 4 代码优化过程中首先，对产生C 代码并进行时间评估。一般情况下，这个阶段的代码性能很低。如果经过评估后，仍然满足不了实时要求的话，需要进入下一阶段以进一步改进代码性能。第二阶段：利用优化选项、内联函数以及其它优化方法改进C 代码。如果代码仍不能达到所期望的效率，则进入第三阶段。第三阶段：从C 代码中抽出对性能影响大的代码段，用线性汇编重新写这段代码，然后利用汇编优化器优化

展开阅读全文