多媒体技术多媒体数据压缩编码技术

资源描述

《多媒体技术多媒体数据压缩编码技术》由会员分享，可在线阅读，更多相关《多媒体技术多媒体数据压缩编码技术（47页珍藏版）》请在金锄头文库上搜索。

1、第四章、多媒体数据压缩编码技术本章要点（1）多媒体数据压缩编码的重要性和分类。（2）量化的基本原理和量化器的设计思想。（3）常用压缩编码算法的基本原理及实现技术、预测编码、变换编码、统计编码(Huffman 编码、算术编码)。（4）静态图像压缩编码的国际标准（JPEG ）原理、实现技术，以及动态图像压缩编码国际标准(MPRG)的基本原理。4.1 多媒体数据压缩编码的重要性和分类4.1.1 多媒体数据压缩编码的重要性 4.1.2 多媒体数据压缩的可能性 4.1.3 多媒体数据压缩方法的分类4.1.1 数据压缩编码的重要性21世纪的人类社会将是信息化社会，数字化后的信息具有数据海

2、量性。从目前的应用状况来看，数据压缩技术是多媒体技术中最重要的关键技术之一。多媒体技术应用和发展，得益于多媒体数据压缩技术的突破性进展。从如下两方面说明数据压缩的重要性: （1）声音（2）图像（静态图像和动态视频）数据压缩的重要性声音具有CD音乐激光唱盘音质波形声音的典型参数：采样频率44.1KHz量化位数：16位立体声声道数：2数据量：约0.17MB/秒注：数据量（采样频率量化位数声道数）/8根据上面公式可以计算出以上数据量所需的存取时间：在650MB的光盘中存放时间约1小时。数据压缩的重要性（2）图像静态图像：一幅中等分辨率的位图图像（ 640480，256色），典型

3、参数为： a.图像分辨率：640480 b.图像颜色数：256（=28） c.颜色深度(位)：8 d.数据量为：约0.3MB注：数据量（垂直分辨率水平分辨率颜色深度）/8对于以上数据量，在1.44MB的软盘中能存放约5幅静态图像。若用速率（2400bps）的电话线传输，一幅静态图像约需要传送17分钟。动态视频：一幅中等分辨率24位真彩色的位图图像（640480，24位/像素），典型参数为： a.图像分辨率：640480 b.图像颜色数：16,777,216（=224） c.颜色深度(位)：24 d.数据量为：约0.9MB对于以上数据量，若用NTSC制式（30帧/秒）播放动态视频，

4、需要约27MB/秒的视频传输速度，在 650MB的光盘中存放时间约24秒。综上所述：在不经过数据压缩情况下，CD唱机和CD视频播放机根本无法达到实用目的。目前一张 650MB的CD激光唱盘可以连续播放约2小时的立体声音乐，而一张650MB的CD激光视盘可以连续播放约75分钟的视频电影。说明压缩的余地相当大。同样，传输中也存在同样的困难。网络带宽受限。信息量与数据量的关系I = D - dunI 信息量nD数据量ndu冗余量压缩冗余例如1988年Barnsley采用分形（ Fractor）的迭代函数系统IFS和递归迭代函数系统RIFS方法，对几幅图像进行压缩编码，获得了高达10000

5、:1的压缩比。以压缩形式存储和传输信息，既节省了空间，又提高了通信干线的传输率，同时也便于计算机实时处理视频和音频，高质量播放视频和音频节目成为可能。冗余举例1. 冗余在平时说话时是大量存在的。 2. 中文广播员一分钟读180个汉字,一个汉字两个字节, 360个Byte 。采样1分钟，8K 60 = 480 K Byte/分480 K byte / 360 byte = 1000倍的冗余 3. 中文百科全书扫描进入计算机冗余更大。 200万字X2=40000004MByte B5扫描（185X255 300dpi ）一页为6.61M Byte 200万字1000页为6.61G

6、4. 图像信息、视频信息的冗余就更大了。4.1.2 多媒体数据压缩的可能性信息之所以能进行压缩，是因为信息本身通常存在很大的冗余量。1.空间冗余例: 图像中的“A”是一个规则物体。光的亮度、饱和度及颜色都一样，因此，数据A有很大的冗余。A2.时间冗余例: 序列图像。AF2AF13.结构冗余图像有非常强的纹理结构，图像的象素值存在着明显的分布模式。4.知识冗余图像的理解与某些基础知识有关。例:人脸的图像有同样的结构：嘴的上方有鼻子，鼻子上方有眼睛，鼻子在中线上知识冗余是模型编码主要利用的特性。5.视觉冗余人的视觉系统对图像场的敏感性是非均匀、非线性的。（1）对图像亮度和色差的敏

7、感性相差很大Y：U：V8：4：4 或者Y：U：V8：2：2 （2）随着亮度增加，视觉系统对量化误差的敏感度降低。（3）人的视觉系统把图像边缘和非边缘区域分开处理。6.图像区域的相同性冗余图像区域的相同性冗余是指在图像中的两个或多个区域对应的所有象素值相同或相近。那么只记录一个区域中各象素的颜色值，其他相同或相近区域就不需再记录了。7.信息熵冗余信息量：指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。信息熵：指一团数据所带的信息量，平均信息量就是信息熵（entropy）。例如:从64个数中选出某一个数。可先问“是否大于32?”消除半数的可能,这样只要6次就可选出

8、某数。如果要选择的数是35,则过程如下: 1.大于/小于 32？大 2.大于/小于 32+16=48？小 3.大于/小于 48-8=40？小 4.大于/小于 40-4=36？小 5.大于/小于 36-2=34？大 6.大于/小于 34+1=35 等如果要选择的数是63,则其过程如下:1.大于/小于 32？大2.大于/小于 32+16=48？大3.大于/小于 48+8=56？大4.大于/小于 56+4=60？大5.大于/小于 60+2=62？大6.大于/小于 62+1=63 等这是因为每提问一次都会得到1比特的信息量。因此，在64个数中选定某一数所需的信息量是 log264=6(bit

9、s)信息量：指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。设从N个数中选任意一个数X的概率为 P(x)，假定选定任意一个数的概率都相等， P(x)= 1/N，因此定义信息量I(x) =log2N= -log2(1/N)= -log2P(x)=IP(x)信息量：指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。信息熵：指一团数据所带的信息量，平均信息量就是信息熵（entropy）。如果将信源所有可能事件的信息量进行平均，就得到了信息熵(entropy)。熵就是平均信息量。4.1.3 多媒体数据压缩方法的分类按压缩方法分:(1) 有失真压缩(2) 无失真压

10、缩1、数据压缩方法分类一般说来，数据可分为两大类，一类是将模拟信号数字化后得来的多媒体数据，另一类是与文字和字符有关的文本数据，两类数据所采用的数据压缩方法相应不同。文本数据压缩和多媒体数据压缩在算法上的区别主要表现在两个方面：其一，是否允许有误差；其二，算法有没有高级模型可以利用。从信息论的角度，根据数据压缩的基本原理，数据压缩方法可分成如下两类：(1).无损压缩法 (2).有损压缩法（1）无损压缩法无损压缩法也称冗余压缩法。当信源编码的熵大于实际熵时，通过编码，消除冗余熵，达到数据压缩目的。因为这类方法在编码时仅消除冗余熵，而没有损失有用信息，解压时这些冗余可以重新插

11、入到数据中，保证解压后能无失真地恢复数据，可实现无损压缩，压缩过程可逆。压缩比2:1至5:1。典型的冗余压缩法（即无损压缩法）有如下种： a.哈夫曼（Huffman）编码 b.香农-弗诺（Shannon-Fano）编码 c.算术编码 d.游程（Run-Length）编码，又称行程编码以上编码均可归类为统计编码，其编码原理是基于信源符号之间存在分布不等概性。（2）有损压缩法有损压缩法也称熵压缩法。这类方法在允许一定程度失真的前提下进行压缩编码，通过压缩少量有用的熵，达到增大压缩比的目的。从而造成部分有用信息的损失，解压时无法完全恢复原有数据，是有损压缩，压缩过程不可逆。压缩比

12、10:1(静态)至200:1(动态)。2、数据压缩编码方法（1）预测编码根据离散信号之间存在一定关联性的特点，利用前面一个或多个信号对下一个信号进行预测。其中典型的压缩算法有DPCM、ADPCM等，它们较适合于音频数据的压缩。下面分别介绍如下。a. DPCM（差分脉码调制）DPCM系统由压缩、解压缩两部分组成。压缩时，原始的模拟信号先经过时间采样，然后对每一样值都进行量化，作为数据信号传输。解压缩时，将预测值与存储的已量化的差值相加，产生近似的原始信号，基本恢复原始数据。DPCM系统框图如下图所示。DPCM系统框图（1）预测编码（续）b. ADPCM（自适应差分脉码调制）采用自

13、适应差分脉码调制技术可以减少倾斜过载产生的误差。实现自适应差分脉码调制最常用的方法是根据信号分布不均匀的特点，自适应地改变量化器输出动态范围及量化器判决电平(量化器步长)。若想利用差分脉码调制或自适应脉码调制达到2：1以上的压缩比时，倾斜过载或边缘量化现象会显得非常突出，这是一个致命的弱点。（2）变换编码变换编码是指先对信号进行某种函数变换，从一种信号（空间）变换到另一种信号（空间），然后再对变换后的信号进行编码。变换编码系统中压缩数据有三个步骤：变换、变换域采样和量化。变换本身并不进行数据压缩，它只把信号映射到另一个域，使得信号在变换域时容易进行压缩。变换编码系统组成

14、如下图所示。变换编码系统框图（3）统计编码统计编码是根据消息出现概率的分布特性而进行的压缩编码。这种编码的宗旨在于，在消息和码字之间找到明确的一一对应关系，以便于在恢复时能准确无误地再现出来，或者至少是极相似地找到相当的对应关系，并把这种失真或不对应概率限制到可容忍的范围内。最常用的统计编码是Huffman编码，是对出现频率大的符号用较少的位数来表示，而对出现频率小的符号用较多的位数来表示。（4）混合编码混合编码指的是对信源数据同时使用两种或两种以上编码方法进行组合的编码方法，可根据多媒体数据源中各类数据的不同特点，综合运用多种编码方法进行数据压缩，取长补短，使综合效果

15、达到最佳，大大提高数据压缩的效率。4.2 量化4.2.1 量化原理 4.2.2 标量量化器的设计 4.2.3 矢量量化4.2.1 量化原理量化处理是使数据比特率下降的一个强有力的措施。量化处理总是把一批输入，量化到一个输出级上，所以量化处理是一个多对一的处理过程，是个不可逆过程，量化处理中有信息丢失。数据压缩编码中的量化处理，不是指A/D变换后的量化，而是指经正交变换、差分、或预测处理后，熵编码之前，对正交变换系数、差值或预测误差的量化处理。4.2.2 标量量化器的设计量化器的设计要求通常设计量化器有下述两种情况：1. 给定量化分层级数，满足量化误差最小。2. 限定量化误差

16、，确定分层级数，满足以尽量小的平均比特数，表示量化输出。量化方法有标量量化和矢量量化之分，标量量化又可分为，均匀量化、非均匀量化和自适应量化。（1）均匀量化如果量化值是均匀分布的，我们称之为均匀量化。设为量化阶距，量化器的最大范围是Xmax，则： D =22XBmax对于小于D+) 21(i，而大于D-) 21(i的样值，均规定为相同的量化值 Di。抽样值)(nTx与未量化样值)(nTx的关系是： )()()(nenTxnT+=)(ne是量化误差（量化噪声）x步长为八阶的均匀量化器（2）非均匀量化均匀量化的优点是简单，而今天非均匀量化器也很容易实现了，许多信号和参数都更适合用非均匀量化器处理。一种常见的非均匀量化器的特性如下图所示，当输入在b1 b2范围内量化步长大；当输入在0 b1， b2 255范围内量化步长小。通过选择不同的步长使某种输入的量化误差函数达

展开阅读全文

多媒体技术 多媒体数据压缩编码技术

最新文档

多媒体技术多媒体数据压缩编码技术