多媒体技术基础及应用刘健第7章节多媒体数据压缩技术

资源描述

《多媒体技术基础及应用刘健第7章节多媒体数据压缩技术》由会员分享，可在线阅读，更多相关《多媒体技术基础及应用刘健第7章节多媒体数据压缩技术（102页珍藏版）》请在金锄头文库上搜索。

1、多媒体技术及基础应用,第七章多媒体数据压缩技术,7.1多媒体数据的特点和压缩必要,7.1.1 多媒体数据的特点 1.数据量常规数据采用了编码表示，数据量较小，而多媒体数据的数据量巨大，两者之间的差别可大到几千、几万甚至几十万倍。 2.数据长度常规数据的数据项一般是几个字节或几十个字节，在组织存储时一般采用定长记录处理，而多媒体数据的数据量大小是可变的，并且无法预先估计。,7.1多媒体数据的特点和压缩必要,3 .数据类型数据类型间差距较大，主要表现在：不同媒体的存储量差别大；不同类型的媒体由于内容和格式不同，相应的内容管理、处理方法和解释方法也不同；声音和动态影像视频的时基媒体与建

2、立在空间数据基础上的信息组织方法有很大的不同。 4 .数据定义及操作传统的关系数据库，包括描述语言、数据操作语言等，都不能适应多媒体数据。,5 .数据的输入和输出多媒体数据的输入方式分为两种：即多通道异步方式和多通道同步方式。由于涉及的设备较多，因此输出较为复杂。 6 .数据传送多媒体数据要求连续传送，否则将导致严重失真，极大的影响效果，这就要对计算机的处理速度、I/O、内存、网络传输的带宽及软件算法等方面提出了比处理常规数据更高的要求。,7.1多媒体数据的特点和压缩必要,7.1多媒体数据的特点和压缩必要,7.1.1 多媒体数据压缩的必要 1.数字化的音频、视频信号的数据量大得惊人 2.

3、要使媒体信息在计算机中能够使用，关键的问题就是如何减少巨大的数据量，以减少占用的存储空间和数据传送量，并使原来的声音和图像不失真 3.解决这些问题的办法就是要对音频、视频的数据进行大量的压缩，然后存储,7.2 数据冗余的分析,1.空间冗余图像数据中经常存在的一种冗余，在一幅图像中记录的可见景物的颜色，一般都有连续的有规则物体和规则背景的颜色分布，使图像数据在空间上表现出相关性。 2.时间冗余时间冗余是指在图像序列中，相邻帧图像之间有较大的相关性 3.结构冗余有些图像从大体上看存在非常强的纹理结构，这些纹理具有较强的相似性，称为结构冗余,7.2 数据冗余的分析,4.知识冗余有很多图像的

4、理解与某些基础知识有很大的相关性，这类规律性的结构可由先验知识和背景知识得到，这类冗余称为知识冗余 5.视觉冗余人的视觉系统有一定的限度，人类视觉系统对图像场的敏感性是非均匀和非线性的，人眼并不能觉察图像场的所有变化，我们将这种冗余称为视觉冗余。,7.2 数据冗余的分析,6.听觉冗余人耳对不同频率的声音的敏感性是不同的，并不能觉察所有频率的变化，对某些频率不需要关注，因而存在听觉冗余,7.3 多媒体数据压缩方法分类,1.无失真压缩无失真压缩也称为无损压缩、可逆压缩，它不会产生失真，压缩前和解压缩后的数据是完全一致的。 2.有失真压缩有失真压缩也称为有损压缩、不可逆压缩，允许一定程度的失

5、真，在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息，并且丢失的信息不能再恢复,7.3 多媒体数据压缩方法分类,7.3 多媒体数据压缩方法分类,7.3.1 哈夫曼编码技术 1.编码过程 (1) 把事件按照出现的概率由大到小排成一个序列，即P(1)P(2)P(3)P(Sm-1)P(Sm)，将信息源事件按照概率递减的顺序排列； (2) 把其中两个最小的概率P(Sm-1)和P(Sm)挑出来，并且将事件“1”赋给其中最小的事件P(Sm)，将事件“0”赋给另一个较大的事件P(Sm-1)； (3) 把两个最小概率相加作为新事件的概率，即求出P(Sm-1)，P(Sm)的和P(Si)，P(Si)是对

6、应于一个新消息的概率；,7.3 多媒体数据压缩方法分类,P(Si)P(Sm-1)P(Sm) (4) 将P(Si)与上面未处理的(m-2)个消息的概率重新按照由大到小的顺序排列，构成一个新的概率序列； (5) 重复上述步骤(2)(4)，在每次合并信息源事件时，将被合并的信息源分别赋“0”和“1”值，直到所有m个事件的概率都全部合并处理为止； (6) 寻找从每一个信息源事件到概率总和为“1”处的路径，对每一个信息源事件写出“1”、“0”序列（从树根到信息源事件节点），作为码字。,7.3 多媒体数据压缩方法分类,2.举例例7.1：下表为某信息源发出的8个消息事件以及其相应出现的概率，用哈夫曼方法对

7、其进行编码。,7.3 多媒体数据压缩方法分类,编码过程为：,7.3 多媒体数据压缩方法分类,编码结果为：,7.3 多媒体数据压缩方法分类,3.平均码字长度的计算 4.图像的信息熵H(S)定义 5.编码效率的定义,7.3 多媒体数据压缩方法分类,6.哈夫曼编码的缺点必须精确的统计出原始文件中每个值出现的频率，否则压缩的效果就会很差，甚至根本达不到压缩的效果对于位的增删比较敏感，这是由于哈夫曼编码的所有位都是合在一起而不考虑字节分位的，因此增加一位或者减少一位都会使译码结果面目全非,7.3 多媒体数据压缩方法分类,7.3.2 行程编码 1.基本思路把一系列的重复值（如图像象素的灰度值）用一个

8、单独的值再加上一个计数值来取代 2.举例例7.2 传送的黑白图像如下图所示，包含8行、8列共64个像素，图中的像素位表示各个连续的像素点，像素值表示一个像素点的灰度值，分别用0，1，8表示。,7.3 多媒体数据压缩方法分类,编码结果为： (8,8)(4,8)(4,7)(8,7)(4,6)(4,5)(5,5)(3,3)(8,3)(4,3)(4,2)(4,1)(4,0),7.3 多媒体数据压缩方法分类,3.特点行程编码技术适用于计算机生成的图形图像和黑白二值图像的编码，它能够显著减少存储容量，而且运算过程也比较简单，解压缩速度很快。如果图像中具有相同颜色的横向色块越大、这样的图像块数目越多，

9、压缩比就越大；反之就越小。因此行程编码不适用于自然图像。,7.3 多媒体数据压缩方法分类,7.3.3 算术编码 1.编码过程将被编码的信息表示成0和1之间的间隔，即对一串符号直接编码成0,1)区间上的一个浮点小数，在传输任何符号串之前，符号串的完整范围为0,1) 当一个符号被处理时，这一范围就根据分配给这一符号的区间变窄，间隔变小信息越长，编码表示它的间隔就越小，表示这一间隔所需的二进制位就越多算术编码前，需要先对符号串的所有符号进行扫描，并计算每个符号出现的次数和每个符号的概率。,7.3 多媒体数据压缩方法分类,2.举例例7.3 假设有一信息源“multimedia”包含10个字符

10、，每个字符的概率分布如下表所示，用算术编码对该信息源进行编码。,7.3 多媒体数据压缩方法分类,按照符号串“multimedia”中每个符号出现的概率对区间进行划分，每个符号都对应一个子区间，分配范围如下表所示。,7.3 多媒体数据压缩方法分类,初始化时，对应的区间为0,1)，即high1，low0，rangehighlow101，下一个被分割区间的低端low和高端值high由下述公式计算： lowlowrangerange low highlowrangerange high 对第一个字符m，m的range low0.6，range high0.8，m被传送时的编码范围计算为： lowlow

11、rangerange low010.60.6,7.3 多媒体数据压缩方法分类,highlowrangerange high010.80.8 rangehighlow0.80.60.2 m将编码范围0,1)划分为0.6,0.8)。对第二个字符u，u的range low0.9，range high1，u被传送时的编码范围计算为： lowlowrangerange low0.60.20.90.78 highlowrangerange high0.60.210.8 rangehighlow0.80.780.02,7.3 多媒体数据压缩方法分类,u将编码范围0.6,0.8)划分为0.78,0.8) 如

12、此重复，得到最后的编码区间划分为：,7.3 多媒体数据压缩方法分类,用该区间内的一个浮点数0.791685704代表字符串“multimedia” 3.解码过程在解码时，首先判断编码值落在哪个字符的子区间来决定信息源字符串中的第一个字符解码过程的公式为：,7.3 多媒体数据压缩方法分类,7.3.4 LZW编码算法 1.LZW的编码过程在程序开始的时候，前缀码和当前串都为空读入一个字符后，当前串等于前缀码对应的串（一个空串）加上读入的字符，也就是当前串只包含刚读入的一个字符程序到已经初始化的串表中查找当前串，如果在串表中能够找到当前串，将当前串对应的代码赋给前缀码,7.3 多媒体数据压

13、缩方法分类,如果此时串表已满，执行初始化操作，把串表、前缀码和当前串都再次初始化，重复上述过程如果串表未满而编码没有结束，则重复读入下一个字符如果串表中不包含当前串，则在串表中创建一个新的数据项，对应当前串中的字符，接着把前缀码中的代码输出，再将前缀码置成刚刚读入的字符所对应的代码,7.3 多媒体数据压缩方法分类,7.3 多媒体数据压缩方法分类,2.举例例7.4 设输入字符串为a b a b c b a b a b a a a a a，用LZW算法对其进行编码。首先建立串表，对输入字符串进行扫描、统计，将所有的单个字符放入串表中并分别赋予码值，因此初始化的串表中只包含3个独立的ASCI

14、I字符a、b、c，相应的代码为1、2和3。,7.3 多媒体数据压缩方法分类,读入第一个字符a，当前串赋为a，由于a在串表中，因此将a对应的代码赋给前缀码。然后读入第二个字符b，当前串变为ab，在串表中没有找到，将ab加入串表中，并输出前缀码1，将前缀码置为字符b对应的代码2 如此重复，得到最终结果为：1 2 4 3 5 8 1 10 10,7.3 多媒体数据压缩方法分类,3.解码过程开始时，将前缀码Prefix和当前串ThisCode都置为空。每次读入一个输入代码，放入ThisCode，接下来判断ThisCode是否在串表中如果ThisCode在串表中，将Prefix对应的字符串和Thi

15、sCode所对应字符串的第一个字符拼接形成的字符串加入串表中如果ThisCode不在串表中，将Prefix对应的字符串和Prefix所对应字符串的第一个字符拼接形成的字符串加入串表中,7.3 多媒体数据压缩方法分类,输出ThisCode代码代表的字符串，将ThisCode的代码赋给Prefix，如果不是最后一个代码，重复上述的解码过程,7.3 多媒体数据压缩方法分类,7.3 多媒体数据压缩方法分类,7.3.5 预测编码技术 1.基本原理在图像编码过程中，可以利用图像像素间的相关性，根据某一个像素点的值来预测下一点的取值，然后将像素点的实际值与预测值相减得到一个误差值，并对该误差值进行编码，

16、这就是预测编码 2.DPCM系统假设DPCM系统的输入样值为Xn，预测器产生一个预测值Xn，通过下述预测公式计算 Xn1Xn-1 2Xn-2+mXn-m,7.3 多媒体数据压缩方法分类,在实际的系统中，量化器的影响不能忽略，经编码后发送端传出的是量化后的预测误差en，en与en的差别是量化引起的误差量化误差Xn Xnenen 在接收端，利用接收到的en与预测值Xn相加，得到重构的样值为 XnenXn 显然，重构的样值Xn与原始样值Xn之间的差别等于量化误差Xn XnXnXnen(Xnen)enenXn,7.3 多媒体数据压缩方法分类,由于在DPCM系统的接收端得不到原始样值Xn ，而只有含量化误差的样值Xn，因此在预测公式中，只能用Xn-1，Xn-2，Xn-m替换Xn-1, Xn-2, Xn-m，即 Xn1Xn-1

展开阅读全文