多媒体技术教程-ch3－金锄头文库

资源描述

《多媒体技术教程-ch3》由会员分享，可在线阅读，更多相关《多媒体技术教程-ch3（87页珍藏版）》请在金锄头文库上搜索。

1、第三章多媒体数据压缩3.1 数据压缩的基本原理和方法3.1 数据压缩的基本原理和方法3.1 数据压缩的基本原理和方法压缩的必要性压缩的必要性音频、视频的数据量很大，如果不进行处理，计算机系统几乎无法对它进行存取和交换。例如，一幅具有中等分辨率（音频、视频的数据量很大，如果不进行处理，计算机系统几乎无法对它进行存取和交换。例如，一幅具有中等分辨率（640480）的真彩色图像（）的真彩色图像（24b/像素），它的数据量约为像素），它的数据量约为7.37Mb/帧，一个帧，一个 100MB（Byte）的硬盘只能存放约）的硬盘只能存放约100帧图像。若要达到每秒帧图像。若要达到每

2、秒25帧的全动态显示要求，每秒所需的数据量为帧的全动态显示要求，每秒所需的数据量为 184Mb，而且要求系统的数据传输率必须达到，而且要求系统的数据传输率必须达到184Mb/s。对于声音也是如此，若采用。对于声音也是如此，若采用16b样值的样值的PCM编码，采样速率选为编码，采样速率选为44.1kHZ，则双声道立体声声音每秒将有，则双声道立体声声音每秒将有176KB的数据量。的数据量。3.1 数据压缩的基本原理和方法视频、图像、声音有很大的压缩潜力视频、图像、声音有很大的压缩潜力信息论认为：若信源编码的熵大于信源的实际熵，该信源中一定存在冗余度。信息论认为：若信源编码的熵大于信

3、源的实际熵，该信源中一定存在冗余度。原始信源的数据存在着很多冗余度：原始信源的数据存在着很多冗余度：空间冗余、时间冗余、视觉冗余、听觉冗余等。空间冗余、时间冗余、视觉冗余、听觉冗余等。3.1.3.1.1 1 数据冗余的类型空间冗余：在同一幅图像中，规则物体和规则背景的表面物理特性具有相关性，这些相关性的光成像结果在数字化图像中就表现为数据冗余。空间冗余：在同一幅图像中，规则物体和规则背景的表面物理特性具有相关性，这些相关性的光成像结果在数字化图像中就表现为数据冗余。一幅图象中同一种颜色不止一个象素点，若相邻的象素点的值相同，象素点间（水平、垂直）有冗余。一幅图象中同一种颜色不止一个象素

4、点，若相邻的象素点的值相同，象素点间（水平、垂直）有冗余。当图象的一部分包含占主要地位的垂直的源对象时，相邻线间存在冗余。当图象的一部分包含占主要地位的垂直的源对象时，相邻线间存在冗余。3.1.3.1.1 1 数据冗余的类型时间冗余：时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性，一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。时间冗余：时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性，一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。音频的前后样值之间也同样有时间冗余。音频的前后样值之间也同样有时间冗余。若图象稳定或只有轻微的改变，

5、运动序列帧间存在冗余。若图象稳定或只有轻微的改变，运动序列帧间存在冗余。3.1.3.1.1 1 数据冗余的类型信息熵冗余：信源编码时，当分配给第信息熵冗余：信源编码时，当分配给第i个码元类的比特数个码元类的比特数b（yi）=-logpi，才能使编码后单位数据量等于其信源熵，即达到其压缩极限。但实际中各码元类的先验概率很难预知，比特分配不能达到最佳。实际单位数据量，才能使编码后单位数据量等于其信源熵，即达到其压缩极限。但实际中各码元类的先验概率很难预知，比特分配不能达到最佳。实际单位数据量dH（S），即存在信息冗余熵。），即存在信息冗余熵。视觉冗余：人眼对于图像场的注意是非均匀的，人眼并不能

6、察觉图像场的所有变化。事实上人类视觉的一般分辨能力为视觉冗余：人眼对于图像场的注意是非均匀的，人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为 26灰度等级，而一般图像的量化采用的是灰度等级，而一般图像的量化采用的是28灰度等级，即存在着视觉冗余。灰度等级，即存在着视觉冗余。3.1.3.1.1 1 数据冗余的类型听觉冗余：人耳对不同频率的声音的敏感性是不同的，并不能察觉所有频率的变化，对某些频率不必特别关注，因此存在听觉冗余。听觉冗余：人耳对不同频率的声音的敏感性是不同的，并不能察觉所有频率的变化，对某些频率不必特别关注，因此存在听觉冗余。其它冗余：包括结构冗余、知识冗余等。

7、其它冗余：包括结构冗余、知识冗余等。3.1.3.1.2 2 数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标节省图象或视频的存储容量，增加访问速度，使数字视频能在节省图象或视频的存储容量，增加访问速度，使数字视频能在PC机上实现，需要进行视频和图象的压缩。机上实现，需要进行视频和图象的压缩。有三个关键参数评价一个压缩系统有三个关键参数评价一个压缩系统压缩比压缩比图象质量图象质量压缩和解压的速度压缩和解压的速度另外也必须考虑每个压缩算法所需的硬件和软件。另外也必须考虑每个压缩算法所需的硬件和软件。3.1.3.1.2 2数据压缩技术的性

8、能指标数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标1压缩比压缩性能常常用压缩比定义（输入数据和输出数据比）例：压缩比压缩性能常常用压缩比定义（输入数据和输出数据比）例：512480， 24bit/pixel(bpp)输出输出15000byte 输入输入737280byte 压缩比压缩比737280/15000493.1.3.1.2 2 数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标2图象质量图象质量压缩方法：无损压缩（图象质量不变）有损压缩有损压缩：失真情况很难量化，只能对测试的图象进行估计。模拟图象质量的指标：信噪比、分辨率

9、、颜色错，但必须在观察了实际图象以后。压缩方法：无损压缩（图象质量不变）有损压缩有损压缩：失真情况很难量化，只能对测试的图象进行估计。模拟图象质量的指标：信噪比、分辨率、颜色错，但必须在观察了实际图象以后。3.1.3.1.2 2 数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标3压缩解压速度压缩解压速度在许多应用中，压缩和解压可能不同时用，在不同的位置不同的系统中。所以，压缩、解压速度分别估计。在许多应用中，压缩和解压可能不同时用，在不同的位置不同的系统中。所以，压缩、解压速度分别估计。静态图象中，压缩速度没有解压速度严格；静态图象中，压缩速度没有解

10、压速度严格；动态图象中，压缩、解压速度都有要求，因为需实时地从摄像机或动态图象中，压缩、解压速度都有要求，因为需实时地从摄像机或VCR中抓取动态视频。中抓取动态视频。3.1.3.1.2 2 数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标4硬软件系统有些压缩解压工作可用软件实现。设计系统时必须充分考虑：算法复杂压缩解压过程长算法简单压缩效果差目前有些特殊硬件可用于加速压缩硬软件系统有些压缩解压工作可用软件实现。设计系统时必须充分考虑：算法复杂压缩解压过程长算法简单压缩效果差目前有些特殊硬件可用于加速压缩/解压解压。3.1.3.1.3 3 数据

11、压缩方法分类根据解码后数据与原始数据是否完全一致可以分为两大类：根据解码后数据与原始数据是否完全一致可以分为两大类：一类是熵编码、冗余压缩法，也称无损压缩法、无失真压缩法一类是熵编码、冗余压缩法，也称无损压缩法、无失真压缩法二是熵压缩法，也称有损压缩法、有失真压缩法。二是熵压缩法，也称有损压缩法、有失真压缩法。从从“熵熵”损失角度分为无损压缩和有损压缩两种：损失角度分为无损压缩和有损压缩两种：无失真压缩，又称熵编码。由于不会失真，多用于文本、数据的压缩，但也有例外，非线性编辑系统为了保证视频质量，有些高档系统采用的是无失真压缩方法。无失真压缩，又称熵编码。由于不会失真，多

12、用于文本、数据的压缩，但也有例外，非线性编辑系统为了保证视频质量，有些高档系统采用的是无失真压缩方法。有失真压缩，又称熵压缩法。大多数图像、声音、动态视频等数据的压缩是采用有失真压缩。有失真压缩，又称熵压缩法。大多数图像、声音、动态视频等数据的压缩是采用有失真压缩。3.1.3.1.3 3 数据压缩方法分类从信息语义角度分为从信息语义角度分为“熵编码熵编码”和和“源编码源编码”两种：两种：熵熵 (平均信息量平均信息量)编码编码(Entropy Coding) 熵编码是一种泛指那些不考虑被压缩信息的性质的编码和压缩技术。它是基于平均信息量的技术把所有的数据当作比特序列，而不根据压缩信息

13、的类型优化压缩。也就是说，平均信息量编码忽略被压缩信息的语义内容。熵编码是一种泛指那些不考虑被压缩信息的性质的编码和压缩技术。它是基于平均信息量的技术把所有的数据当作比特序列，而不根据压缩信息的类型优化压缩。也就是说，平均信息量编码忽略被压缩信息的语义内容。熵编码分为：重复序列消除编码熵编码分为：重复序列消除编码 (含：消零、行程编码含：消零、行程编码)、统计编码等。、统计编码等。源编码源编码(Source Coding) 源编码的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内容等。源编码比严格的平均信息量编码的压缩率更高。当然压缩的程度主要取决于数据的语义内容，比起平均信

14、息量编码，它的压缩比更大。源编码的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内容等。源编码比严格的平均信息量编码的压缩率更高。当然压缩的程度主要取决于数据的语义内容，比起平均信息量编码，它的压缩比更大。源编码主要分为：预测编码、变换编码、向量量化等。源编码主要分为：预测编码、变换编码、向量量化等。3.1.3 数据压缩方法分类Source CodingPrediction : DPCM and DMTransformation : FFT、DCTLayered : Sub-band、Sub- sampling and Bit PositionVector Quantizatio

15、nHybrid CodingJPEG、MPEG、H.261 、 DVI、Intel-IndeoEntropy CodingRun Length CodingStatistical CodingHuffmanArithmetic3.1.3.1.4 4常用数据压缩方法的基本原理1. 统计编码统计编码方法是：识别一个给定的流中出现频率最高的比特或字节模式，并用比原始比特更少的比特数来对其编码。即就是，频率越低的模式，其编码的位数越多，频率越高的模式编码位数越少。若码流中所有模式出现的概率相等，则平均信息量最大，信源就没有冗余。方法是：识别一个给定的流中出现频率最高的比特或字节模式，并用

16、比原始比特更少的比特数来对其编码。即就是，频率越低的模式，其编码的位数越多，频率越高的模式编码位数越少。若码流中所有模式出现的概率相等，则平均信息量最大，信源就没有冗余。3.1.3.1.4 4 常用数据压缩方法的基本原理(1)行程编码行程编码(Run Length Coding) 是最简单、最古老的压缩技术之一，主要技术是检测重复的比特或字符序列，并用它们的出现次数取而代之。该方法有两大模式：一是消零是最简单、最古老的压缩技术之一，主要技术是检测重复的比特或字符序列，并用它们的出现次数取而代之。该方法有两大模式：一是消零(消空白消空白)，二是行，二是行(游游)程程(run length)编码。消零编码。消零(或消空白或消空白)法将数字中连续的法将数字中连续的“0”或文本中连续的空白用一个标识符或文本中连续的空白用一个标识符 (或特殊字符或特殊字符)后跟数字后跟数字N(连续连续“0”的个数的个数)来代

展开阅读全文

多媒体技术教程-ch3

最新文档