第三章多媒体数据压缩技术

资源描述

《第三章多媒体数据压缩技术》由会员分享，可在线阅读，更多相关《第三章多媒体数据压缩技术（94页珍藏版）》请在金锄头文库上搜索。

1、第3章多媒体数据压缩技术本章重点 1 数据压缩的基本概念2 各种压缩技术的分类3 预测编码的基本原理4 变换编码的基本原理5 统计编码的基本原理6 分析合成编码的基本原理7 声音压缩标准8 图像视频压缩标准 3 1数据压缩的基本原理和方法 3 2音频的压缩 3 3图像和视频的压缩第3章多媒体数据压缩技术 3 1数据压缩的基本原理和方法压缩的必要性音频视频的数据量很大如果不进行处理计算机系统几乎无法对它进行存取和交换例如一幅具有中等分辨率 640 480 的真彩色图像 24b 像素它的数据量约为7 37Mb 帧一个100MB Byte 的硬盘只能存放约100帧图像若要达到

2、每秒25帧的全动态显示要求每秒所需的数据量为184Mb 而且要求系统的数据传输率必须达到184Mb s 对于声音也是如此若采用16b样值的PCM编码采样速率选为44 1kHZ 则双声道立体声声音每秒将有176KB的数据量 3 1数据压缩的基本原理和方法视频图像声音有很大的压缩潜力信息论认为若信源编码的熵大于信源的实际熵该信源中一定存在冗余度原始信源的数据存在着很多冗余度空间冗余时间冗余视觉冗余听觉冗余等 3 1 1数据压缩技术的性能指标节省图象或视频的存储容量增加访问速度使数字视频能在PC机上实现需要进行视频和图象的压缩有三个关键参数评价一个压缩系统压缩比

3、图象质量压缩和解压的速度另外也必须考虑每个压缩算法所需的硬件和软件 3 1 1数据压缩技术的性能指标 1 压缩比压缩性能常常用压缩比定义输入数据和输出数据比例 512 480 24bit pixel bpp 输出15000byte输入 737280byte压缩比 737280 15000 49 1 3 1 1数据压缩技术的性能指标 2 图象质量压缩方法无损压缩图象质量不变和有损压缩有损压缩失真情况很难量化只能对测试的图象进行估计 3 1 1数据压缩技术的性能指标 3 压缩和解压速度在许多应用中压缩和解压将在不同时间不同的地点不同的系统中进行所以压缩解压速度分别估

4、计静态图象中压缩速度没有解压速度严格动态图象中压缩解压速度都有要求因为需实时地从摄像机或VCR中抓取动态视频 3 1 1数据压缩技术的性能指标 4 硬软件系统有些压缩解压工作可用软件实现设计系统时必须充分考虑算法复杂压缩解压过程长算法简单压缩效果差目前有些特殊硬件可用于加速压缩解压硬接线系统速度快但各种选择在初始设计时已确定一般不能更改因此在设计硬接线压缩解压系统时必须先将算法标准化 1 空间冗余在同一幅图像中规则物体和规则背景的表面物理特性具有相关性这些相关性的光成像结果在数字化图像中就表现为数据冗余 2 时间冗余时间冗余反映在视频帧序列中相邻帧图

5、像之间有较大的相关性一幅图像中的某物体或场景可由其他帧图像中的物体或场景重构出来 1 数据冗余的类型 3 1 2数据冗余的类型与压缩方法分类 3 信息熵冗余信息熵冗余是指数据所携带的信息量少于数据本身而反映出来的数据冗余 4 视觉冗余人类的视觉系统由于受生理特性的限制对于图像场的注意是非均匀的人眼并不能察觉图像场的所有变化事实上人类视觉的一般分辨能力为26灰度等级而一般图像的量化采用的是28灰度等级即存在着视觉冗余 3 1 2数据冗余的类型与压缩方法分类 5 听觉冗余人耳对不同频率的声音的敏感性是不同的不能察觉所有频率的变化对某些频率不必特别关注因此存在听觉冗余 6 结

6、构冗余数字化图像中物体表面纹理等结构往往存在着数据冗余这种冗余称为结构冗余 7 知识冗余由图像的记录方式与人对图像的知识之间的差异所产生的冗余称为知识冗余 3 1 2数据冗余的类型与压缩方法分类 3 1 2数据冗余的类型与压缩方法分类 2 数据压缩技术分类根据解码后数据与原始数据是否完全一致可以分为两大类一类是熵编码冗余压缩法也称无损压缩法无失真压缩法二是熵压缩法也称有损压缩法有失真压缩法从熵损失角度分为无损压缩和有损压缩两种无失真压缩又称熵编码由于不会失真多用于文本数据的压缩但也有例外非线性编辑系统为了保证视频质量有些高档系统采用的是无失真压缩方法有

7、失真压缩又称熵压缩法大多数图像声音动态视频等数据的压缩是采用有失真压缩 3 1 2数据冗余的类型与压缩方法分类从信息语义角度分为熵平均信息量编码和源编码两种熵平均信息量编码 EntropyCoding 熵编码是一种泛指那些不考虑被压缩信息的性质的编码和压缩技术它是基于平均信息量的技术把所有的数据当作比特序列而不根据压缩信息的类型优化压缩也就是说平均信息量编码忽略被压缩信息的语义内容熵编码分为重复序列消除编码含消零行程编码统计编码等 3 1 2数据冗余的类型与压缩方法分类源编码 SourceCoding 源编码的冗余压缩取决于初始信号的类型前后

8、的相关性信号的语义内容等源编码比严格的平均信息量编码的压缩率更高当然压缩的程度主要取决于数据的语义内容比起平均信息量编码它的压缩比更大源编码主要分为预测编码变换编码向量量化等 3 1 2数据冗余的类型与压缩方法分类 EntropyCoding RunLengthCoding StatisticalCoding Huffman Arithmetic 3 1 3常用数据压缩方法的基本原理 1 统计编码方法是识别一个给定的流中出现频率最高的比特或字节模式并用比原始比特更少的比特数来对其编码即就是频率越低的模式其编码的位数越多频率越高的模式编码位数越少若码流中所有模式出

9、现的概率相等则平均信息量最大信源就没有冗余 3 1 3常用数据压缩方法的基本原理 1 行程编码 RunLengthCoding 是最简单最古老的压缩技术之一主要技术是检测重复的比特或字符序列并用它们的出现次数取而代之该方法有两大模式一是消零消空白二是行游程 runlength 编码消零或消空白法将数字中连续的 0 或文本中连续的空白用一个标识符或特殊字符后跟数字N 连续 0 的个数来代替如数字序列 742300000000000000000055编码为 7423Z1855 3 1 3常用数据压缩方法的基本原理行程编码法任何重复的字符序列可被一个短格式取

10、代该算法适合于任何重复的字符一组n个连续的字符c将被c和一个特殊的字符取代当然若给定字符仅重复两次就不要用此方法任何重复4次或4次以上的字符由该字符记号 M 重复次数代替例如数字序列 Name CR编码为 Name M10CR 3 1 3常用数据压缩方法的基本原理 2 LZW编码LZW算法在压缩文本和程序数据的压缩技术中唱主角它的压缩率高压缩处理所化费的时间比其它方式要少 LZW编码时首先将原始的数据分成多个条纹每个条纹都单独进行压缩 LZW算法基于一个转换表或字串表它将输入字符映象到编码中使用可变长代码最大代码长度为12位 3 1 3常用数据压缩方法的基本原理

11、 LZW算法中的字串表对于每个条纹都不同并且不必保留给解压缩程序因为解压缩过程中能自动建立完全相同的字串表实际上它是通过查找冗余字符串并将此字符串用较短的符号标记替代的压缩技术 3 1 3常用数据压缩方法的基本原理 3 哈夫曼编码1952年Huffman提出了对统计独立信源能达到最小平均码长的编码方法也即最佳码最佳性可从理论上证明这种码具有即时性和唯一可译性该编码是常见的一种统计编码对给定的数据流计算其每个字节的出现频率根据频率表运用哈夫曼算法可确定分配各字符的最小位数然后给出一个最优的编码代码字存人代码表中 3 1 3常用数据压缩方法的基本原理哈夫曼编码过程例

12、现有A B C D E五个待编码的符号它们的概率分别是0 3846 0 1795 0 1538 0 1538 0 1283 用哈夫曼算法求出这五个符号所分配的代码和熵平均码长 1 初始化根据符号概率的大小按由大到小顺序对符号进行排序 2 把概率最小的两个符号组成一个节点如D和E组成节点P1 3 1 3常用数据压缩方法的基本原理 3 重复步骤2 得到节点P2 P3 P4 形成一棵树 P4为根节点 4 从根节点P4开始到相应每个符号的树叶从上到下标上 0 上枝 1 下枝注至于哪个为 1 哪个为 0 则无关紧要最后的结果仅仅是分配的代码不同而代码的平均长度是相同的 3 1

13、3常用数据压缩方法的基本原理 Huffman编码的优缺点优点当信源符号概率是2的负幂次方时 Huffman编码法编码效率达到100 一般情况下它的编码效率要比其它编码方法的效率高是最佳变长码 3 1 3常用数据压缩方法的基本原理缺点 1 编码中每个符号的编码长度只能为整数如果源符号集的概率分布不是2的负n次方的形式则无法达到熵极限 2 为可变长度码译码复杂 3 需要事先知道输入符号集的概率分布 4 没有错误保护功能 3 1 3常用数据压缩方法的基本原理 4 算术编码算术编码把一个信源集合表示为实数线上的0到1之间的一个区间这个集合中的每个元素都要用来缩短这个区间信源集合的元素

14、越多所得到的区间就越小当区间变小时就需要一些更多的数位来表示这个区间这就是区间作为代码的原理算术编码首先假设一个信源的概率模型然后用这些概率来缩小表示信源集的区间 3 1 3常用数据压缩方法的基本原理新子区间的起始位置前子区间的起始位置当前符号的区间左端前子区间长度新子区间的长度前子区间的长度当前符号的概率等价于范围长度最后得到的子区间的长度决定了表示该区域内的某一个数所需的位数 3 1 3常用数据压缩方法的基本原理例假设信源符号为 00 01 10 11 这些符号的概率分别为 0 1 0 4 0 2 0 3 根据这些概率可把间隔 0 1 分成四个子区间 0 0

15、 1 0 1 0 5 0 5 0 7 0 7 1 如果二进制消息序列的输入为 10001100101101 请运用算数编码进行编码 3 1 3常用数据压缩方法的基本原理 2 预测编码 PredictionCoding 预测编码是指利用前面的一个或多个信号对下一个信号进行预测然后对实际值和预测值的差进行编码 DPCM与ADPCM是两种典型的预测编码 3 1 3常用数据压缩方法的基本原理 1 差分脉码调制 DPCM PCM PulseCodeModulation 原始的模拟信号经过时间采样然后对每一样值进行量化作为数字信号传输 DPCM不对每一样值都进行量化而是预测下一样值并量化实际值和

16、预测值之间的差 DPCM是基本的编码方法之一在大量的压缩算法中被采用比如JPEG的DC分量就是采用DPCM编码的 3 1 3常用数据压缩方法的基本原理举例说明DPCM编码原理设DPCM系统预测器的预测值为前一个样值假设输入信号已经量化差值不再进行量化若系统的输入为 0121123344 则预测值为 0012112334 差值为 011 1011010 差值的范围比输入样值的范围有所减小可以用较少的位数进行编码 3 1 3常用数据压缩方法的基本原理量化器编码器预测器信道译码器预测器 Xn dn d1n x1n x2n d1n x1n x2n 发送端接收端 DPCM典型的工作原理误差qn xn x1n xn x2n d1n xn x2n d1n dn d1n 3 1 3常用数据压缩方法的基本原理 2 自适应差分脉码调制 ADPCM 为了进一步改善量化性能或压缩数据率可采用自适应量化或自适应预测的方法只要采用了其中的任一种自适应方法均称为ADPCM 自适应预测预测参数的最佳化依赖于信源的统计特性要得到最佳的预测参数是一件繁琐的工作而采用固定的预测参数

展开阅读全文

第三章 多媒体数据压缩技术

第三章多媒体数据压缩技术