数字媒体数据压缩技术new课件

资源描述

《数字媒体数据压缩技术new课件》由会员分享，可在线阅读，更多相关《数字媒体数据压缩技术new课件（76页珍藏版）》请在金锄头文库上搜索。

1、数字媒体压缩技术,淮永建北京林业大学信息学院 ftp:/202.204.125.41/huaiyongjian,2020/9/1,2,回顾,光存储技术发展现状光道上数据存储方法 VCD/DVD区别？ CD-DA数据容量计算方法？,2020/9/1,3,主要内容,信息表示和数字化数据压缩及分类压缩的可能性与信息冗余数据压缩分类通用的数据压缩技术编码的理论基础脉冲编码调制 PCM 增量调制（DM）差分脉冲编码调制 DPCM 词典编码行程编码变换编码信息熵编码霍夫曼编码、算法编码,2020/9/1,4,信息表示与编码,数字化表示,2020/9/1,5,数字化表示,传统上用模拟

2、方式表示声音和图象信息模拟信号表示信息的主要缺陷？易出故障，常产生噪音和信号丢失，且拷贝过程中噪音和误差逐步积累；模拟信号不适合数字计算机加工处理。数字化处理：巨大的数据量,2020/9/1,6,数字化表示,基本概念采样频率量化精度数据流二进制数据表示,2020/9/1,7,模拟信号数字化方法,量化位数=log2K K为量化等级,采样率采样频率量化等级量化位数,2020/9/1,8,采样定理,采样定理？仅当采样频率2倍的原始信号频率时,才能保证采样后信号可被保真地恢复为原始信号。设电视信号YIQ彩色空间各分量的带宽分别为：4.2MHZ、1.5MHz、0.5MHz,量化等级

3、8比特 (4.21.5+0.5)*2*8Mb=99.2Mb 量化位数8bit,1秒钟电视信号的数据量约为100Mbps。650MB的CD-ROM仅能存约1分钟的原始电视数据。若HDTV(1.2Gbps), 一张CD-ROM还存不下6秒钟的HDTV图象。,2020/9/1,9,语音信号数字化举例,人说话的音频一般在20Hz到4KHz, 即人类语音的带宽为4KHz。语音信号的数字化表示？依据采样定理, 量化位数8bit, 则1秒钟信号量为64Kbits（428）8KB。因此, 人讲1分钟话的数据量为480KB。 Mp3音频 CD音频数字化处理的关键问题数据压缩,2020/9/1,10,音频属

4、性,2020/9/1,11,数据压缩的可能性与信息冗余,数据能够被压缩的主要原因在于媒体数据中存在数据的信息冗余。信息量包含在数据之中，一般的数据冗余主要体现在：空间冗余结构冗余时间冗余视觉冗余知识冗余信息熵冗余,2020/9/1,12,空间冗余,这是图象数据中经常存在的一种冗余。在同一幅图象中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成象结构在数字化图象中就表现为数据冗余。,2020/9/1,13,时间冗余,这是序列图象和语音数据中所经常包含的冗余。图象序列中的两幅相邻的图象之间有较大的相关性,这反映为时间冗余。在语言中,由于人在说话时发音的音频是一连续的

5、渐变过程,而不是一个完全时间上独立的过程,因而存在时间冗余。,运动矢量,2020/9/1,14,信息熵冗余,信息熵是指一组数据所携带的信息量,它定义为： H=-i=0N-1Pilog2Pi N为数据类数或码元个数, Pi为码元yi发生的概率. 为使信息编码单位数据量d接近于或等于H,应设： d=i=0N-1Pib(yi) 其中b(yi)是分配给码元yi的比特数, 理论上应取b(yi)=-log2Pi. 实际一般取b(y0)=b(y1)=b(yK-1). Huffman coding ? 例如, 英文字母编码码元长为7bit, 即b(y0)=b(y1)= =b(yK-1)=7, 这样dH, 由此

6、带来的冗余称为信息熵冗余或编码冗余。,2020/9/1,15,结构冗余,有些图象从大域上看存着非常强的纹理结构，我们称它们在结构上存在有冗余. 例如布纹图象和草席图象,2020/9/1,16,知识冗余,有许多图象的理解与某些基础知识有相当大的相关性。例如,人脸的图象有固定的结构。比如说嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于正脸图象的中线上等等。这类规律性的结构可由先验知识和背景知识得到, 我们称此类冗余为知识冗余。,2020/9/1,17,视觉冗余,人类视觉系统对于图象场的任何变化,并不是都能感知的。图像噪声对于图象的编码处理时,由于压缩或量化截断引入了噪声而使图象发生了一些变

7、化,如果这些变化不能为视觉所感知,仍认为图象足够好。视觉分辨率约为26灰度等级一般图象量化采用28灰度等级视频的YUV信号冗余亮度和色差信号,2020/9/1,18,听觉冗余,人耳对不同声音的敏感性不同，并不能察觉所有频率的变化，对某些频率不关注。声音振幅声音频率,2020/9/1,19,数据压缩技术的性能指标,性能指标压缩比数据压缩质量压缩、解压的速度压缩算法所需要的软件、硬件环境,2020/9/1,20,数据压缩技术的性能指标,压缩比输入数据量和输出数据量之比 Bpp 质量无损压缩有损压缩,2020/9/1,21,数据压缩技术的性能指标,压缩算法评价主观客观

8、均方误差信噪比峰值信噪比 xn原始信号 xn重建信号 xmax为峰值信号,2020/9/1,22,数据压缩技术的性能指标,压缩解压速度压缩解压速度要快动态视频要求更高,2020/9/1,23,数据压缩分类,2020/9/1,24,数据压缩分类,按信息压缩前后比较是否有损失，可以划分有损压缩和无损压缩。无损压缩指使用压缩后的数据进行重构，重构后的数据与原来的数据完全相同。常用的无损压缩算法有霍夫曼(Huffman)算法和LZW算法。有损压缩是指使用压缩后的数据进行重构，重构后的数据与原来的数据有所不同，但不影响人对原始资料表达的信息造成误解。,2020/9/1,25,数据压缩编码

9、原理,按数据压缩编码的原理和方法可划分为统计编码，主要针对无记忆信源，根据信息码字出现概率的分布特征而进行压缩编码，寻找概率与码字长度间的最优匹配。预测编码是利用空间中相邻数据的相关性来进行压缩数据的。变换编码是将图像时域信号转换为频域信号进行处理。分析合成编码是指通过对源数据的分析，将其分解成一系列更适合于表示的“基元”或从中提取若干更为本质意义的参数，编码仅对这些基本单元或特征参数进行。,2020/9/1,26,按照媒体的类型进行分类,图像压缩标准声音压缩标准运动图象压缩标准,2020/9/1,27,通用的数据压缩技术,通用的数据压缩技术： PCM DM DPCM 行程编码字

10、典编码变换编码熵编码等通用的压缩方法具有压缩比低、通用性强等特点,2020/9/1,28,编码理论,数据压缩技术的理论基础是信息论。根据信息论的原理，可以找到最佳数据压缩编码方法，数据压缩的理论极限是信息熵。熵是信息量的度量方法，它表示某一事件出现的消息越多，事件发生的可能性就越小，数学上就是概率越小。,2020/9/1,29,信息与信息量,信息量是指信源中某种事件的信息度量或含量。一个事件出现的可能性愈小，其信息量愈多，反之亦然。若pi为第i个事件的概率为0 pi 1，则该事件的信息量为一个信源包括的所有数据叫数据量，而数据量中包含有冗余信息。信息量 = 数据量-冗余量,20

11、20/9/1,30,信息熵,信息熵就是将信源所有可能事件的信息量的平均。设从N个数中选定任一个数xj的概率为p(xj)，假定选定任意一个数的概率都相等，即p(xj) 1/N，则 I(xj)log2N-log2 1/N -log2p(xj)=Ip(xj) 上式中，p(xj)是信源X发出xj的概率。I(xj)的含义是信源X发出xj这个消息（随机事件）后，接收端收到信息量的量度。,2020/9/1,31,信息熵(续),信源X发出的xj(j=1,2,n)共n个随机事件的信息量的统计平均，即 H(X)=EI(xj)= H(X)称为信源X的“熵”，即信源X发出任意一个随机变量的平均信息量。其中，等概率

12、事件的熵最大，假设有N个事件，此时熵为： H(X) ,2020/9/1,32,信息熵(续),当P(x1)1时，P(x2)P(x3)P(xj)0，此时熵为 H(X) P(x1) 0 由上可得熵的范围为： 0 H(X) ,2020/9/1,33,信息熵(续),在编码中用熵值来衡量是否为最佳编码。若以Lc表示编码器输出码字的平均码长，其计算公式为： Lc （j=1,2,n）其中：P(xj) 是信源X发出xj的概率，L(xj)为xj的编码长。,2020/9/1,34,信息熵(续),平均码长与信息熵之间的关系为： LcH(X) 有冗余，不是最佳。 Lc H(X)不可能。 Lc H(X)最佳编码（ Lc

13、稍大于H(X) ）熵值为平均码长Lc的下限。,2020/9/1,35,脉冲编码调制PCM,脉冲编码调制 (Pulse Code Modulation, PCM)就是将模拟调制信号的采样值变换为脉冲码组。 PCM编码包括如下三个过程：采样，将模拟信号转换为时间离散的样本脉冲序列。量化，将离散时间连续幅度的抽样信号转换成为离散时间离散幅度的数字信号。编码，用一定位数的脉冲码组表示量化采样值。,2020/9/1,36,PCM系统原理图,2020/9/1,37,PCM编码,2020/9/1,38,PCM编码的优点,有很强的抗干扰性能方便的利用计算机编程，实现各种智能化设计。,2020/9/1

14、,39,增量调制（DM）,增量调制也称调制(delta modulation，DM)，它是一种预测编码技术，是PCM编码的一种变形。 DM是对实际的采样信号与预测的采样信号之差的极性进行编码，将极性变成“0”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”，则用“1”表示；相反则用“0”表示，或者相反。,2020/9/1,40,DM波形编码的原理,在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化，这种现象就称为增量调制器的“斜率过载” 。在输入信号缓慢变化部分，即输入信号与预测信号的差值接近零的区域，增量调制器的输出出现随机交变的“0”和“1”。这种

15、现象称为增量调制器的粒状噪声,2020/9/1,41,差分脉冲编码调制DPCM,差分脉冲编码调制（Differential Pulse Code Modulation，DPCM）是利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。差值脉冲编码调制是利用信号的相关性找出可以反映信号变化特征的一个差值量进行编码。,2020/9/1,42,DPCM的基本工作原理,线性预测-DPCM 基本原理是基于图象中相邻象素之间具有较强的相关性。每个象素可根据已知的前几个象素来作预测。因此在预测编码中，编码和传输的并不是象素采样值本身，而是这个采样值的预测值与其实际值之间的差值它与脉冲编码调制（

16、PCM）不同处在于，PCM是直接对采样信号进行量化编码，而DPCM是对实际信号值与预测值之差进行量化编码。,2020/9/1,43,DPCM系统原理框图,接收端,输出,XN,XN,eN,XN,eN,eN,XN,+,+,输入,XN,发送端,+,-,2020/9/1,44,DPCM预测编码,XN为tN时刻的采样值; XN为根据tN时刻以前已知X1,X2,XN-1对XN所作的预测值; eN=XN-XN为差值信号; eN为量化器输出信号; XN为接收端输出,XN =XN+eN 。因为：XN-XN = XN-(XN+eN) = (XN-XN)-eN = eN-eN 所以,DPCM系统中的误差来源是发送端的量化器,而与接收端无关,若去掉量化器使eN=eN,则XN=XN,即实现信息保持编码。事实上,这种量化误差是不可避免的。,2020/9/1,45,行程编码,行程编码又称行程长度编码（

展开阅读全文

数字媒体数据压缩技术new课件

最新文档