多媒体技术 多媒体数据压缩编码技术

上传人:mg****85 文档编号:49767072 上传时间:2018-08-02 格式:PPT 页数:47 大小:955KB
返回 下载 相关 举报
多媒体技术 多媒体数据压缩编码技术_第1页
第1页 / 共47页
多媒体技术 多媒体数据压缩编码技术_第2页
第2页 / 共47页
多媒体技术 多媒体数据压缩编码技术_第3页
第3页 / 共47页
多媒体技术 多媒体数据压缩编码技术_第4页
第4页 / 共47页
多媒体技术 多媒体数据压缩编码技术_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《多媒体技术 多媒体数据压缩编码技术》由会员分享,可在线阅读,更多相关《多媒体技术 多媒体数据压缩编码技术(47页珍藏版)》请在金锄头文库上搜索。

1、第四章、多媒体数据压缩编码技术本章要点(1)多媒体数据压缩编码的重要性和分类 。 (2)量化的基本原理和量化器的设计思想 。 (3)常用压缩编码算法的基本原理及实现 技术、预测编码、变换编码、统计编码(Huffman 编码、算术编码)。 (4)静态图像压缩编码的国际标准(JPEG )原理、实现技术,以及动态图像压缩编码国际 标准(MPRG)的基本原理。4.1 多媒体数据压缩编码的 重要性和分类4.1.1 多媒体数据压缩编码的重要性 4.1.2 多媒体数据压缩的可能性 4.1.3 多媒体数据压缩方法的分类4.1.1 数据压缩编码的重要性21世纪的人类社会将是信息化社会, 数字化后的信息具有数据海

2、量性。从目前的应用 状况来看,数据压缩技术是多媒体技术中最重要 的关键技术之一。多媒体技术应用和发展,得益 于多媒体数据压缩技术的突破性进展。从如下两 方面说明数据压缩的重要性: (1)声音 (2)图像(静态图像和动态视 频)数据压缩的重要性声音 具有CD音乐激光唱盘音质波形声音的典型参数:采样频率44.1KHz量化位数:16位立体声声道数:2数据量:约0.17MB/秒注:数据量(采样频率量化位数声道数 )/8根据上面公式可以计算出以上数据量所需的存取时 间: 在650MB的光盘中存放时间约1小时。数据压缩的重要性(2)图像 静态图像:一幅中等分辨率的位图图像( 640480,256色),典型

3、参数为: a.图像分辨率:640480 b.图像颜色数:256(=28) c.颜色深度(位):8 d.数据量为:约0.3MB注:数据量(垂直分辨率水平分辨率颜色深 度)/8对于以上数据量,在1.44MB的软盘中能存放约5幅 静态图 像。若用速率(2400bps)的电话线传输,一幅静 态图像约需要传送17分钟。动态视频:一幅中等分辨率24位真彩色的位图图 像 (640480,24位/像素),典型参数为: a.图像分辨率:640480 b.图像颜色数:16,777,216(=224) c.颜色深度(位):24 d.数据量为:约0.9MB对于以上数据量,若用NTSC制式(30帧/秒 )播放动态视频,

4、需要约27MB/秒的视频传输速度,在 650MB的光盘中存放时间约24秒。综上所述:在不经过数据压缩情况下,CD唱 机和CD视频播放机根本无法达到实用目的。目前一张 650MB的CD激光唱盘可以连续播放约2小时的立体声音乐 ,而一张650MB的CD激光视盘可以连续播放约75分钟的 视频电影。说明压缩的余地相当大。同样,传输中也存 在同样的困难。网络带宽受限。信息量与数据量的关系I = D - dunI 信息量nD数据量ndu冗余量压缩冗余例如1988年Barnsley采用分形( Fractor)的迭代函数系统IFS和递归迭代函数系 统RIFS方法,对几幅图像进行压缩编码,获得了 高达10000

5、:1的压缩比。以压缩形式存储和传输 信息,既节省了空间,又提高了通信干线的传输 率,同时也便于计算机实时处理视频和音频,高 质量播放视频和音频节目成为可能。 冗余举例1. 冗余在平时说话时是大量存在的。 2. 中文广播员一分钟读180个汉字,一个汉 字两个字节, 360个Byte 。 采样1分钟,8K 60 = 480 K Byte/分480 K byte / 360 byte = 1000倍的冗余 3. 中文百科全书扫描进入计算机冗余更大 。 200万字X2=40000004MByte B5扫描(185X255 300dpi ) 一页为6.61M Byte 200万字1000页为6.61G

6、4. 图像信息、视频信息的冗余就更大了。4.1.2 多媒体数据压缩的可能性信息之所以能进行压缩,是因为信息 本身通常存在很大的冗余量。1.空间冗余例: 图像中的“A”是一个规则物体。光的 亮度、饱和度及颜色都一样,因此,数据A有很 大的冗余。A2.时间冗余例: 序列图像。AF2AF13.结构冗余图像有非常强的纹理结构,图像的象 素值存在着明显的分布模式。4.知识冗余图像的理解与某些基础知识有关。 例:人脸的图像有同样的结构:嘴的上方有 鼻子,鼻子上方有眼睛,鼻子在中线上 知识冗余是模型编码主要利用的特性。5.视觉冗余人的视觉系统对图像场的敏感性是非 均匀、非线性的。 (1)对图像亮度和色差的敏

7、感性相差很大Y:U:V8:4:4 或者Y:U:V8:2:2 (2)随着亮度增加,视觉系统对量化误差 的敏感度降低。 (3)人的视觉系统把图像边缘和非边缘区 域分开处理。6.图像区域的相同性冗余图像区域的相同性冗余是指在图像中 的两个或多个区域对应的所有象素值相同或相近 。那么只记录一个区域中各象素的颜色值,其他 相同或相近区域就不需再记录了。7.信息熵冗余信息量:指从N个相等的可能事件中选出一 个事 件所需要的信息度量和含量。 信息熵:指一团数据所带的信息量,平均信 息量就是信息熵(entropy)。例如:从64个数中选出某一个数。可先问“是否 大于32?”消除半数的可能,这样只要6次就可选出

8、 某数。 如果要选择的数是35,则过程如下: 1.大于/小于 32? 大 2.大于/小于 32+16=48?小 3.大于/小于 48-8=40?小 4.大于/小于 40-4=36?小 5.大于/小于 36-2=34?大 6.大于/小于 34+1=35 等如果要选择的数是63,则其过程如下:1.大于/小于 32?大2.大于/小于 32+16=48?大3.大于/小于 48+8=56?大4.大于/小于 56+4=60?大5.大于/小于 60+2=62?大6.大于/小于 62+1=63 等这是因为每提问一次都会得到1比特 的信息量。因此,在64个数中选定某一数 所需的信息量是 log264=6(bit

9、s)信息量: 指从N个相等的可能事件中选出一个 事件所需要的信息度量和含量。设从N个数中选任意一个数X的概率为 P(x),假定选定任意一个数的概率都相等, P(x)= 1/N,因此定义信息量I(x) =log2N= -log2(1/N)= -log2P(x)=IP(x)信息量: 指从N个相等 的可能事件中选出一个 事件所需要的信息度量 和含量。信息熵:指一团数据所带的信息量,平均 信息量就是信息熵(entropy)。如果将信源所有可能事件的信息量 进行平均,就得到了信息熵(entropy)。 熵就是平均信息量。4.1.3 多媒体数据压缩方法的分类按压缩方法分:(1) 有失真压缩(2) 无失真压

10、缩1、数据压缩方法分类一般说来,数据可分为两大类,一类 是将模拟信号数字化后得来的多媒体数据,另一 类是与文字和字符有关的文本数据,两类数据所 采用的数据压缩方法相应不同。文本数据压缩和 多媒体数据压缩在算法上的区别主要表现在两个 方面:其一,是否允许有误差;其二,算法有没 有高级模型可以利用。从信息论的角度,根据数据压缩的基 本原理,数据压缩方法可分成如下两类:(1).无损压缩法 (2).有损压缩法(1)无损压缩法无损压缩法也称冗余压缩法。当信源 编码的熵大于实际熵时,通过编码,消除冗余熵 ,达到数据压缩目的。因为这类方法在编码时仅 消除冗余熵,而没有损失有用信息,解压时这些 冗余可以重新插

11、入到数据中,保证解压后能无失 真地恢复数据,可实现无损压缩,压缩过程可逆 。压缩比2:1至5:1。典型的冗余压缩法(即无损压缩法)有如下 种: a.哈夫曼(Huffman)编码 b.香农-弗诺(Shannon-Fano)编码 c.算术编码 d.游程(Run-Length)编码,又称行 程编码以上编码均可归类为统计编码,其编码原 理是基于信源符号之间存在分布不等概性。(2)有损压缩法有损压缩法也称熵压缩法。这类方法 在允许一定程度失真的前提下进行压缩编码,通 过压缩少量有用的熵,达到增大压缩比的目的。 从而造成部分有用信息的损失,解压时无法完全 恢复原有数据,是有损压缩,压缩过程不可逆。 压缩比

12、10:1(静态)至200:1(动态)。2、数据压缩编码方法(1)预测编码根据离散信号之间存在一定关联性的特点, 利用前面一个或多个信号对下一个信号进行预测。其中 典型的压缩算法有DPCM、ADPCM等,它们较适合于音频 数据的压缩。下面分别介绍如下。a. DPCM(差分脉码调制)DPCM系统由压缩、解压缩两部分组成。压 缩时,原始的模拟信号先经过时间采样,然后对每一样 值都进行量化,作为数据信号传输。解压缩时,将预测 值与存储的已量化的差值相加,产生近似的原始信号, 基本恢复原始数据。DPCM系统框图如下图所示 。DPCM系统框图(1)预测编码(续)b. ADPCM(自适应差分脉码调制)采用自

13、适应差分脉码调制技术可以减 少倾斜过载产生的误差。实现自适应差分脉码调 制最常用的方法是根据信号分布不均匀的特点, 自适应地改变量化器输出动态范围及量化器判决 电平(量化器步长)。若想利用差分脉码调制或自 适应脉码调制达到2:1以上的压缩比时,倾斜过 载或边缘量化现象会显得非常突出,这是一个致 命的弱点。(2)变换编码变换编码是指先对信号进行某种函数 变换,从一种信号(空间)变换到另一种信号( 空间),然后再对变换后的信号进行编码。变换编码系统中压缩数据有三个步骤 :变换、变换域采样和量化。变换本身并不进行 数据压缩,它只把信号映射到另一个域,使得信 号在变换域时容易进行压缩。变换编码系统组成

14、 如下图所示。变换编码系统框图(3)统计编码统计编码是根据消息出现概率的分布 特性而进行的压缩编码。这种编码的宗旨在于, 在消息和码字之间找到明确的一一对应关系,以 便于在恢复时能准确无误地再现出来,或者至少 是极相似地找到相当的对应关系,并把这种失真 或不对应概率限制到可容忍的范围内。最常用的统计编码是Huffman编码, 是对出现频率大的符号用较少的位数来表示,而 对出现频率小的符号用较多的位数来表示。(4)混合编码混合编码指的是对信源数据同时使用 两种或两种以上编码方法进行组合的编码方法, 可根据多媒体数据源中各类数据的不同特点,综 合运用多种编码方法进行数据压缩,取长补短, 使综合效果

15、达到最佳,大大提高数据压缩的效率 。4.2 量化4.2.1 量化原理 4.2.2 标量量化器的设计 4.2.3 矢量量化4.2.1 量化原理量化处理是使数据比特率下降的一个强有 力的措施。量化处理总是把一批输入,量化到一个输 出级上,所以量化处理是一个多对一的处理过程 ,是个不可逆过程,量化处理中有信息丢失。数据压缩编码中的量化处理,不是 指A/D变换后的量化,而是指经正交变换 、差分、或预测处理后,熵编码之前, 对正交变换系数、差值或预测误差的量 化处理。4.2.2 标量量化器的设计量化器的设计要求 通常设计量化器有下述两种情况:1. 给定量化分层级数,满足量化误差最 小。2. 限定量化误差

16、,确定分层级数,满足 以尽 量小的平均比特数,表示量化输出。 量化方法有标量量化和矢 量量化之分,标量量化又可分 为,均匀量化、非均匀量化和 自适应量化。 (1)均匀量化如果量化值是均匀分布的,我们称之为均匀量化。 设为量化阶距,量化器的最大范围是Xmax,则: D =22XBmax对于小于D+) 21(i,而大于D-) 21(i的样值, 均规定为相同的量化值 Di。 抽样值)(nTx与未量化样值)(nTx的关系是: )()()(nenTxnT+=)(ne是量化误差(量化噪声)x步长为八阶的均匀量化器(2)非均匀量化均匀量化的优点是简单,而今天非均 匀量化器也很容易实现了,许多信号和参数都更 适合用非均匀量化器处理。一种常见的非均匀量 化器的特性如下图所示,当输入在b1 b2范围内 量化步长大; 当输入在0 b1, b2 255范围 内量化步长小。通过选择不同的步长使某种输入的量 化误差函数达

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号