多媒体技术教程-ch3

上传人:mg****85 文档编号:44111078 上传时间:2018-06-08 格式:PDF 页数:87 大小:314.28KB
返回 下载 相关 举报
多媒体技术教程-ch3_第1页
第1页 / 共87页
多媒体技术教程-ch3_第2页
第2页 / 共87页
多媒体技术教程-ch3_第3页
第3页 / 共87页
多媒体技术教程-ch3_第4页
第4页 / 共87页
多媒体技术教程-ch3_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《多媒体技术教程-ch3》由会员分享,可在线阅读,更多相关《多媒体技术教程-ch3(87页珍藏版)》请在金锄头文库上搜索。

1、第三章 多媒体数据压缩3.1 数据压缩的 基本原理和方法3.1 数据压缩的 基本原理和方法3.1 数据压缩的基本原理和方法压缩的必要性压缩的必要性 音频、视频的数据量很大,如果不进行处理,计算机 系统几乎无法对它进行存取和交换。 例如,一幅具有中等分辨率(音频、视频的数据量很大,如果不进行处理,计算机 系统几乎无法对它进行存取和交换。 例如,一幅具有中等分辨率(640480)的真彩色 图像()的真彩色 图像(24b/像素),它的数据量约为像素),它的数据量约为7.37Mb/帧,一个帧,一个 100MB(Byte)的硬盘只能存放约)的硬盘只能存放约100帧图像。若要达到 每秒帧图像。若要达到 每

2、秒25帧的全动态显示要求,每秒所需的数据量为帧的全动态显示要求,每秒所需的数据量为 184Mb,而且要求系统的数据传输率必须达到,而且要求系统的数据传输率必须达到184Mb/s。 对于声音也是如此,若采用。 对于声音也是如此,若采用16b样值的样值的PCM编码,采样速 率选为编码,采样速 率选为44.1kHZ,则双声道立体声声音每秒将有,则双声道立体声声音每秒将有176KB的 数据量。的 数据量。3.1 数据压缩的基本原理和方法 视频、图像、声音有很大的压缩潜力视频、图像、声音有很大的压缩潜力信息论认为:若信源编码的熵大于信源的实 际熵,该信源中一定存在冗余度。信息论认为:若信源编码的熵大于信

3、源的实 际熵,该信源中一定存在冗余度。原始信源的数据存在着很多冗余度:原始信源的数据存在着很多冗余度:空间冗 余、时间冗余、视觉冗余、听觉冗余等。空间冗 余、时间冗余、视觉冗余、听觉冗余等。3.1.3.1.1 1 数据冗余的类型 空间冗余:在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。空间冗余:在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。一幅图象中同一种颜色不止一个象素点,若相邻的象素点的值相同,象素点间(水平、垂直)有冗余。一幅图象中同一种颜色不止一个象素

4、点,若相邻的象素点的值相同,象素点间(水平、垂直)有冗余。 当图象的一部分包含占主要地位的垂直的源对象时,相邻 线间存在冗余。当图象的一部分包含占主要地位的垂直的源对象时,相邻 线间存在冗余。3.1.3.1.1 1 数据冗余的类型 时间冗余:时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。时间冗余:时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。 音频的前后样值之间也同样有时间冗余。音频的前后样值之间也同样有时间冗余。 若图象稳定或只有轻微的改变,

5、运动序列帧间存在冗余。若图象稳定或只有轻微的改变,运动序列帧间存在冗余。3.1.3.1.1 1 数据冗余的类型信息熵冗余:信源编码时,当分配给第信息熵冗余:信源编码时,当分配给第i个码元类的比特数个码元类的比特数b(yi)=-logpi,才能使编码后单位数据量等于其信源熵,即达到其压缩极限。但实际中各码元类的先验概率很难预知, 比特分配不能达到最佳。实际单位数据量,才能使编码后单位数据量等于其信源熵,即达到其压缩极限。但实际中各码元类的先验概率很难预知, 比特分配不能达到最佳。实际单位数据量dH(S),即存在信息冗余熵。),即存在信息冗余熵。视觉冗余:人眼对于图像场的注意是非均匀的,人眼并不能

6、察觉图像场的所有变化。事实上人类视觉的一般分辨能力为视觉冗余:人眼对于图像场的注意是非均匀的,人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为 26灰度等级,而一般图像的量化采用的是灰度等级,而一般图像的量化采用的是28灰度等级,即存在着视觉冗余。灰度等级,即存在着视觉冗余。3.1.3.1.1 1 数据冗余的类型 听觉冗余:人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。听觉冗余:人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。 其它冗余:包括结构冗余、知识冗余等。

7、其它冗余:包括结构冗余、知识冗余等。3.1.3.1.2 2 数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标节省图象或视频的存储容量,增加访问速 度,使数字视频能在节省图象或视频的存储容量,增加访问速 度,使数字视频能在PC机上实现,需要进行视频 和图象的压缩。机上实现,需要进行视频 和图象的压缩。 有三个关键参数评价一个压缩系统有三个关键参数评价一个压缩系统 压缩比压缩比 图象质量图象质量 压缩和解压的速度压缩和解压的速度 另外也必须考虑每个压缩算法所需的硬件和 软件。另外也必须考虑每个压缩算法所需的硬件和 软件。3.1.3.1.2 2数据压缩技术的性

8、能指标数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标1压缩比压缩性能常常用压缩比定义(输入数据和输出数据比)例:压缩比压缩性能常常用压缩比定义(输入数据和输出数据比)例:512480, 24bit/pixel(bpp)输出输出15000byte 输入输入737280byte 压缩比压缩比737280/15000493.1.3.1.2 2 数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标2图象质量图象质量压缩方法: 无损压缩 (图象质量不变)有损压缩有损压缩:失真情况很难量化,只能对测试的图象进行估计。模拟图象质量的指标:信噪比、分辨率

9、、颜色错,但必须在观察了实际图象以后。压缩方法: 无损压缩 (图象质量不变)有损压缩有损压缩:失真情况很难量化,只能对测试的图象进行估计。模拟图象质量的指标:信噪比、分辨率、颜色错,但必须在观察了实际图象以后。3.1.3.1.2 2 数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标3压缩解压速度压缩解压速度在许多应用中,压缩和解压可能不同时用,在不同的位置不同的系统中。所以,压缩、解压速度分别估计。在许多应用中,压缩和解压可能不同时用,在不同的位置不同的系统中。所以,压缩、解压速度分别估计。静态图象中,压缩速度没有解压速度严格;静态图象中,压缩速度没有解

10、压速度严格;动态图象中,压缩、解压速度都有要求,因为需实时地从摄像机或动态图象中,压缩、解压速度都有要求,因为需实时地从摄像机或VCR中抓取动态视频。中抓取动态视频。3.1.3.1.2 2 数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标数据压缩技术的性能指标4硬软件系统有些压缩解压工作可用软件实现。设计系统时必须充分考虑: 算法复杂 压缩解压过程长算法简单 压缩效果差目前有些特殊硬件可用于加速压缩硬软件系统有些压缩解压工作可用软件实现。设计系统时必须充分考虑: 算法复杂 压缩解压过程长算法简单 压缩效果差目前有些特殊硬件可用于加速压缩/解压解压。3.1.3.1.3 3 数据

11、压缩方法分类 根据解码后数据与原始数据是否完全一致可以分为 两大类:根据解码后数据与原始数据是否完全一致可以分为 两大类: 一类是熵编码、冗余压缩法,也称无损压缩法、无失真压 缩法一类是熵编码、冗余压缩法,也称无损压缩法、无失真压 缩法 二是熵压缩法,也称有损压缩法、有失真压缩法。二是熵压缩法,也称有损压缩法、有失真压缩法。 从从“熵熵”损失角度分为无损压缩和有损压缩两种:损失角度分为无损压缩和有损压缩两种: 无失真压缩,又称熵编码。由于不会失真,多用于文本、 数据的压缩,但也有例外,非线性编辑系统为了保证视频 质量,有些高档系统采用的是无失真压缩方法。无失真压缩,又称熵编码。由于不会失真,多

12、用于文本、 数据的压缩,但也有例外,非线性编辑系统为了保证视频 质量,有些高档系统采用的是无失真压缩方法。 有失真压缩,又称熵压缩法。大多数图像、声音、动态视 频等数据的压缩是采用有失真压缩。有失真压缩,又称熵压缩法。大多数图像、声音、动态视 频等数据的压缩是采用有失真压缩。3.1.3.1.3 3 数据压缩方法分类从信息语义角度分为从信息语义角度分为“熵编码熵编码”和和“源编码源编码”两种:两种:熵熵 (平均信息量平均信息量)编码编码(Entropy Coding) 熵编码是一种泛指那些不考虑被压缩信息的性质的编码和压缩技术。它是 基于平均信息量的技术把所有的数据当作比特序列,而不根据压缩信息

13、的 类型优化压缩。也就是说,平均信息量编码忽略被压缩信息的语义内容。熵编码是一种泛指那些不考虑被压缩信息的性质的编码和压缩技术。它是 基于平均信息量的技术把所有的数据当作比特序列,而不根据压缩信息的 类型优化压缩。也就是说,平均信息量编码忽略被压缩信息的语义内容。熵编码分为:重复序列消除编码熵编码分为:重复序列消除编码 (含:消零、行程编码含:消零、行程编码)、统计编码等。、统计编码等。源编码源编码(Source Coding) 源编码的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内 容等。源编码比严格的平均信息量编码的压缩率更高。当然压缩的程度主 要取决于数据的语义内容,比起平均信

14、息量编码,它的压缩比更大。源编码的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内 容等。源编码比严格的平均信息量编码的压缩率更高。当然压缩的程度主 要取决于数据的语义内容,比起平均信息量编码,它的压缩比更大。 源编码主要分为:预测编码、变换编码、向量量化等。源编码主要分为:预测编码、变换编码、向量量化等。3.1.3 数据压缩方法分类Source CodingPrediction : DPCM and DMTransformation : FFT、DCTLayered : Sub-band、Sub- sampling and Bit PositionVector Quantizatio

15、nHybrid CodingJPEG、MPEG、H.261 、 DVI、Intel-IndeoEntropy CodingRun Length CodingStatistical CodingHuffmanArithmetic3.1.3.1.4 4常用数据压缩方法的基本原理1. 统计编码统计编码方法是:识别一个给定的流中出现频率最高 的比特或字节模式,并用比原始比特更少的比特数 来对其编码。即就是,频率越低的模式,其编码的位数越多, 频率越高的模式编码位数越少。若码流中所有模式 出现的概率相等,则平均信息量最大, 信源就没 有冗余。方法是:识别一个给定的流中出现频率最高 的比特或字节模式,并用

16、比原始比特更少的比特数 来对其编码。即就是,频率越低的模式,其编码的位数越多, 频率越高的模式编码位数越少。若码流中所有模式 出现的概率相等,则平均信息量最大, 信源就没 有冗余。3.1.3.1.4 4 常用数据压缩方法的基本原理(1)行程编码行程编码(Run Length Coding) 是最简单、最古老的压缩技术之一,主要技术是检测 重复的比特或字符序列,并用它们的出现次数取而代之。 该方法有两大模式:一是消零是最简单、最古老的压缩技术之一,主要技术是检测 重复的比特或字符序列,并用它们的出现次数取而代之。 该方法有两大模式:一是消零(消空白消空白),二是行,二是行(游游)程程(run length)编码。 消零编码。 消零(或消空白或消空白)法 将数字中连续的法 将数字中连续的“0”或文本中连续的空白用一个标识符或文本中连续的空白用一个标识符 (或特殊字符或特殊字符)后跟数字后跟数字N(连续连续“0”的个数的个数)来代

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号