音视频编解码技术

上传人:jiups****uk12 文档编号:44714205 上传时间:2018-06-14 格式:PPT 页数:139 大小:995.50KB
返回 下载 相关 举报
音视频编解码技术_第1页
第1页 / 共139页
音视频编解码技术_第2页
第2页 / 共139页
音视频编解码技术_第3页
第3页 / 共139页
音视频编解码技术_第4页
第4页 / 共139页
音视频编解码技术_第5页
第5页 / 共139页
点击查看更多>>
资源描述

《音视频编解码技术》由会员分享,可在线阅读,更多相关《音视频编解码技术(139页珍藏版)》请在金锄头文库上搜索。

1、1掌握数据压缩的重要意义掌握数据压缩的重要意义掌握数据冗余的概念、分类及信息熵的掌握数据冗余的概念、分类及信息熵的计算公式计算公式了解数据压缩的三个关键指标,即压缩了解数据压缩的三个关键指标,即压缩比、图像质量、压缩和解压缩的速度比、图像质量、压缩和解压缩的速度掌握掌握HuffmanHuffman编码原理、方法及特点编码原理、方法及特点了解预测编码和变换编码原理了解预测编码和变换编码原理熟知音频压缩标准熟知音频压缩标准掌握图像压缩标准掌握图像压缩标准JPEGJPEG和和MPEGMPEG教学目标教学目标22.1 2.1 多媒体数据压缩基本原理多媒体数据压缩基本原理2.2 2.2 数据压缩与解压缩

2、常用算法数据压缩与解压缩常用算法2.3 2.3 多媒体数据常用压缩标准多媒体数据常用压缩标准内容导航内容导航32.1 2.1 多媒体数据压缩基本原理多媒体数据压缩基本原理2.1.1 2.1.1 多媒体数据压缩的必要性和可能性多媒体数据压缩的必要性和可能性2.1.2 2.1.2 数据冗余的基本概念与种类数据冗余的基本概念与种类2.1.3 2.1.3 图像压缩预处理技术图像压缩预处理技术2.1.4 2.1.4 量化及其质量量化及其质量2.1.5 2.1.5 数据压缩算法综合评价指标数据压缩算法综合评价指标4一幅一幅640480640480中等分辨率的真彩色位图图像中等分辨率的真彩色位图图像 的数据

3、量为的数据量为 64048024/8=64048024/8= 0.92MB, 0.92MB,若以若以2525幅幅/s /s 的帧频播放的帧频播放, ,数据率为数据率为23MB/s23MB/s,用容量为,用容量为650MB650MB的的 CD-ROMCD-ROM光盘只能存光盘只能存29s29s的的PALPAL制式数据。制式数据。2多媒体信息数据巨大是多媒体计算机系统所面多媒体信息数据巨大是多媒体计算机系统所面 临的最大难题之一。在各种媒体信息中临的最大难题之一。在各种媒体信息中, ,视频信息数视频信息数 据量最大据量最大, ,其次是音频信号,因此,为了处理和传输其次是音频信号,因此,为了处理和传

4、输 多媒体信息不仅需要很大的存储容量多媒体信息不仅需要很大的存储容量, ,而且要有很高而且要有很高 的传输速度的传输速度. .激光唱盘激光唱盘CDCD的采样频率为的采样频率为44.1kHz44.1kHz,量化位数,量化位数 为为1616位,双通道立体声,则位,双通道立体声,则1 1秒的音频数据量为秒的音频数据量为 176.4KB176.4KB,一个,一个650MB650MB的光盘仅能存储不足的光盘仅能存储不足6060分钟分钟 的音频数据。的音频数据。12.1.1 2.1.1 多媒体数据压缩的必要性和可能性多媒体数据压缩的必要性和可能性数据压缩的必要性数据量大数据量大5信息的冗余度信息的冗余度

5、如空间冗余、时间冗余、信息如空间冗余、时间冗余、信息 熵冗余、结构冗余、知识冗余等。熵冗余、结构冗余、知识冗余等。1音频信号和视频图像的数字化数据可音频信号和视频图像的数字化数据可 以进行数据压缩是基于以下两种事实:以进行数据压缩是基于以下两种事实:数据压缩的可能性数据压缩的可能性因此,完全可以利用这些特性去除一些多余因此,完全可以利用这些特性去除一些多余 及不敏感的信息,从而实现对数据的压缩。及不敏感的信息,从而实现对数据的压缩。人的视觉、听觉特性人的视觉、听觉特性 2 2人的听觉特征表现出对部分音频信号不敏感人的听觉特征表现出对部分音频信号不敏感, ,如如人人 的听觉具有一个的听觉具有一个

6、强音强音能能抑制抑制一个同时存在的一个同时存在的弱音弱音现象现象, , 而且而且, ,人耳对人耳对低频低频端比较端比较敏感敏感,而对高频端不太敏感。,而对高频端不太敏感。人的视觉特征表现为对人的视觉特征表现为对亮度亮度信息很信息很敏感敏感而对边而对边 缘的急剧变化不敏感;缘的急剧变化不敏感;62.1.2 2.1.2 数据冗余的基本概念与种类数据冗余的基本概念与种类数据冗余的基本概念数据冗余的基本概念数据冗余数据冗余 信息存在的各种多余度信息存在的各种多余度如果用如果用I I、D D、dudu分别表示信息量、数据分别表示信息量、数据 量和冗余量,则它们之间的关系可由下式给量和冗余量,则它们之间的

7、关系可由下式给 出出I=D - I=D - dudu7信息量信息量 指从指从N N个相等的可能事件中选出个相等的可能事件中选出 一个事件所需要的信息度量和含量一个事件所需要的信息度量和含量。I I( (x x) )= log= log2 2N= - logN= - log2 2= - log = - log2 2p(x)p(x)1 1 N N信息熵信息熵 信源所有可能事件的信息量的平均值信源所有可能事件的信息量的平均值H(xH(x) = H(p(x) = H(p(x1 1),(p(x),(p(x2 2), ,), ,p(xp(xn n) )= - = - p(xp(xi i) log) log

8、2 2p(xp(xi i) )i=1i=1n n式中,式中,n n为数据或码元的个数,为数据或码元的个数,p p(x x i i ) 为码元为码元x x i i 发生的概率。发生的概率。8为使单位数据量D接近或等于H,应设其中b(x i)为分配给码元x i 的比特数。 理论情况下,应取但实际上很难确定各码元的概率,因此,但实际上很难确定各码元的概率,因此, 一般总取一般总取 b b(x x1 1)= b= b(x x2 2)= .= b= .= b(x x n n), ,即即 分配给每个码元的比特数相等分配给每个码元的比特数相等( (等长码等长码), ),这样这样 所得的所得的D D必然大于必

9、然大于H,H,从而形成了信息冗余。从而形成了信息冗余。9数据冗余的类别数据冗余的类别 这是图像数据中经常存在的这是图像数据中经常存在的 一种冗余。在同一幅图像中,一种冗余。在同一幅图像中, 规则物体和规则背景的表面规则物体和规则背景的表面 物理特性具有相关性,这些物理特性具有相关性,这些 相关的光成像结构在数字化相关的光成像结构在数字化 图像中就表现为数据冗余。图像中就表现为数据冗余。1 1空间冗余空间冗余10这是序列图像和语音数据中所经常包这是序列图像和语音数据中所经常包 含的冗余。含的冗余。序列图像一般是位于一时间轴序列图像一般是位于一时间轴 区间的一组连续画面,前后帧之间具有很区间的一组

10、连续画面,前后帧之间具有很 强的相关性。当播放该图象序列时,随着强的相关性。当播放该图象序列时,随着 时间的推移,若干帧画面的某些地方发生时间的推移,若干帧画面的某些地方发生 了变化,但有的部位却没有变化,这就形了变化,但有的部位却没有变化,这就形 成了时间冗余。成了时间冗余。2 2时间冗余时间冗余113 3结构冗余结构冗余有些图像的纹理区,图像的像素值存在着 明显的分布模式,如方格状的地板图案等,我们 称之为结构冗余 。12信息熵冗余是指数据所携带的信息量少于信息熵冗余是指数据所携带的信息量少于 数据本身所反映出来的数据数据本身所反映出来的数据冗余。冗余。例如例如 若信号若信号a a1 1,

11、a a2 2的概率分别为的概率分别为 P(aP(a1 1)=0.9, P(a)=0.9, P(a2 2)=0.1,)=0.1,则信号的平均信息量为则信号的平均信息量为 H(xH(x)=)=(0.9log(0.9log2 20.9+0.1log0.9+0.1log2 20.1)=0.467(bit)0.1)=0.467(bit) 用二进制数据表示这两个信号时需用用二进制数据表示这两个信号时需用1bit1bit显然出现了显然出现了数据数据冗余。冗余。4 4信息熵冗余信息熵冗余135 5视觉冗余视觉冗余人类的视觉系统由于受生理特性的限制人类的视觉系统由于受生理特性的限制 ,对于图像场的任何变化并不是

12、都能感知,对于图像场的任何变化并不是都能感知 。例如,对图像的压缩或量化而引入的噪。例如,对图像的压缩或量化而引入的噪 声能使图像发生一些变化,如果这些变化声能使图像发生一些变化,如果这些变化 并不能被视觉所感知,则忽略这些变化后并不能被视觉所感知,则忽略这些变化后 ,仍认为图像是完好的。事实上,人的视,仍认为图像是完好的。事实上,人的视 觉系统一般的分辨能力约为觉系统一般的分辨能力约为2 26 6灰度等级,灰度等级, 而图像量化一般采用而图像量化一般采用2 28 8灰度等级,这样的灰度等级,这样的 冗余就称为视觉冗余。冗余就称为视觉冗余。146 6知识冗余知识冗余又如又如 建筑物的门和窗的形

13、状、位置、大小比例建筑物的门和窗的形状、位置、大小比例 等等, ,这些规律的结构可由先验知识和背景知识得到这些规律的结构可由先验知识和背景知识得到。由图像记录方式与人对图像的知识之由图像记录方式与人对图像的知识之 间的差异所产生的冗余称为知识冗余。间的差异所产生的冗余称为知识冗余。我们可以构造其基本模型,并创建对应各种特征我们可以构造其基本模型,并创建对应各种特征 的图像库,进而图像的存储只需要保存一些特征参数的图像库,进而图像的存储只需要保存一些特征参数 ,就可以大大减少数据量。,就可以大大减少数据量。例如例如 人脸的图像就有固定的结构,鼻子位于脸的人脸的图像就有固定的结构,鼻子位于脸的 中

14、线上,上方是眼睛,下方是嘴等中线上,上方是眼睛,下方是嘴等157 7其他冗余其他冗余 如图像的空间非定常特性所带来的冗余。如图像的空间非定常特性所带来的冗余。 另外,空间冗余和时间冗余是将信号看另外,空间冗余和时间冗余是将信号看 作概率信号时所反应出的统计特性,因此作概率信号时所反应出的统计特性,因此 有时也称这两种冗余为统计冗余。有时也称这两种冗余为统计冗余。162.1.3 2.1.3 图像压缩预处理技术图像压缩预处理技术 图像数据压缩的任务是在不影响或少图像数据压缩的任务是在不影响或少 影响图像质量的前提下,尽量设法减少图影响图像质量的前提下,尽量设法减少图 像数据中的数据量。像数据中的数

15、据量。 图像数据中存在各种冗余,数据压缩的首图像数据中存在各种冗余,数据压缩的首 要任务就是去除各种冗余数据。当然删除冗余要任务就是去除各种冗余数据。当然删除冗余 数据必然会给图像质量带来一定的损失,这就数据必然会给图像质量带来一定的损失,这就 需要进行相应的预处理,来保证将这种损失降需要进行相应的预处理,来保证将这种损失降 至最低限度。至最低限度。 17图像预处理的技术主要有以下几种:图像预处理的技术主要有以下几种:二次抽样二次抽样滤波器滤波器 量化量化 预测编码预测编码 运动补偿运动补偿 变长码变长码 图像内插法图像内插法 182.1.4 2.1.4 量化及其质量量化及其质量 量化的概念与

16、原理量化的概念与原理 量化量化是将具有连续幅度值的输入信号转换是将具有连续幅度值的输入信号转换 为只具有有限个幅度值的输出信号的过程。为只具有有限个幅度值的输出信号的过程。 就一般而言,量化是模拟信号到数字信号就一般而言,量化是模拟信号到数字信号 的映射。模拟信号是连续量,而数字信号是离的映射。模拟信号是连续量,而数字信号是离 散量,因此量化过程实际上就是用有限的离散散量,因此量化过程实际上就是用有限的离散 量代替无限的连续量的多对一的映射过程。量代替无限的连续量的多对一的映射过程。 19一般的一般的量化过程量化过程是预先设置一组判决电是预先设置一组判决电 平和与其对应的一组码字,再将整个有效值平和与其对应的一组码字,再将整个有效值 区间划分成若干个子区间(也即量化级),区间划分成若干个子区间(也

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号