21数据压缩编码基本理论

上传人:壹****1 文档编号:570883389 上传时间:2024-08-07 格式:PPT 页数:71 大小:1.11MB
返回 下载 相关 举报
21数据压缩编码基本理论_第1页
第1页 / 共71页
21数据压缩编码基本理论_第2页
第2页 / 共71页
21数据压缩编码基本理论_第3页
第3页 / 共71页
21数据压缩编码基本理论_第4页
第4页 / 共71页
21数据压缩编码基本理论_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《21数据压缩编码基本理论》由会员分享,可在线阅读,更多相关《21数据压缩编码基本理论(71页珍藏版)》请在金锄头文库上搜索。

1、本章小结本章小结v媒体和多媒体媒体和多媒体v多媒体通信与多媒体技术多媒体通信与多媒体技术v多媒体通信系统组成多媒体通信系统组成v多媒体通信基本特征多媒体通信基本特征v多媒体通信关键技术多媒体通信关键技术v多媒体通信业务多媒体通信业务多媒体数据压缩原理1音频媒体的压缩编码音频媒体的压缩编码2视频媒体的压缩编码视频媒体的压缩编码3第二章 多媒体信号处理流媒体技术流媒体技术42-12-1多媒体数据压缩原理多媒体数据压缩原理一、一、数据压缩的基本概念数据压缩的基本概念二、二、无损编码(统计编码、熵编码)无损编码(统计编码、熵编码)三、三、有损编码有损编码四、四、混合编码混合编码一、数据压缩的基本概念一

2、、数据压缩的基本概念1 1、为什么要压缩?为什么要压缩?2 2、数据为什么可以压缩数据为什么可以压缩3 3、数据压缩的分类数据压缩的分类4 4、数据压缩技术指标数据压缩技术指标一、数据压缩的基本概念一、数据压缩的基本概念1 1、为什么要压缩?、为什么要压缩? 、 节省存储空间节省存储空间 、 减少传输带宽减少传输带宽数据压缩技术是多媒体通信技术走向实用数据压缩技术是多媒体通信技术走向实用化的关键技术之一。化的关键技术之一。压缩前的数据量压缩前的数据量信源信源存储量存储量 电话电话(2003400Hz)8000样本数样本数/秒秒 x12比特比特/样本样本=96kbps 宽带语音宽带语音(5070

3、00Hz)16000样本数样本数/秒秒 x14比特比特/样本样本=224kbps 宽带音频宽带音频(2020000Hz)44100样本数样本数/秒秒 x2通道通道 x16比特比特/样本样本=1.412Mbps 图像图像512x512像素彩色图像像素彩色图像 x24比特比特/像素像素=6.3兆兆比特比特/图像图像 视频视频640x480像素彩色图像像素彩色图像 x24比特比特/像素像素 x30图图像像/秒秒=221Mbps 高清晰度电视高清晰度电视1280x720像素色彩图像像素色彩图像 x60图像图像/秒秒 x24比比特特/像素像素=1.3Gbps 2 2、数据为什么可以压缩、数据为什么可以压

4、缩v无论音频、视频还是文本,其数据都存在较大的无论音频、视频还是文本,其数据都存在较大的冗余度。冗余度。v冗余类型:冗余类型:空间冗余空间冗余- -规则图案的相关性规则图案的相关性时间冗余时间冗余- -前后两画面的相关性前后两画面的相关性视觉冗余视觉冗余- -人眼对亮度比色彩敏感,视觉分辨能力人眼对亮度比色彩敏感,视觉分辨能力2 26 6灰度等级灰度等级听觉冗余听觉冗余- -人耳对低频比高频敏感人耳对低频比高频敏感信源熵冗余信源熵冗余等等等等信源序列之间存在相关性,这种相关性是可以去除的。信源序列之间存在相关性,这种相关性是可以去除的。 熵熵- - 一个独立信源中,每个码元的平均信息量。一个独

5、立信源中,每个码元的平均信息量。空间冗余空间冗余返回时间冗余时间冗余返回3 3、数据压缩的分类、数据压缩的分类、无损压缩、无损压缩(冗余压缩法)(冗余压缩法) 压缩可逆,压缩比小(压缩可逆,压缩比小(2525) 如:行程编码;如:行程编码;HuffmanHuffman编码;算术编码等统编码;算术编码等统计编码(又称熵编码)计编码(又称熵编码)、有损压缩、有损压缩(熵压缩法)(熵压缩法)压缩不可逆,压缩比大(高达压缩不可逆,压缩比大(高达100100以上)以上) 如:预测编码;变换编码;子带编码;模型如:预测编码;变换编码;子带编码;模型编码等编码等、混合压缩、混合压缩无损压缩和有损压缩的结合(

6、应用最多)无损压缩和有损压缩的结合(应用最多)4 4、数据压缩技术指标、数据压缩技术指标、压缩比、压缩比-压缩前数据量与压缩后数据量之压缩前数据量与压缩后数据量之比比、压缩算法及压缩、解压缩速度、压缩算法及压缩、解压缩速度 算法要简单,速度要快算法要简单,速度要快、恢复效果、恢复效果评价指标:评价指标:a a、客观指标、客观指标-信噪比(不能完全反信噪比(不能完全反 映人对图象质量的感觉)映人对图象质量的感觉) b b、主观指标、主观指标-主观平均得主观平均得分分MOSMOS(Mean Opinion Score)(Mean Opinion Score)MOS分数分数质量级别质量级别失真级别失

7、真级别5优优(Excellent)无察觉无察觉4良良(Good)刚察觉但不讨厌刚察觉但不讨厌3中中(Fair)察觉有点讨厌察觉有点讨厌2差差(Poor)讨厌但不反感讨厌但不反感1劣劣(Bad)极其讨厌(反感)极其讨厌(反感)复习复习v数据要压缩的原因数据要压缩的原因v数据可压缩的原因:各种冗余数据可压缩的原因:各种冗余空间、时空间、时间、视觉、听觉、熵等间、视觉、听觉、熵等二、无损编码(统计编码、熵编码)二、无损编码(统计编码、熵编码)1 1、行程编码行程编码2 2、霍夫曼(霍夫曼(HuffmanHuffman)编码)编码3 3、算术编码算术编码二、无损编码(统计编码、熵编码)二、无损编码(统

8、计编码、熵编码)1 1、行程编码、行程编码(run length code,RLC(run length code,RLC也叫游程编码也叫游程编码) )v压缩原始数据中相同的字节序列压缩原始数据中相同的字节序列v例:原始字符串例:原始字符串R RTTTTTTTTTTTTTTTTABBBCDIUABBBCDIU 行程编码将字符串变换为:行程编码将字符串变换为: R R8T8TABBBCDIUABBBCDIU 将原来将原来1717个字符压缩为个字符压缩为1212个字符。个字符。2 2、霍夫曼(、霍夫曼(HuffmanHuffman)编码)编码基本原理:按信源符号出现的概率大小进基本原理:按信源符号

9、出现的概率大小进行排序,出现概率大的分配短码,出现行排序,出现概率大的分配短码,出现概率小的则分配长码。因此又称概率小的则分配长码。因此又称变长编变长编码码。特点:特点:可达到最小平均码长的编码,具有可达到最小平均码长的编码,具有惟一可译性惟一可译性。在分配代码过程中,需要建立二叉树图。在分配代码过程中,需要建立二叉树图。HuffmanHuffman编码步骤:编码步骤:(1 1)将信源符号按概率递减顺序排列;)将信源符号按概率递减顺序排列;(2 2)把两个最小的概率合并,作为新符号的概)把两个最小的概率合并,作为新符号的概率;率;(3 3)重复()重复(1 1)和()和(2 2),直到概率和达

10、到),直到概率和达到1 1为止;为止;(4 4)将最后合并的元素作为树根,每个原始信)将最后合并的元素作为树根,每个原始信源作为树叶,构成一个编码二叉树;从树根到源作为树叶,构成一个编码二叉树;从树根到树叶,对合并的两个分支分别赋予树叶,对合并的两个分支分别赋予1 1和和0 0;(5 5)对每一符号写出从树根到信源点)对每一符号写出从树根到信源点1 1、0 0序列序列即为该符号的编码。即为该符号的编码。例:例:a a、b b、c c、d d四个字符出现的概率为四个字符出现的概率为P(a)=3/4;P(b)=1/8;P(c)=P(d)=1/16P(a)=3/4;P(b)=1/8;P(c)=P(d

11、)=1/16,试按,试按HuffmanHuffman编码,当接收端收到如下数据编码,当接收端收到如下数据0000,译,译为相应字符。为相应字符。 P(abcd)=1 P(abcd)=1 P(bcd)=1/4 P(bcd)=1/4 P(cd)=1/8 P(cd)=1/8 P(a)=3/4 P(b)=1/8 P(c)=1/16 P(d)=1/16 P(a)=3/4 P(b)=1/8 P(c)=1/16 P(d)=1/16 111000a码为1b码为01c码为001d码为000对应字符为bacbaadHuffmanHuffman编码步骤:编码步骤:(1 1)将信源符号按概率递减顺序排列;)将信源符号

12、按概率递减顺序排列;(2 2)把两个最小的概率合并,作为新符号的概)把两个最小的概率合并,作为新符号的概率;率;(3 3)重复()重复(1 1)和()和(2 2),直到概率和达到),直到概率和达到1 1为止;为止;(4 4)将最后合并的元素作为树根,每个原始信)将最后合并的元素作为树根,每个原始信源作为树叶,构成一个编码二叉树;从树根到源作为树叶,构成一个编码二叉树;从树根到树叶,对合并的两个分支分别赋予树叶,对合并的两个分支分别赋予1 1和和0 0;(5 5)对每一符号写出从树根到信源点)对每一符号写出从树根到信源点1 1、0 0序列序列即为该符号的编码。即为该符号的编码。复习复习v数据可压

13、缩的原因数据可压缩的原因v数据压缩的种类数据压缩的种类v数据压缩的技术指标数据压缩的技术指标v无损压缩的常见技术:行程编码、霍夫曼无损压缩的常见技术:行程编码、霍夫曼编码、算术编码编码、算术编码3 3、算术编码、算术编码原理:根据信源不同符号概率的不同,分别原理:根据信源不同符号概率的不同,分别对应对应00,1 1)中不同的区间,每个符号用对)中不同的区间,每个符号用对应区间内的应区间内的任意一个实数任意一个实数表示,这个实数表示,这个实数就是该符号对应的码字。就是该符号对应的码字。 特点:只有算术运算,无论原数据位多长,特点:只有算术运算,无论原数据位多长,每次编码算法只处理一个数据符号,因

14、此每次编码算法只处理一个数据符号,因此编码效率高。编码效率高。00011011010.5 0.52 000.52 0.514 110.514 0.5146 000.5143 0.51442 100.514384 0.51442 110.5143876 0.514402 010.5 0.7 10最后选0.5144 对应的二进制数作为传输码元符号符号0000010110101111概率概率0.10.10.40.40.20.20.30.3初始区间初始区间0, 0.1)0, 0.1)0.1, 0.5)0.1, 0.5)0.5, 0.7)0.5, 0.7)0.7, 1)0.7, 1)例1对输入的101进

15、行算术编码。解:(0.5144)10=(10000011)2 14位码变为8位码解码时,由于解码时,由于0.51440.5144在在00,1 1)中的)中的0.50.5,0.7)0.7)范围,因此第一位码是范围,因此第一位码是1010;由于;由于0.51440.5144在在0.50.5,0.70.7)中的)中的0.50.5,0.520.52) 范围,因范围,因此第二位码是此第二位码是0000;-00011011010.5 0.52 000.52 0.514 110.514 0.5146 000.5143 0.51442 100.514384 0.51442 110.5143876 0.5144

16、02 010.5 0.7 10解码为:101例例2 2:ABCDABCD四符号出现的概率分别为:四符号出现的概率分别为:1/81/8,1/41/4,1/21/2,1/81/8,对,对CCBDCCBD进行算术编码。进行算术编码。解:解:ABCD01/83/87/81ABCDABCDBACD9/1613/1619/32 21/3283/12821/32(83/128)10=(1010011)2(21/32)10=(10101)2将1010011传输,收端解码为CCBDA0,1/8).为半开区间算术编码的特点算术编码的特点v算术编码的模式选择,直接影响编码效率算术编码的模式选择,直接影响编码效率v模

17、式有固定模式和自适应模式,自适应模式无须模式有固定模式和自适应模式,自适应模式无须先定义概率模式,适合不能进行概率统计的信源先定义概率模式,适合不能进行概率统计的信源编码。编码。v在信源概率接近时,算术编码效率高于霍夫曼编在信源概率接近时,算术编码效率高于霍夫曼编码码v硬件实现的复杂度高于霍夫曼编码硬件实现的复杂度高于霍夫曼编码v目前新的压缩编码技术中,算术编码正在代替霍目前新的压缩编码技术中,算术编码正在代替霍夫曼编码。夫曼编码。自适应算术编码举例自适应算术编码举例cba1.00000.66670.33330.00000.66670.58340.41670.33330.66670.63340

18、.60010.58340.66670.65010.63900.6334c1/31/42/53/6b1/32/42/52/6a1/31/41/51/6输入序列为:输入序列为:bcc.自适应算术编码特点自适应算术编码特点v自适应算术编码可以在编码过程中根据符自适应算术编码可以在编码过程中根据符号出现的频繁程度,动态地修改分布概率,号出现的频繁程度,动态地修改分布概率,因此不需要在编码前求出信源概率,但要因此不需要在编码前求出信源概率,但要求编码器和解码器使用的概率模型一致。求编码器和解码器使用的概率模型一致。三、有损编码三、有损编码1 1、预测编码预测编码2 2、子带编码子带编码3 3、变换编码变

19、换编码4 4、矢量量化编码矢量量化编码5 5、其它编码其它编码三、有损编码三、有损编码1 1、预测编码、预测编码脉冲编码调制脉冲编码调制(pulse code modulation,PCM)(pulse code modulation,PCM)音频信号经过抽样、量化、编码三个过程完成模音频信号经过抽样、量化、编码三个过程完成模数转换。由于样值的动态范围大,故需要的量数转换。由于样值的动态范围大,故需要的量化级数多,编码的码位长。化级数多,编码的码位长。预测编码原理预测编码原理v根据前一个样值来预测下一个样值的大根据前一个样值来预测下一个样值的大小,并将预测误差进行量化,一位或多小,并将预测误差

20、进行量化,一位或多位编码后传输。位编码后传输。v预测编码的最大优点是传输信号占用带预测编码的最大优点是传输信号占用带宽窄。宽窄。、简单增量调制、简单增量调制(M)(M)v在预测编码中,一位码传输时称为简单在预测编码中,一位码传输时称为简单增量调制。增量调制。预测误差:预测误差:量化后的量化值为量化后的量化值为预测值预测值 接接收收端端,利利用用与与发发送送端端组组成成相相同同的的预预测测器器,得得到到收收端端预预测测值值 与发端相同与发端相同收端输出:收端输出:输出信号与输入信号只是相差了一个量化误差简单增量调制过程简单增量调制过程MM的过载失真的过载失真v由于预测信号按一定的规律变化,当预测

21、信号跟由于预测信号按一定的规律变化,当预测信号跟不上模拟信号的变化时,预测误差将大大增加,不上模拟信号的变化时,预测误差将大大增加,从而造成接收端解调信号严重失真的现象称为过从而造成接收端解调信号严重失真的现象称为过载失真。载失真。v为避免过载失真,要求为避免过载失真,要求M M 特点:优点是一位码传输,占用信道特点:优点是一位码传输,占用信道带宽窄;缺点是信噪比较低。带宽窄;缺点是信噪比较低。、差分脉冲编码调制、差分脉冲编码调制(DPCM)(DPCM)vMM一位码传输,其信噪比较低,若采用一位码传输,其信噪比较低,若采用多位码传输则信噪比可提高。这就是差多位码传输则信噪比可提高。这就是差分脉

22、冲编码调制分脉冲编码调制(DPCM) (DPCM) 。v由于采用多位码传输,其信噪比要优于由于采用多位码传输,其信噪比要优于MM;而在同样信噪比的前提下,;而在同样信噪比的前提下,DPCMDPCM的的速率低于速率低于PCMPCM。vDPCMDPCM主要应用在图象通信系统。主要应用在图象通信系统。缺点:预测器和量化器按一定规律工作(均匀量化),缺点:预测器和量化器按一定规律工作(均匀量化),与输入样值的变化率无关,使与输入样值的变化率无关,使e(iTs)e(iTs)变化范围较大,变化范围较大,在保证信噪比的前提下,量化级数要提高,速率也在保证信噪比的前提下,量化级数要提高,速率也相应提高相应提高

23、。、自适应差分脉冲编码、自适应差分脉冲编码(ADPCM)(ADPCM) 增加的预测自适应系统能减小预测误差;增加的预测自适应系统能减小预测误差; 阶距自适应系统能减小量化误差。阶距自适应系统能减小量化误差。相减量化编码相加预测阶距自适应系统预测自适应系统.ADPCM(t)a(t)vADPCMADPCM在采用在采用4 4位码传输时,其信噪比与位码传输时,其信噪比与8 8位位码的码的PCMPCM相当。相当。vADPCMADPCM是国际规定的语音编码标准。称为是国际规定的语音编码标准。称为G.721G.721标准。标准。vPCMPCM是是G.711G.711标准标准复习复习v无损编码无损编码-行程编

24、码、霍夫曼编码、算术编行程编码、霍夫曼编码、算术编码码v有损编码有损编码-第一代编码:预测编码、子带编第一代编码:预测编码、子带编码、变换编码、矢量量化编码。码、变换编码、矢量量化编码。 第二代编码:模型编码、第二代编码:模型编码、分形编码、神经网络编码。分形编码、神经网络编码。2 2、子带编码、子带编码原理:将信号在频域范围内按频率划分为不原理:将信号在频域范围内按频率划分为不同子带,根据不同子带特征用不同的方式同子带,根据不同子带特征用不同的方式进行量化编码。进行量化编码。各子带带宽相同时,称为等带宽子带编码各子带带宽不同时,称为变带宽子带编码解码器 编码器 子带编码特点:子带编码特点:1

25、 1、利用人耳对不同频率的感知灵敏度不同,、利用人耳对不同频率的感知灵敏度不同,在听觉不敏感频段(高频)采用粗量化以在听觉不敏感频段(高频)采用粗量化以压缩数据。压缩数据。 2 2、各子带的量化噪声束缚在本子带内,防、各子带的量化噪声束缚在本子带内,防止能量小的频带信号被其它频段中量化噪止能量小的频带信号被其它频段中量化噪声掩盖。(各子带内信噪比基本相同)声掩盖。(各子带内信噪比基本相同)3 3、变换编码变换编码变换原理:将原来在空间域或时间域内描写的信号,变换原理:将原来在空间域或时间域内描写的信号,变换到一个更适合压缩的变换到一个更适合压缩的抽象域抽象域,用变换后的变,用变换后的变换系数来

26、表示原始图象,并对变换系数进行编码。换系数来表示原始图象,并对变换系数进行编码。变换的目的:变换的目的:变换本身不能实现数据压缩变换本身不能实现数据压缩,但变换,但变换后的信号能量大部分集中在少数几个变换系数上,后的信号能量大部分集中在少数几个变换系数上,删除能量小的系数以达到有效压缩的目的。删除能量小的系数以达到有效压缩的目的。变换的方法有很多种变换的方法有很多种各种变换的运算量大小排列次序为:各种变换的运算量大小排列次序为:Haar-WHT-SLT-DCT-DET-KLTHaar-WHT-SLT-DCT-DET-KLT 小小 大大各种变换在变换域中能量集中程度优劣排列:各种变换在变换域中能

27、量集中程度优劣排列:KLT-DCT-SLT-DFT-WHT-HaarKLT-DCT-SLT-DFT-WHT-Haar优优 劣劣应用较多的是离散余弦变换DCT。离散余弦变换(离散余弦变换(DCTDCT)原理:将时域信号变换到频域,使低频和高频原理:将时域信号变换到频域,使低频和高频分量分离,根据不同频带特征用不同的方式分量分离,根据不同频带特征用不同的方式进行量化编码。进行量化编码。特点:大多数图象的高频分量较小(经常为零)特点:大多数图象的高频分量较小(经常为零),且人眼对高频成分的失真不太敏感,因此,且人眼对高频成分的失真不太敏感,因此可以采用较少的码元以压缩数据。可以采用较少的码元以压缩数

28、据。DCT变换量化编码信道解码反DCT变换DCT变换主要应用于数字图象压缩编码。时域中f(x,y)各项系数是象素参数其值较大 ,变换到频域中F(u,v)除低频系数较大外,大多数高频分量近似为零,故传送变换系数的码率大大小于传送象素的码率。例例某象素块某象素块每个象素点的值256DCTDCT变换后变换后量化后量化后小波变换编码小波变换编码小波变换编码是在小波变换编码是在DCTDCT的基础上发展起来的。的基础上发展起来的。DCTDCT的缺点:的缺点:带宽较窄的信号采用带宽较窄的信号采用DCTDCT的压缩比较的压缩比较高,而带宽较宽的信号采用高,而带宽较宽的信号采用DCTDCT的压缩比较低;的压缩比

29、较低;DCTDCT对整个图象先进行分块,然后对每个块进行对整个图象先进行分块,然后对每个块进行变换,容易产生变换,容易产生“方块方块”效应,影响恢复质量。效应,影响恢复质量。小波变换编码在保持小波变换编码在保持DCTDCT优点的基础上,克服了优点的基础上,克服了DCTDCT的缺点。的缺点。小波变换编码原理小波变换编码原理小波变换对整幅原始图象通过两个互补的滤小波变换对整幅原始图象通过两个互补的滤波器分解产生两个不同频带的信号,根据波器分解产生两个不同频带的信号,根据需要可以进行多级分解,以得到多个频带需要可以进行多级分解,以得到多个频带的信号(称为小波变换),将这些信号进的信号(称为小波变换)

30、,将这些信号进行不同的抽样、量化、编码。行不同的抽样、量化、编码。小波变换量化熵编码熵解码反量化小波逆变换比特流传输原始图象恢复图象原始图象LLHLHHLH 一级分解LL2HL2LH2HH2LH1HH1HL1 二级分解HL2LH2HH2LH1HH1HL1LL3LH3 三级分解LPFHPFLPFHPFLPFHPF图象LL表示的低频分量,它描述了信号的基本特征,是信号中最重要的部分;HL、LH、HH为高频信息代表了图象的细节变化。小波变换特点小波变换特点v分级前后的数据量没有改变,但变换后的数据量能量分级前后的数据量没有改变,但变换后的数据量能量更集中,更有利于数据的压缩,压缩在量化过程完成。更集

31、中,更有利于数据的压缩,压缩在量化过程完成。v在多个分级中,各高频频带是图象同一边缘、轮廓和在多个分级中,各高频频带是图象同一边缘、轮廓和纹理信息在不同方向、不同尺寸和不同分辨率下由粗纹理信息在不同方向、不同尺寸和不同分辨率下由粗到细的描述,它们之间必然存在一定的关系。根据人到细的描述,它们之间必然存在一定的关系。根据人眼的视觉特性眼的视觉特性(HVS)(HVS)及原图象的统计特性,对不同的频及原图象的统计特性,对不同的频率区域采用不同的压缩编码手段,以使数据量减小。率区域采用不同的压缩编码手段,以使数据量减小。因此无论图象带宽的宽窄,都可以较大程度上压缩。因此无论图象带宽的宽窄,都可以较大程

32、度上压缩。v由于是对整幅图象进行变换,因此不会出现由于是对整幅图象进行变换,因此不会出现“方块方块”效应。效应。v小波变换可获得更高的压缩比,压缩速率快,恢复的小波变换可获得更高的压缩比,压缩速率快,恢复的质量高,压缩效果好。其应用正逐渐取代质量高,压缩效果好。其应用正逐渐取代DCTDCT变换。变换。4 4、矢量量化、矢量量化(VQ)(VQ)编码编码矢量量化矢量量化- -对抽样数据分组,每组对抽样数据分组,每组K K个数构成个数构成一个一个K K维矢量,以矢量为单元,逐个矢量进维矢量,以矢量为单元,逐个矢量进行量化。行量化。编码原理:输入的信息数据按照一定的方式形成一个输入矢量。编码时用这个输

33、入矢量与码书中的所有码字计算距离,找到距离最近的码字,即找到最佳匹配码字。输出其索引(地址)作为编码结果。解码过程与之相反,根据编码结果中的索引从码书中找到索引对应的码字(该码书必须与编码时使用的码书一致),构成解码结果。在矢量量化编码中,关键是码本的建立和码字搜索算法。在矢量量化编码中,关键是码本的建立和码字搜索算法。 码本的建立主要在编码前,通过大量样本的训练或学习码本的建立主要在编码前,通过大量样本的训练或学习等方法,得到一系列的标准图象或语音模式,每一个等方法,得到一系列的标准图象或语音模式,每一个模式就称为码字模式就称为码字(code word)(code word)或码矢或码矢(c

34、odevector) (codevector) ,这些码字或码矢合在一起称为码本(这些码字或码矢合在一起称为码本(codebook)codebook)或码书。或码书。码字搜索是要搜索出与输入最为匹配的码矢。最常用的码字搜索是要搜索出与输入最为匹配的码矢。最常用的搜索方法是全搜索算法和树搜索算法。搜索方法是全搜索算法和树搜索算法。 全搜索矢量量化器性能好但设备较复杂。全搜索矢量量化器性能好但设备较复杂。 树搜索的过程是逐步求近似的过程,其复杂度比全搜树搜索的过程是逐步求近似的过程,其复杂度比全搜索算法显著减少,搜索速度较快。但量化器并不是最索算法显著减少,搜索速度较快。但量化器并不是最佳的,其量

35、化信噪比低于全搜索。佳的,其量化信噪比低于全搜索。5 5、其它编码、其它编码(新的第二代高效编码)(新的第二代高效编码)、基于模型的编码、基于模型的编码原理:对特定的图象建立模型,并根据这个模型确定原理:对特定的图象建立模型,并根据这个模型确定图象中景物的特征参数,如运动参数、形状参数等。图象中景物的特征参数,如运动参数、形状参数等。编码时将实际图象与模型中图象进行比较,编码时将实际图象与模型中图象进行比较,选择选择误误差最小的图象对应的差最小的图象对应的特征参数进行编码特征参数进行编码。解码时则。解码时则根据参数和已知模型用图象合成技术重建图象。根据参数和已知模型用图象合成技术重建图象。音频

36、和视频都可以采用基于模型的编码。音频和视频都可以采用基于模型的编码。由于编码的对象是特征参数,而不是原始图象,因此有可能实现比较大的压缩比。(高达104:1105:1)。v模型编码将图象信号看作三维世界中模型编码将图象信号看作三维世界中的目标和景物投影到二维平面的产物,的目标和景物投影到二维平面的产物,而对这一产物的评价是由人类视觉系统而对这一产物的评价是由人类视觉系统的特性决定的。的特性决定的。v模型编码引入的误差主要是人眼视觉不模型编码引入的误差主要是人眼视觉不太敏感的几何失真,因此重建图象非常太敏感的几何失真,因此重建图象非常自然和逼真。自然和逼真。 基于模型编码可分为有先验知识和无先验

37、基于模型编码可分为有先验知识和无先验知识两种:知识两种:有先验知识的模型编码:有先验知识的模型编码:在收发双方按照事在收发双方按照事先建立好的模型进行编码和解码。先建立好的模型进行编码和解码。运动估计表示分析模型调整图象合成图象生成(背景等)源模型源模型输入视频输出视频无先验知识的模型编码无先验知识的模型编码:收发双方没有事:收发双方没有事先约定的模型。不需要模式识别知识,先约定的模型。不需要模式识别知识,对于图象分析比较简单,但是需要实时对于图象分析比较简单,但是需要实时构造对象模型,因此编码效率无法与有构造对象模型,因此编码效率无法与有先验知识的模型编码相比。先验知识的模型编码相比。模型编

38、码是对分割的模型特征参数直接编模型编码是对分割的模型特征参数直接编码。码。、分形编码、分形编码(Fractal Coding (Fractal Coding ) )分形编码原理:首先对图像进行分块,对每个块进分形编码原理:首先对图像进行分块,对每个块进行仿射变换,然后在分形集中查找这些子图象对行仿射变换,然后在分形集中查找这些子图象对应的仿射变换系数,将这个仿射变换系数进行传应的仿射变换系数,将这个仿射变换系数进行传输。,因而图像得以大幅度的压缩。输。,因而图像得以大幅度的压缩。 由于每块的数据量远大于仿射变换系数,因此分形由于每块的数据量远大于仿射变换系数,因此分形编码的数据压缩量较大(压缩

39、比编码的数据压缩量较大(压缩比10104 4:1 1)。)。仿射变换仿射变换AT(affine tranformation)AT(affine tranformation)对对n n 维空间维空间函数的图象经过旋转、伸缩、偏斜、平移等处理。函数的图象经过旋转、伸缩、偏斜、平移等处理。模型编码是对分割的模型编码是对分割的模型特征参数模型特征参数直接编码。直接编码。分形编码则是对分割的图象进行仿射变换后分形编码则是对分割的图象进行仿射变换后的的仿射系数仿射系数编码。编码。、神经网络编码、神经网络编码人类视神经网络研究表明:视皮层对外界刺激的处人类视神经网络研究表明:视皮层对外界刺激的处理采用神经稀

40、疏表示原则。即多维数据的神经网理采用神经稀疏表示原则。即多维数据的神经网络中只有一小部分神经元同时处于活跃状态。络中只有一小部分神经元同时处于活跃状态。神经网络编码就是根据视神经网络的实际工作模式,神经网络编码就是根据视神经网络的实际工作模式,对繁杂冗余的信息抽取刺激上层传感神经中最本对繁杂冗余的信息抽取刺激上层传感神经中最本质的特征参数进行编码。质的特征参数进行编码。这既对繁杂冗余的信息提供了简单表示,又利于上这既对繁杂冗余的信息提供了简单表示,又利于上层传感神经抽取刺激中最本质的特征。层传感神经抽取刺激中最本质的特征。v图像编码方法可分为两代:第一代是基于图像编码方法可分为两代:第一代是基

41、于数据统计,去掉的是数据冗余;第二代是数据统计,去掉的是数据冗余;第二代是基于内容,去掉的是内容冗余。基于内容,去掉的是内容冗余。 四、混合编码四、混合编码采用两种或多种编码方法进行压缩编码称采用两种或多种编码方法进行压缩编码称为混合编码。为混合编码。“处理”和“量化”可以在反馈环中交互地重复多次 预准备 -包括模数转换和生成适当的数据表达信息。 处理 -是复杂算法压缩处理的第一步。如从时域到频域的变换 量化 -对处理产生的结果进行再处理,这一处理过程导致精度的降低(失真)。 结束基于模型的图像编码技术分类 类类别别 信源模型信源模型 编码的信息编码的信息 典型编码技术典型编码技术 1 运动的区域运动的区域 每个区域的轮廓、纹理及运动参数每个区域的轮廓、纹理及运动参数 基于区域编码、基于分割编码基于区域编码、基于分割编码 2 未知的运动物体未知的运动物体 每个物体的形状、运动和色彩每个物体的形状、运动和色彩 基于物体编码基于物体编码 3 已知的运动物体已知的运动物体 物体形状、运动、色彩及行为物体形状、运动、色彩及行为/表情单元表情单元 基于知识编码、基于语义编码基于知识编码、基于语义编码

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号