CCDCMOS图像传感器基础与应用.ppt

上传人:M****1 文档编号:567921060 上传时间:2024-07-22 格式:PPT 页数:298 大小:2.48MB
返回 下载 相关 举报
CCDCMOS图像传感器基础与应用.ppt_第1页
第1页 / 共298页
CCDCMOS图像传感器基础与应用.ppt_第2页
第2页 / 共298页
CCDCMOS图像传感器基础与应用.ppt_第3页
第3页 / 共298页
CCDCMOS图像传感器基础与应用.ppt_第4页
第4页 / 共298页
CCDCMOS图像传感器基础与应用.ppt_第5页
第5页 / 共298页
点击查看更多>>
资源描述

《CCDCMOS图像传感器基础与应用.ppt》由会员分享,可在线阅读,更多相关《CCDCMOS图像传感器基础与应用.ppt(298页珍藏版)》请在金锄头文库上搜索。

1、第第6 6章章 视频压缩技术视频压缩技术 第第6章章 视频压缩技术视频压缩技术 6.1 视频压缩的基本原理视频压缩的基本原理6.2 静止图像压缩静止图像压缩 6.3 活动图像编码活动图像编码 6.4 音频压缩的原理和标准音频压缩的原理和标准 思考题和习题思考题和习题 第第6 6章章 视频压缩技术视频压缩技术 6.1 视频压缩的基本原理视频压缩的基本原理6.1.1视频信号压缩的可能性视频数据中存在着大量的冗余,即图像的各像素数据之间存在极强的相关性。利用这些相关性,一部分像素的数据可以由另一部分像素的数据推导出来,结果视频数据量能极大地压缩,有利于传输和存储。视频数据主要存在以下形式的冗余。第第

2、6 6章章 视频压缩技术视频压缩技术 1.空间冗余视频图像在水平方向相邻像素之间、垂直方向相邻像素之间的变化一般都很小,存在着极强的空间相关性。特别是同一景物各点的灰度和颜色之间往往存在着空间连贯性,从而产生了空间冗余,常称为帧内相关性。第第6 6章章 视频压缩技术视频压缩技术 2.时间冗余在相邻场或相邻帧的对应像素之间,亮度和色度信息存在着极强的相关性。当前帧图像往往具有与前、后两帧图像相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,对大多数像素来说,亮度和色度信息是基本相同的,称为帧间相关性或时间相关性。第第6 6章章 视频压缩技术视频压缩技术 3.结构冗余在有些图像的纹理区,

3、图像的像素值存在着明显的分布模式。如方格状的地板图案等。已知分布模式,可以通过某一过程生成图像,称为结构冗余。4.知识冗余有些图像与某些知识有相当大的相关性。如人脸的图像有固定的结构,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于脸部图像的中线上。这类规律性的结构可由先验知识得到,此类冗余称为知识冗余。第第6 6章章 视频压缩技术视频压缩技术 5.视觉冗余人眼具有视觉非均匀特性,对视觉不敏感的信息可以适当地舍弃。在记录原始的图像数据时,通常假定视觉系统是线性的和均匀的,对视觉敏感和不敏感的部分同等对待,从而产生了比理想编码(即把视觉敏感和不敏感的部分区分开来编码)更多的数据,这就是视觉冗余。人眼对

4、图像细节、幅度变化和图像的运动并非同时具有最高的分辨能力。第第6 6章章 视频压缩技术视频压缩技术 人眼视觉对图像的空间分解力和时间分解力的要求具有交换性,当对一方要求较高时,对另一方的要求就较低。根据这个特点,可以采用运动检测自适应技术,对静止图像或慢运动图像降低其时间轴抽样频率,例如每两帧传送一帧;对快速运动图像降低其空间抽样频率。第第6 6章章 视频压缩技术视频压缩技术 另外,人眼视觉对图像的空间、时间分解力的要求与对幅度分解力的要求也具有交换性,对图像的幅度误差存在一个随图像内容而变的可觉察门限,低于门限的幅度误差不被察觉,在图像的空间边缘(轮廓)或时间边缘(景物突变瞬间)附近,可觉察

5、门限比远离边缘处增大34倍,这就是视觉掩盖效应。第第6 6章章 视频压缩技术视频压缩技术 根据这个特点,可以采用边缘检测自适应技术,对于图像的平缓区或正交变换后代表图像低频成分的系数细量化,对图像轮廓附近或正交变换后代表图像高频成分的系数粗量化;当由于景物的快速运动而使帧间预测编码码率高于正常值时进行粗量化,反之则进行细量化。在量化中,尽量使每种情况下所产生的幅度误差刚好处于可觉察门限之下,这样能实现较高的数据压缩率而主观评价不变。第第6 6章章 视频压缩技术视频压缩技术 6.图像区域的相同性冗余在图像中的两个或多个区域所对应的所有像素值相同或相近,从而产生的数据重复性存储,这就是图像区域的相

6、似性冗余。在这种情况下,记录了一个区域中各像素的颜色值,与其相同或相近的区域就不再记录各像素的值。矢量量化方法就是针对这种冗余图像的压缩方法。第第6 6章章 视频压缩技术视频压缩技术 7.纹理的统计冗余有些图像纹理尽管不严格服从某一分布规律,但是在统计的意义上服从该规律,利用这种性质也可以减少表示图像的数据量,称为纹理的统计冗余。电视图像信号数据存在的信息冗余为视频压缩编码提供了可能。第第6 6章章 视频压缩技术视频压缩技术 6.1.2视频信号的数字化和压缩模拟电视信号(包括视频和音频)通过取样、量化后编码为二进制数字信号的过程称为模数变换(AD变换)或脉冲编码调制(PCM,PulseCodi

7、ngModulation),所得到的信号也称为PCM信号,其过程可用图6-1(a)表示。若取样频率等于fs、用n比特量化,则PCM信号的码率为nfs(比特s)。PCM编码既可以对彩色全电视信号直接进行,也可以对亮度信号和两个色差信号分别进行,前者称为全信号编码,后者称为分量编码。第第6 6章章 视频压缩技术视频压缩技术 PCM信号经解码和插入滤波恢复为模拟信号,如图6-1(b)所示,解码是编码的逆过程,插入滤波是把解码后的信号插补为平滑、连续的模拟信号。这两个步骤合称为数模变换(DA变换)或PCM解码。第第6 6章章 视频压缩技术视频压缩技术 图6-1电视信号的数字化和复原(a)A/D变换;(

8、b)D/A变换第第6 6章章 视频压缩技术视频压缩技术 1.奈奎斯特取样定理理想取样时,只要取样频率大于或等于模拟信号中最高频率的两倍,就可以不失真地恢复模拟信号,称为奈奎斯特取样定理。模拟信号中最高频率的两倍称为折叠频率。2.亚奈奎斯特取样按取样定理,若取样频率fs小于模拟信号最高频率fmax的2倍会产生混叠失真,但若巧妙地选择取样频率,令取样后频谱中的混叠分量落在色度分量和亮度分量之间,就可用梳状滤波器去掉混叠成分。第第6 6章章 视频压缩技术视频压缩技术 3.均匀量化和非均匀量化在输入信号的动态范围内,量化间隔幅度都相等的量化称为均匀量化或线性量化。对于量化间距固定的均匀量化,信噪比随输

9、入信号幅度的增加而增加,在强信号时固然可把噪波淹没掉,在弱信号时,噪波的干扰就十分显著。为改善弱信号时的信噪比,量化间距应随输入信号幅度而变化,大信号时进行粗量化,小信号时进行细量化,也就是采用非均匀量化(或称非线性量化)。第第6 6章章 视频压缩技术视频压缩技术 非均匀量化有两种方法,一是把非线性处理放在编码器前和解码器后的模拟部分,编、解码仍采用均匀量化,在均匀量化编码器之前,对输入信号进行压缩,这样等效于对大信号进行粗量化,小信号进行细量化;在均匀量化解码器之后,再进行扩张,以恢复原信号。另一种方法是直接采用非均匀量化器,输入信号大时进行粗量化(量化间距大),输入信号小时细量化(量化间距

10、小)。也有采用若干个量化间距不等的均匀量化器,当输入信号超过某一电平时进入粗间距均匀量化器,低于某一电平时进入细间距量化器,称为准瞬时压扩方式。第第6 6章章 视频压缩技术视频压缩技术 通常用Q表示量化,用Q-1表示反量化。量化过程相当于由输入值找到它所在的区间号,反量化过程相当于由量化区间号得到对应的量化电平值。量化区间总数远远少于输入值的总数,所以量化能实现数据压缩。很明显,反量化后并不能保证得到原来的值,因此量化过程是一个不可逆过程,用量化的方法来进行压缩编码是一种非信息保持型编码。通常这两个过程均可用查表方法实现,量化过程在编码端完成,而反量化过程则在解码端完成。第第6 6章章 视频压

11、缩技术视频压缩技术 对量化区间标号(量化值)的编码一般采用等长编码方法。当量化分层总数为K时,经过量化压缩后的二进制数码率为lbK比特量值。在一些要求较高的场合,可采用可变字长编码如哈夫曼编码或算术编码来进一步提高编码效率。第第6 6章章 视频压缩技术视频压缩技术 6.1.3ITU-RBT.601分量数字系统数字视频信号是将模拟视频信号经过取样、量化和编码后形成的。模拟电视有PAL、NTSC等制式,必然会形成不同制式的数字视频信号,不便于国际数字视频信号的互通。1982年10月,国际无线电咨询委员会(CCIR,ConsultativeCommitteeforInternationalRadio

12、)通过了第一个关于演播室彩色电视信号数字编码的建议,1993年变更为ITU-R(国际电联无线电通信部分,InternationalTelecommunicationsUnion-RadiocommunicationsSector)BT.601分量数字系统建议。第第6 6章章 视频压缩技术视频压缩技术 BT.601建议采用了对亮度信号和两个色差信号分别编码的分量编码方式,对不同制式的信号采用相同的取样频率13.5MHz,与任何制式的彩色副载波频率无关,对亮度信号Y的取样频率为13.5MHz。由于色度信号的带宽远比亮度信号的带宽窄,对色度信号U和V的取样频率为6.75MHz。每个数字有效行分别有7

13、20个亮度取样点和3602个色差信号取样点。对每个分量的取样点都是均匀量化,对每个取样进行8比特精度的PCM编码。第第6 6章章 视频压缩技术视频压缩技术 这几个参数对525行、60场秒和625行50场秒的制式都是相同的。有效取样点是指只有行、场扫描正程的样点有效,逆程的样点不在PCM编码的范围内。因为在数字化的视频信号中,不再需要行、场同步信号和消隐信号,只要有行、场(帧)的起始位置即可。例如,对于PAL制,传输所有的样点数据,大约需要200Mbs的传输速率,传输有效样点只需要160Mbs左右的速率。色度信号的取样率是亮度信号取样率的一半,常称作422格式,可以理解为每一行里的Y、U、V的样

14、点数之比为422。第第6 6章章 视频压缩技术视频压缩技术 6.1.4熵编码熵编码(EntropyCoding)是一类无损编码,因编码后的平均码长接近信源的熵而得名。熵编码多用可变字长编码(VLC,VariableLengthCoding)实现。其基本原理是对信源中出现概率大的符号赋以短码,对出现概率小的符号赋以长码,从而在统计上获得较短的平均码长。所编的码应是即时可译码,某一个码不会是另一个码的前缀,各个码之间无需附加信息便可自然分开。第第6 6章章 视频压缩技术视频压缩技术 1.霍夫曼(Huffman)编码霍夫曼(Huffman)编码是一种可变长编码,编码方法如图6-2所示。(1)将输入信

15、号符号以出现概率由大至小为序排成一列。(2)将两处最小概率的符号相加合成为一个新概率,再按出现概率的大小排序。(3)重复步骤(2),直至最终只剩两个概率。(4)编码从最后一步出发逐步向前进行,概率大的符号赋予“0”码,另一个概率赋予“1”码,直至到达最初的概率排列为止。第第6 6章章 视频压缩技术视频压缩技术 图6-2霍夫曼(Huffman)编码第第6 6章章 视频压缩技术视频压缩技术 2.算术编码霍夫曼编码的每个代码都要使用一个整数位,如果一个符号只需要用2.5位就能表示,但在霍夫曼编码中却必须用3个符号来表示,因此它的效率较低。与其相比,算术编码并不是为每个符号产生一个单独的代码,而是使整

16、条信息共用一个代码,增加到信息上的每个新符号都递增地修改输出代码。第第6 6章章 视频压缩技术视频压缩技术 假设信源由4个符号S1、S2、S3和S4组成,其概率模型如表6-1所示。把各符号出现的概率表示在如图6-3所示的单位概率区间之中,区间的宽度代表概率值的大小,各符号所对应的子区间的边界值,实际上是从左到右各符号的累积概率。在算术编码中通常采用二进制的小数来表示概率,每个符号所对应的概率区间都是半开区间,如S1对应0,0.001),S2对应0.001,0.011)。算术编码所产生的码字实际上是一个二进制小数值的指针,该指针指向所编的符号所对应的概率区间。第第6 6章章 视频压缩技术视频压缩

17、技术 表6-1信源概率模型和算术编码过程第第6 6章章 视频压缩技术视频压缩技术 图6-3算术编码过程示意图第第6 6章章 视频压缩技术视频压缩技术 若将符号序列S3S3S2S4进行算术编码,序列的第一个符号为S3,我们用指向图6-3中第3个子区间的指针来代表这个符号,由此得到码字0.011。后续的编码将在前面编码指向的子区间内进行。将0.011,0.111)区间再按符号的概率值划分成4份,对第二个符号S3,指针指向0.1001,码字串变为0.1001。然后S3所对应的子区间又被划分为4份,开始对第3个符号进行编码。第第6 6章章 视频压缩技术视频压缩技术 算术编码的基本法则如下:(1)初始状

18、态:编码点(指针所指处)C0=0,区间宽度A0=1。(2)新编码点:Ci=Ci-1+Ai-1Pi。式中,Ci-1是原编码点;Ai-1是原区间宽度;Pi所编符号对应的累积概率。新区间宽度Ai=Ai-1pi式中,pi为所编符号对应的概率。第第6 6章章 视频压缩技术视频压缩技术 根据上述法则,对序列S3S3S2S4进行算术编码的过程如下:第一个符号S3:C1=C0+A0P1=0+10.011=0.011A1=A0p1=10.1=0.10.011,0.111第二个符号S3:C2=C1+A1P2=0.011+0.10.011=0.1001A2=A1p2=0.10.1=0.010.1001,0.1101

19、第第6 6章章 视频压缩技术视频压缩技术 第三个符号S2:C3=C2+A2P3=0.1001+0.010.001=0.10011A3=A2p3=0.010.01=0.00010.10011,0.10101第四个符号S4:C4=C3+A3P4=0.10011+0.00010.111=0.1010011A4=A3p4=0.00010.001=0.00000010.1010011,0.10101)第第6 6章章 视频压缩技术视频压缩技术 3.游程编码游程编码(RLC,RunLengthCoding)是一种十分简单的压缩方法,它将数据流中连续出现的字符用单一的记号来表示。例如,字符串531000000

20、0000110000000012000000000000可以压缩为5310-10110-08120-12,其中,“-”后面两个数字是“-”前面数字的连续个数。游程编码的压缩率不高,但编码、解码的速度快,仍被得到广泛的应用,特别是在变换编码后再进行游程编码,有很好的效果。第第6 6章章 视频压缩技术视频压缩技术 6.1.5预测编码和变换编码1.DPCM原理基于图像的统计特性进行数据压缩的基本方法就是预测编码。它是利用图像信号的空间或时间相关性,用已传输的像素对当前的像素进行预测,然后对预测值与真实值的差预测误差进行编码处理和传输。目前用得较多的是线性预测方法,全称为差值脉冲编码调制(DPCM,D

21、ifferentialPulseCodeModulation),简称为DPCM。第第6 6章章 视频压缩技术视频压缩技术 利用帧内相关性(像素间、行间的相关)的DPCM称为帧内预测编码。如果对亮度信号和两个色差信号分别进行DPCM编码,对亮度信号采用较高的取样率和较多位数编码,对色差信号用较低的取样率和较少位数编码,构成时分复合信号后再进行DPCM编码,这样做使总码率更低。第第6 6章章 视频压缩技术视频压缩技术 利用帧间相关性(邻近帧的时间相关性)的DPCM被称为帧间预测编码,因帧间相关性大于帧内相关性,其编码效率更高。若把这两种DPCM组合起来,再配上变字长编码技术,能取得较好的压缩效果。

22、DPCM是图像编码技术中研究得最早,且应用最广的一种方法,它的一个重要的特点是算法简单,易于硬件实现。图6-4(a)是它的示意图,编码单元主要包括线性预测器和量化器两部分。第第6 6章章 视频压缩技术视频压缩技术 编码器的输出不是图像像素的样值f(m,n),而是该样值与预测值g(m,n)之间的差值,即预测误差e(m,n)的量化值E(m,n)。根据图像信号统计特性的分析,给出一组恰当的预测系数,使预测误差主要分布在“0”附近,经非均匀量化,采用较少的量化分层,图像数据得到压缩。而量化噪声又不易被人眼所觉察,图像的主观质量并不明显下降。图6-4(b)是DPCM解码器,其原理和编码器刚好相反。第第6

23、 6章章 视频压缩技术视频压缩技术 图6-4DPCM原理(a)DPCM编码器;(b)DPCM解码器第第6 6章章 视频压缩技术视频压缩技术 DPCM编码性能主要取决于预测器的设计,预测器设计要确定预测器的阶数N以及各预测系数。图6-5是一个4阶预测器的示意图,图6-5(a)表示预测器所用的输入像素和被预测像素之间的位置关系,图6-5(b)表示预测器的结构。第第6 6章章 视频压缩技术视频压缩技术 图6-5四阶预测器(a)输入像素和预测像素;(b)预测器构成第第6 6章章 视频压缩技术视频压缩技术 2.变换编码原理图像变换编码是将空间域里描述的图像,经过某种变换(如傅立叶变换、离散余弦变换、沃尔

24、什变换等)在变换域中进行描述。这样可以将图像能量在空间域的分散分布变为在变换域的相对集中分布,便于用“Z”(zig-zag)字形扫描、自适应量化、变长编码等进一步处理,完成对图像信息的有效压缩。第第6 6章章 视频压缩技术视频压缩技术 先从一个实例来看一个域的数据变换到另一个域后其分布是如何改变的。以12像素构成的子图像,即相邻两个像素组成的子图像为例,每个像素3比特编码,取07共8个灰度级,两个像素有64种可能的灰度组合,由图6-6(a)中的64个坐标点表示。一般图像相邻像素之间存在着很强的相关性,绝大多数的子图像中相邻两像素灰度级相等或很接近,也就是说在x1=x2直线附近出现的概率大,如图

25、6-6(a)中的阴影区所示。第第6 6章章 视频压缩技术视频压缩技术 现在将坐标系逆时针旋转45,如图6-6(b)所示。在新的坐标系y1、y2中,概率大的子图像区位于y1轴附近。表明变量y1、y2之间的联系比变量x1、x2之间的联系在统计上更加独立,方差也重新分布。在原来坐标系中子图像的两个像素具有较大的相关性,能量的分布也比较分散,第第6 6章章 视频压缩技术视频压缩技术 两者具有大致相同的方差,而在变换后的坐标系中,子图像的两个像素之间的相关性大大减弱,能量分布向y1轴集中,y1的方差也远大于y2,这种变换后坐标轴上方差不均匀分布正是正交变换编码能够实现图像数据压缩的理论根据。若按照人的视

26、觉特性,只保留方差较大的那些变换系数分量,就可以获得更大的数据压缩比,这就是视觉心理编码的方法。第第6 6章章 视频压缩技术视频压缩技术 图6-6变换编码的物理意义(a)子图像在阴影区的概率较大;(b)旋转变换后第第6 6章章 视频压缩技术视频压缩技术 把一个nn像素的子图像看成n2维坐标系中的一个坐标点,在n2维坐标系中每一个坐标点对应于n2个像素。这个坐标点各维的数值是其对应的n2个像素的灰度组合。图像在n2维变换域中,相关性大大下降。因此用变换后的系数进行编码,比直接用图像数据编码能获得更大的数据压缩。第第6 6章章 视频压缩技术视频压缩技术 变换编码将被处理数据按照某种变换规则映射到另

27、一个域中去处理,图像编码采用二维正交变换的方式,若将整个图像作为一个二维矩阵,变换编码的计算量太大。所以将一幅图像分成一个个小图像块,通常是88或1616小方块,每个图像块可以看成为一个二维数据矩阵,变换编码以这些小图像块为单位进行,变换编码把统计上密切相关的像素构成的矩阵通过线性正交变换,变成统计上较为相互独立,甚至完全独立的变换系数所构成的矩阵。第第6 6章章 视频压缩技术视频压缩技术 信息论的研究表明,变换前后图像的信息量并无损失,可以通过反变换得到原来的图像值。统计分析表明,正交变换后,数据的分布向新坐标系中的少数坐标集中,集中于少数的直流或低频分量的坐标点。正交变换并不压缩数据量,但

28、它去除了大部分相关性,数据分布相对集中,可以依据人的视觉特性,对变换系数进行量化,允许引入一定量的误差,只要它们在重建图像中造成的图像失真不明显,或者能达到所要求的观赏质量就行。量化可以增加许多不用编码的0系数,然后再对量化后的系数施行变长编码。第第6 6章章 视频压缩技术视频压缩技术 3.离散余弦变换(DCT)在常用的正交变换中,DCT(DiscreteCosineTransform)变换的性能接近最佳,是一种准最佳变换。DCT变换矩阵与图像内容无关,是因为它构造成对称的数据序列,避免了子图像轮廓处的跳跃和不连续现象。DCT变换也有快速算法(FDCT),在图像编码的应用中,大都采用二维DCT

29、变换。第第6 6章章 视频压缩技术视频压缩技术 对于一般图像,在二维DCT的变换域中,幅值较大的系数集中在低频域,图6-7是一幅图像上的两个88像素矩阵及其二维DCT系数矩阵。图6-7(a)是背景区域的一小块图像,它的系数矩阵左上角的50为DCT系数的直流分量,它标志着该像素块的亮度平均值,其余系数皆为零,说明在变换域中系数的分布是相当集中的。图6-7(b)为细节较多的区域里的一小块图像,其系数的分布集中的程度要差一些。第第6 6章章 视频压缩技术视频压缩技术 图6-7图像块的DCT变换(a)背景部分图像块的DCT;(b)细节部分图像块的DCT第第6 6章章 视频压缩技术视频压缩技术 图6-8

30、Z字形扫描第第6 6章章 视频压缩技术视频压缩技术 对自然景物图像的统计表明,DCT系数矩阵的能量集中在反映水平和垂直低频分量的左上角。量化以后,DCT系数矩阵变得稀疏,位于矩阵右下角的高频分量系数大部分被量化为零。游程编码的思想是,用适当的扫描方式将已量化的二维DCT系数矩阵变换为一维序列,所用的扫描方式应使序列中连零的数目尽量多,或者说使连零的游程尽量长,对游程的长度进行游程编码(RLC,RunLengthCoding)以替代逐个地传送这些零值,就能进一步实现数据压缩。常用的Z(zig-zag)字形扫描如图6-8所示。第第6 6章章 视频压缩技术视频压缩技术 游程编码的方法是将扫描得到的一

31、维序列转化为一个由二元数组(run,level)组成的数组序列,其中run表示连零的长度,level表示这串连零之后出现的一个非零值。当剩下的所有系数都为零时,用一个符号EoB(EndofBlock)来表示。第第6 6章章 视频压缩技术视频压缩技术 4.混合编码混合编码是近年来广泛采用的方法,这种方法充分利用各种单一压缩方法的长处,以期在压缩比和效率之间取得最佳的平衡。如广泛流行的JPEG和MPEG压缩方法都是典型的混合编码方案。第第6 6章章 视频压缩技术视频压缩技术 6.2 静止图像压缩静止图像压缩 静止图像是指内容不变的图像,也可能是不活动场景图像或活动场景图像在某一瞬时的“冻结”图像。

32、静止图像编码是指对单幅图像的编码。静止图像用于传送文件、模型、图片和现场的实况监视图像。实况监视每隔一定时间间隔更换一幅新的图像,可以不连续地看到现场的情况,是一种准实时的监视。第第6 6章章 视频压缩技术视频压缩技术 静止图像编码有以下要求:(1)清晰度静止图像中的细节容易被观察到,要求有更高的清晰度。(2)逐渐浮现的显示方式在窄带传输时为了减少等待时间,要求编码能提供逐渐浮现的显示方式,即先传模糊的整幅图像,再逐渐变清晰。(3)抗干扰一幅图像的传输时间较长,各种干扰噪声显示时间较长,影响观看,要求编码与调制方式都有较强的抗干扰能力。第第6 6章章 视频压缩技术视频压缩技术 图6-9是静止图

33、像编码传输系统示意图。摄像机摄取的全电视信号,经数据采集卡捕获一帧图像,数字化后存放在帧存储器中。也可用数字摄像机直接得到数字图像。编码器对存放在帧存储器中数字图像进行压缩编码,因时间充裕可采用较复杂的算法提高压缩比,保持较高的清晰度。经调制后送到信道中传输。接收的过程则相反,信号经解调、解码后送帧存储器,然后以一定的方式读出,经DA变换后在显示屏上显示,或被拷贝下来。第第6 6章章 视频压缩技术视频压缩技术 图6-9静止图像数字传输系统第第6 6章章 视频压缩技术视频压缩技术 静止图像的主要编码方法是DPCM和变换编码,由于小波变换编码在静止图像的压缩中取得了重大进展,在新标准JPEG200

34、0和MPEG-4中均采用小波变换编码。第第6 6章章 视频压缩技术视频压缩技术 6.2.1JPEG标准JPEG是国际标准化组织(ISO,InternationalOrganizationforStandardization)国际电工技术委员会(IEC,InternationalElectrotechnicalCommission)和ITU-T的联合图片专家小组(JointPhotographicExpertsGroup)的缩写。1991年3月JPEG建议(ISOIEC10918号标准)“多灰度静止图像的数字压缩编码(通常简称为JPEG标准)”正式通过,这是一个适用于彩色和单色多灰度或连续色调静

35、止数字图像的压缩标准,包括无损压缩及基于离散余弦变换和霍夫曼编码的有损压缩两个部分。基本JPEG算法操作可分成6个步骤,如图6-10所示。第第6 6章章 视频压缩技术视频压缩技术 图6-10JPEG算法步骤第第6 6章章 视频压缩技术视频压缩技术 1.彩色坐标转换彩色坐标转换是要去掉数据冗余量,不属于JPEG算法,JPEG是独立于彩色坐标的。压缩可采用不同坐标(如RGB、YUV、YIQ等)的图像数据。第第6 6章章 视频压缩技术视频压缩技术 2.离散余弦变换JPEG采用88子块的二维离散余弦变换算法。在编码器的输入端,把原始图像(U、V的像素是Y的一半)顺序地分割成一系列88的子块。在88图像

36、块中,像素值变化缓慢,具有较低的空间频率。进行二维88离散余弦变换可以将图像块的能量集中在极少数系数上,DCT的(0,0)元素是块的平均值,其他元素表明在每个空间频率下的谱能为多少。一般地,离原点(0,0)越远,元素衰减得越快。第第6 6章章 视频压缩技术视频压缩技术 3.量化为了达到压缩数据的目的,对DCT系数需作量化处理。量化的作用是在保持一定质量的前提下,丢弃图像中对视觉效果影响不大的信息。量化是多对一映射,是造成DCT编码信息损失的根源。JPEG标准中采用线性均匀量化器,量化过程为对64个DCT系数除以量化步长并四舍五入取整,量化步长由量化表决定。第第6 6章章 视频压缩技术视频压缩技

37、术 量化表元素因DCT系数位置和彩色分量的不同而取不同的值。量化表为88矩阵,与DCT变换系数一一对应。量化表一般由用户规定(JPGE标准中给出了参考值),可根据人类视觉系统和压缩图像类型的特点进行优化,并作为编码器的一个输入。量化表中元素为1255之间的任意整数,其值规定了所对应DCT系数的量化步长。DCT变换系数除以量化表中对应位置的量化步长并舍去小数部分后,多数变为零,从而达到了压缩的目的。表6-2和表6-3分别给出了JPEG标准所推荐的亮度量化表和色度量化表。第第6 6章章 视频压缩技术视频压缩技术 表6-2JPEG亮度量化步长第第6 6章章 视频压缩技术视频压缩技术 表6-3JPEG

38、色度量化步长第第6 6章章 视频压缩技术视频压缩技术 4.差分编码64个变换数经量化后,DCT的(0,0)元素是直流分量(DC系数),即空间域中64个图像采样值的均值,相邻88子块之间的DC系数一般有很强的相关性,变化应该较缓慢,JPEG标准对DC系数采用DPCM编码(差分编码)方法,即对相邻像素块之间的DC系数的差值进行编码能将它们中的大多数数值减小。第第6 6章章 视频压缩技术视频压缩技术 5.游程编码其余63个交流分量(AC系数)采用游程编码。如果从左到右,从上到下地扫描块,零元素不集中,因此采用从左上角开始沿对角线方向Z字形扫描。量化后的AC系数通常会有许多零值。6.熵编码为了进一步压

39、缩数据,对DC码和AC游程编码的码字再作统计特性的熵编码,JPEG标准建议采用霍夫曼编码和自适应二进制算术编码。第第6 6章章 视频压缩技术视频压缩技术 6.2.2JPEG2000标准JPEG2000是JPEG工作组制定的最新的静止图像压缩编码的国际标准,标准号为ISOIECl5444(ITU-TT.800),并于2000年底公布。JPEG2000主要由6个部分组成。第一部分为编码的核心部分,提供优秀的压缩性能和压缩灵活性,提供随机访问码流的机制;第第6 6章章 视频压缩技术视频压缩技术 第二部分为编码扩展;第三部分为MotionJPEG2000(MJP2000);第四部分为一致性测试;第五部

40、分为参考软件;第六部分为复合图像文件格式。第第6 6章章 视频压缩技术视频压缩技术 1.JPEG2000采用了小波变换(DWT)JPEG基本算法中的基于子块的DCT被离散小波变换(DWT,DiscreteWaveletTransform)取代。DWT自身具有多分辨率图像表示性能,它可以在大范围去掉图像的相关性,将图像能量分布更好地集中,使压缩效率得到提高。第第6 6章章 视频压缩技术视频压缩技术 一个图像可以被分成若干大小相等的片(tile),片的具体尺寸可以由用户根据应用需要来决定,片包括所有的图像分量,假设图像有3个分量(YUV)且图像被分成4个片,实际上指的是对应的4个Y片,4个U片和4

41、个V片,即每个片由3个分量片组成。各个分量片独立编、解码,可以从码流中单独提取某个或某些片,解码后重建图像。这种片划分和片独立编码的机制有利于从码流中提取和解码某个图像区域。第第6 6章章 视频压缩技术视频压缩技术 图6-11DWT对静止图像进行三级分解(a)一级分解示意图;(b)二级分解示意图;(b)(c)三级分解示意图第第6 6章章 视频压缩技术视频压缩技术 对分量片做不同级别的小波变换,小波变换的作用是对图像进行多分辨率分解,即把原始图像分解成不同空间、不同频率的子图像,这些子图像实际上是由小波变换后产生的系数构成,即系数图像。对一个原始图像或分量片进行3级小波分解的例子如图6-11所示

42、,每一级分解都把图像分解成4个不同空间、不同频带的子图像(也称为子带图像或子带分量)。低频分量LL(包含图像的低频信息,即图像的主要特征,低频分量可再次分解);水平分量LH(包含较多的水平边缘信息);垂直分量HL(包含较多的垂直边缘信息);对角分量HH(包含水平和垂直边缘信息)。第第6 6章章 视频压缩技术视频压缩技术 从图6-11可以看出,分解级数越多,图像分辨率等级越多,每一级分解图像的分辨率降为前一级的一半。在解码端,如果只想得到低于原始图像分辨率图像,就只需对部分的子带图像(子带分量)进行解码。第第6 6章章 视频压缩技术视频压缩技术 小波变换本身并不具有数据压缩能力,变换前,原始图像

43、的数据量(像素值的个数)与变换后各系数的数据量(系数个数)相等,变换的意义在于使图像的能量分布(频域内的系数分布)发生了改变,图像的主要能量集中在低频区(LL区),而水平、垂直、对角线部分的高频能量较少。通过量化,把大量幅值较小系数抑制为零,从而压缩数据量,要进一步大幅度压缩数据量,还需进行合适的编码处理(如算术编码),用更少的比特表示那些量化后不为零的小波系数。第第6 6章章 视频压缩技术视频压缩技术 2.JPEG2000同时支持有损和无损压缩小波变换可以使用可逆的LeGall(5,3)滤波器,也可以使用不可逆的Daubechies(9,7)双正交滤波器。可逆滤波器支持无损编码,不可逆滤波器

44、不支持无损编码但能达到更高的压缩比。第第6 6章章 视频压缩技术视频压缩技术 3.JPEG2000支持RoI处理在处理图像时,往往对部分感兴趣区域(RoI,RegionofInterest)有较高的质量要求,希望是无损压缩。为了得到较高的压缩效率,把图像的其他部分看成是背景,进行压缩比较高的有损压缩。在传输图像码流时,RoI区域可先于图像的其他部分被传输,如果压缩码流被截取,则在一定程度上可保证RoI的质量。第第6 6章章 视频压缩技术视频压缩技术 JPEG2000系统为RoI区域产生一个RoI模板,用来标志RoI区域。选择适当的比例因子s,将位于RoI模板区域之外的背景量化系数的幅值除以2s

45、,得到的数值小于RoI模板中最小的量化系数幅值。这样处理后,位于RoI模板内的量化系数所处的位平面高于背景系数所处的位平面,在进行位平面算术编码的时候,先对RoI域中的量化系数编码,然后再对背景系数编码。因为RoI区域的位平面高于背景区域,RoI区域的压缩码流位于整个码流的前端,当码流被截断时RoI区域中的数据在一定程度上受到保护,保证了RoI的重构质量。第第6 6章章 视频压缩技术视频压缩技术 在解码器端,将解码后的量化系数与RoI阈值相比较,若小于RoI阈值,则判定是背景系数,对其进行反向比例放大,即乘以2s,进行恢复,得到重构时所需的小波量化系数。第第6 6章章 视频压缩技术视频压缩技术

46、 4.可随机获取部分压缩码流JPEG2000系统将码流分层组织,每一层含有一定的质量信息,在前面层的基础上改善图像质量。在网络上进行图像浏览时,可先传送第一层,给用户一个较粗的图像,然后再传送第二层,图像质量在第一层的基础上得到改善,这样一层一层地传输下去,可得到不同质量的重构图像。如果传输了所有的层,则可获得完整的图像压缩码流。JPEG2000由于采用了这种思想,使得压缩生成的码流具有质量可分级性和分辨率可分级性。第第6 6章章 视频压缩技术视频压缩技术 5.随机存取图像某个区域有时只需得到巨幅图像的部分区域,JPEC2000标准利用小波变换的局部特性,可识别部分图像区域在子带上的映射。每个

47、码块是独立进行编码的,通过选取含有此部分图像区域信息的码块压缩码流,进行解码,可以重构出所要的目标区域。RoI技术在很大程度上为实现随机存取码流提供了一种渠道。第第6 6章章 视频压缩技术视频压缩技术 6.抗误码性能在JPEG2000标准中,采取了一些措施来提高图像压缩码流的抗误码性能。将量化后的子带系数分成若干个小的编码单元码块,对每个码块进行独立的编解码。这样,当一个码块的位流发生比特错误时,只会把错误引起的影响限制在本码块中。压缩码流数据采用了称为包(packet)的结构单元,每个包的数据前面含有再同步信息,允许发生错误后重新恢复同步。第第6 6章章 视频压缩技术视频压缩技术 7.视觉频

48、率加权在JPEG2000中,可选择使用对不同空间频率有不同敏感度的视觉系统模型。这一模型用对比度敏感函数(CSF,ContrastSensitivityFunction)来衡量。由于CSF函数是由变换系数的视觉频率来决定的,因此,给小波变换后的每个子带,分配一个CSF值。CSF值的确定依据观察重构图像的视觉条件而定,有两种选取办法:固定的视觉加权编码和视觉累进加权编码。第第6 6章章 视频压缩技术视频压缩技术 固定的视觉加权仅由视觉条件决定。对分层组织码流,由于码流可以被截断,在不同的截断处,有不同的质量,因此进行观察的视觉条件是不同的。比如,对于低比特率的情况,缺少细节,压缩图像质量差,适合

49、进行远距离观察;随着比特数的增加,细节越来越多,压缩图像质量逐渐变好,则适合近距离观测。因此,CSF值在不同的截断处应有不同的值,这便是视觉累进加权编码。在进行视觉累进加权编码时,不需改变系数值或者量化步长,而是根据视觉权值,改变失真矩阵,计算码块对每个层的贡献,通过改变码块编码通道在分层组织位流中的顺序来实现。第第6 6章章 视频压缩技术视频压缩技术 JPEG2000具有的多种特点使得它具有广泛的应用前景,由于采用小波变换和最新的压缩算法,因此能够获得较好的压缩比,且对压缩码流可进行灵活处理,如随机获取部分压缩码流、累进式传输、实现RoI以及压缩码流具有较强的容错性能等。这些特点可应用于因特

50、网、移动通信、打印、扫描、数字摄像、遥感、传真、医疗、数字图书馆以及电子商务等方面的图像压缩。第第6 6章章 视频压缩技术视频压缩技术 身份确认方面,将身份证头像照片用高清晰度的数字相机摄制,经JPEG2000压缩存储在数据库中。在需要进行身份验证的场合,验证终端可以根据证件代号通过因特网从数据库里直接获取压缩的图像数据,在本地迅速恢复出大幅高清晰的头像照片。第第6 6章章 视频压缩技术视频压缩技术 在医疗方面,JPEG2000编码器对医生指定的病变部位予以无损压缩,而对图像中不影响诊断结果的其他部分采用高达100倍的压缩率予以视觉可接收压缩。压缩之后的图像完全保存了疾病特征,而数据量非常小。

51、医生可以把它迅速发送到千里之外的医学专家那里,并以最快的速度得到权威的确诊。第第6 6章章 视频压缩技术视频压缩技术 许多著名的图形图像公司如Corel、Pegasus等都开始在新开发的图像工具软件中集成JPEG2000图像压缩技术,Microsoft、Netscape等浏览器领域的公司也开始将JPEG2000新技术集成到下一个版本的浏览器中。JPEG2000会在21世纪图像压缩领域发挥重要作用。第第6 6章章 视频压缩技术视频压缩技术 6.2.3数字照相机数字照相机也称数码相机,是利用静止图像压缩的典型例子,数字照相机是光学技术、微电子技术与数字信号处理技术相结合的产物。其基本原理是利用普通

52、照相机的光学系统,把被摄图像投射到图像传感器上,传感器把光信号转化成电信号,再经过模数(AD)转换、数字图像处理和压缩,最终以数字形式存储到磁盘、可移动快闪存储卡等数字存储器中。图6-12是数字照相机结构示意图。第第6 6章章 视频压缩技术视频压缩技术 图6-12数字照相机结构示意图第第6 6章章 视频压缩技术视频压缩技术 1.数码相机的优点(1)瞬时显示摄影效果数码相机的液晶显示屏在拍摄照片后立即显示拍摄的效果,对不满意图像可以立即删去重拍。(2)更宽的曝光控制范围数码相机的成像器件光电灵敏度很高,在低照度条件下也能够较好地曝光。用MOS开关方式控制光电器件的感光时间,控制最小时间可达微秒级

53、,在环境照度很高时,数码相机可以得到合适曝光的图像。第第6 6章章 视频压缩技术视频压缩技术 (3)图像逼真数码相机的数字图像可直接输入计算机,用制造厂商提供的处理软件进行特技处理。也可用Photoshop那样的通用软件处理。对于在拍摄过程中出现的诸如色温、清晰度、像差、曝光量等技术缺陷,可以通过后处理得到一定程度的修正,能大大提高所拍摄图像的质量。特别是对于光学像差中的畸变,数字图像已经有了很好的补偿修正手段。也可以对图像进行任意的修改、编辑、合成、分解和景物置换等处理。第第6 6章章 视频压缩技术视频压缩技术 (4)图像通信便捷数码相机以数字信号的形式记录影像,以计算机图像文件格式保存图像

54、。这样既可以利用最先进的通信手段快速传输,也可以通过Email和网页在Internet上传输,更可以通过卫星地面工作站做超远距离的图像传输。第第6 6章章 视频压缩技术视频压缩技术 (5)准确复制和长期保存由数码相机得到的数字影像在复制过程中不存在任何信号损失。以计算机文件形式保存的数字图像可以永久保存在硬盘或光盘中。(6)设备简单处理速度快数码成像系统只需要数码相机和通用计算机及其输出设备即可完成整个图像制作过程,设备简单,处理速度快。第第6 6章章 视频压缩技术视频压缩技术 2.数码相机技术指标(1)成像器件像素数成像器件的像素数对数码相机的图像质量起决定性的作用。目前一般数码相机CCD像

55、素数在300万以上。数码相机的成像器件像素数在很大程度上决定了相机图像的最高分辨率。分辨率用于评价数码图像的质量,数码相机摄取数码照片的分辨率是可选择的。数码相机的像素指标只有一个,而所拍摄的数字图像的分辨率指标却可以有许多个,分辨率越高的照片要求有越大的存储空间存储数据。第第6 6章章 视频压缩技术视频压缩技术 (2)AD转换精度评价数码照片的图像质量除了分辨率外,还有照片色彩的编码位数。编码位数决定了在AD转换过程中的精确程度,一般来说,24(38)位的色彩已经相当丰富,能适应绝大部分的拍摄要求。第第6 6章章 视频压缩技术视频压缩技术 (3)光电传感器电荷耦合器件(CCD)传感器和互补金

56、属氧化物半导体(CMOS)传感器是两类主要的图像传感器。CCD数码相机经历了较长的发展时期,目前在成像质量、分辨率上优于CMOS,而CMOS数码相机在产品价格,耗电量等方面又有独特的优势。目前高档专业型数码相机多为CCD型,廉价普及型数码相机多为CMOS型。第第6 6章章 视频压缩技术视频压缩技术 近年来CMOS成像器件发展很快,已经出现百万像素的CMOS器件,CMOS器件的最大优点是把信号放大、模数转换、数字图像处理等电路集成到一块芯片上,形成了片上成像系统(CameraonChip),这对数码相机的小型化、微型化具有重要意义。CMOS成像器件通过开关电路进行像素信号传输,使用者可以控制开关

57、电路有选择地获取图像信息,形成智能像素器件(ActivePixelSensor),该器件对于工业自动化控制,机器人视觉等领域中的成像系统具有重要的价值。第第6 6章章 视频压缩技术视频压缩技术 (4)DSP能力DSP能力较强的相机能够较高水平地完成诸如黑色补偿、光照度补偿、缺陷像素修补、滤色器补偿插值、校正、白平衡、假彩色抑制等操作,补偿了许多由于硬件所造成的图像缺陷,图像质量达到了较为完善的程度。越是高档的数码相机,DSP的处理能力越强。一些数码相机还能显示选单,可以设定一些DSP图像处理中的参数,从而获得某些特殊效果。第第6 6章章 视频压缩技术视频压缩技术 DSP还能从图像中提取曝光量信

58、息和对焦信息,以控制镜头和快门,使相机处在最佳工作状态。DSP还能完成图像压缩的任务,好的图像压缩算法可以在压缩图像存储量的同时很好地保持图像细节的信息,解压缩后显示的图像与原图像比较看不出任何区别。高的压缩比可以节省数码相机的存储空间,在有限的空间中存储更多高质量的图片。快的压缩速度可以在相机完成一次曝光以后迅速回到待机状态,提高相机的连拍速度。第第6 6章章 视频压缩技术视频压缩技术 (5)取景器数码相机的取景方式有光学取景和LCD取景。光学取景中有平视取景和通过镜头(TTL,ThroughTheLens)取景之分。平视取景结构简单,但由于取景器光轴与镜头光轴不重合,眼睛看到的景象与实际拍

59、摄景象存在着位置误差和尺寸误差,近距离拍摄时,误差更明显。TTL取景的取景光轴和成像光轴是重合的,取景误差较小,取景范围可达到实拍画面的95%。专业级的数码相机采用TTL取景方式。第第6 6章章 视频压缩技术视频压缩技术 液晶显示(LCD,LiquidCrystalDisplay)取景是指利用液晶显示屏显示DSP预处理后的图像。LCD取景所见即所得,取景视场精度高。但LCD取景显示的像素要远远低于CCDCMOS得到的像素。LCD取景目前还存在跟踪速度不快、对比度差、视觉失真、背景光源影响、视角小等缺点。大部分数码相机都带有一个LCD取景器与平视取景器互为补充。第第6 6章章 视频压缩技术视频压

60、缩技术 (6)图像存储低档数码相机以内装存储器为主,当存储器存满后,必须暂停拍摄,要等到存储的图像数据输出之后才能继续拍摄。对于存储卡型的照相机,只要有备用的存储卡,就可以像换胶卷一样换存储卡。PC卡是用得最多的可移动式存储器,能插入一个PCMCIA插槽。有的数码相机PC卡是惟一的存储器,也有的数码相机有内部存储器,仍支持PC卡作为扩展存储器,存在PC卡中的数字图像可以通过PC卡读取器输入计算机。第第6 6章章 视频压缩技术视频压缩技术 PC卡的优点是可以大量存储照片。可移动式存储卡还有闪烁存储卡(FlashCard),也采用PC卡标准,可直接插入便携式计算机的PC卡插口将信息输入,也可用PC

61、卡读取器输入计算机。CompactFlash存储卡采用标准ATAIDE接口,配有专门的PCMCIA转换卡,笔记本计算机的用户可直接在PCMCIA插槽上使用。第第6 6章章 视频压缩技术视频压缩技术 3.数字图像处理(DSP)DSP是数码相机的主要部件,所有功能都是由DSP来实现的。DSP控制着CCD、AD转换器件、LCD和控制面板。(1)暗电流补偿补偿的方法是在器件完全遮光的条件下先测出各像素的暗电流值,从拍摄后图像的像素值中减去相应的暗电流值。第第6 6章章 视频压缩技术视频压缩技术 (2)镜头光照度补偿由于镜头的渐晕效应,即使拍摄目标是一个受均匀光照的物面,成像器件受到的照度仍是不均匀的,

62、器件边缘所受的光照度较小,对于同一镜头,照度差是有固定规律的,通过DSP数字补偿,等效于成像器件得到均匀的照度。第第6 6章章 视频压缩技术视频压缩技术 (3)缺陷像素修补成像器件的几百万个像素中总有一定数量的疵点,在完全遮光条件下数码相机读取像素灰度值时,一些“亮点”就是疵点位置。通常用插值的方法来实现缺陷像素的修补,用周围像素的灰度值推算出缺陷像素的灰度值。第第6 6章章 视频压缩技术视频压缩技术 (4)彩色校正彩色校正就是通过调整三基色光的增益,使成像器件的光谱特性与显示或打印设备的光谱特性一致,使显示或打印图像的色彩更加完美。通常是通过一个变换矩阵来改变红、绿、蓝三基色光的增益,同时保

63、证白平衡。第第6 6章章 视频压缩技术视频压缩技术 (5)自动聚焦和自动曝光聚焦图像比未聚焦图像的轮廓更加分明,纹理细节更加清晰。聚焦图像的高频分量更大一些。用数字高通滤波获取不同焦距时输入图像的高频分量并进行比较,高频分量的最大值对应着最佳聚焦。为了简化计算,只对图像的一部分进行滤波处理就能达到同样的效果。第第6 6章章 视频压缩技术视频压缩技术 自动曝光以图像平均亮度为参考,调节光圈和改变图像传感器的曝光参数。为了防止亮的背景引起主要物体曝光不足,暗的背景又使主要物体曝光过度,根据主要物体一般位于照片中央这一特点,将摄取的图像分成中央和周边两部分,分别计算其亮度,并加权不同的经验值。第第6

64、 6章章 视频压缩技术视频压缩技术 (6)校正数字图像的显示和打印设备中,像素的灰度值与所显示图像中对应的亮度值呈非线性关系。通过校正,显示或打印的图像能够正确反映被摄景物的灰度值。(7)滤色器补偿插值光电器件是通过滤色器得到图像的三基色信息的,每个像素只得到了一种基色的信息,即R、 C、 B(或Cy、Mg、Ye、G)中的一种颜色。像素的其他颜色就必须由其周围像素的颜色信息插值得到。第第6 6章章 视频压缩技术视频压缩技术 (8)轮廓增强滤色器起了低通滤波的作用,图像的轮廓变得平滑。DSP增强图像的轮廓,而图像的噪声不能被放大。先找到灰度变化大的轮廓像素,计算轮廓像素与前一像素的Y分量差值,将

65、Y分量差值放大并叠加到原像素Y值上。噪声造成的假轮廓像素少、灰度变化小,要将差值低于设定阈值的假轮廓信号去掉以保证处理后图像的真实性。第第6 6章章 视频压缩技术视频压缩技术 (9)图像压缩数码相机的存储空间有限,获取的数字图像必须经过压缩,以前的数码相机采用JPEG标准,最新的数码相机则采用JPEG2000标准用小波变换进行压缩。第第6 6章章 视频压缩技术视频压缩技术 4.模式控制数 码 照 相 机 一 般 提 供 照 相 (Camera)、 显 示(Display)和计算机(Computer)三种模式。在照相模式时,系统实现拍摄、处理图像信息的功能;在显示模式时,可以观察已拍摄的照片,有

66、编辑功能可修改照片;在计算机模式时,可将数码相机的图像信息传送到计算机之中。第第6 6章章 视频压缩技术视频压缩技术 照相模式要实现曝光控制、自动对焦控制、闪光控制、数字图像的获取以及DSP处理等操作,有一套完善的控制流程。数码相机在接通电源后首先是对闪光灯系统的主电容进行充电。相机的各种拍摄方式、测光方式、对焦方式、分辨率、白平衡等参数可以进入设置选单进行修改。在待机状态时,光电传感器不断地输出图像,图像经DSP预处理后,作为曝光和对焦的依据,对镜头进行曝光和对焦的粗调。同时DSP在预处理后将低分辨率的画面实时地输出到LCD显示屏上,供摄影者取景。第第6 6章章 视频压缩技术视频压缩技术 处

67、于待机状态的数码相机接到拍摄命令后,进入拍摄状态,相机迅速对曝光和聚焦进行细调,并锁定相应的参数。若景物照度不够,打开防红眼灯照明;在快门动作的瞬间进行闪光。当相机处于自拍状态时,快门动作启动自拍延时,通常为812s,在延时阶段给出LED闪烁或蜂鸣声提示。在完成一次曝光后,DSP进一步处理所获得的数字图像,压缩图像信息,将刚拍摄的图像显示在LCD上,由摄影者来决定取舍。当摄影者确认之后,将图像存储在相机的存储体中,相机又回到了待机状态。第第6 6章章 视频压缩技术视频压缩技术 6.3 活动图像编码活动图像编码 6.3.1概述活动图像信号,就是电视信号,数字化后的电视信号称为数字电视信号。活动图

68、像的编码要求实时和高效。图6-13为活动图像编码传输系统的方框图。系统中有两个传输缓冲存储器,随着图像内容的变化,活动图像编码输出是不均匀码流,与信道的传输特性不相适应,利用缓冲存储器来存储数据流,保证数据能不间断地匀速输出。第第6 6章章 视频压缩技术视频压缩技术 图6-13活动图像数字传输系统第第6 6章章 视频压缩技术视频压缩技术 不同应用场合对图像质量要求是不同的,数字电视要播出新闻、体育比赛、文艺节目,对图像的质量要求很高;会议电视画面中人数少、运动少、背景不变,对图像质量的要求降低;而电视电话图像是单人头像,只有脸部表情的变化,对图像质量的要求最低。通常把图像编码分为下面几个应用层

69、次:第第6 6章章 视频压缩技术视频压缩技术 (1)标准数字电视图像分辨率为720576,采用ISOMPEG-2标准,约8Mb/s的码率可以达到演播室级的图像质量要求。地面广播时,采用现代数字调制技术,可在一路8MHz信道传送4路标准数字电视。(2)会议电视:图像分辨率为352288,采用ITU-TH.261建议,码率为P64kbs(P=130),属中、低速码率的图像压缩。一般认为,码率为384kbs(P=6)以上时,图像质量才比较满意。第第6 6章章 视频压缩技术视频压缩技术 (3)数字影碟机等图像分辨率为352288,国际标准为MPEG-1,码率为1.5Mbs,其中约1.2Mbs用于图像,

70、其余用于声音和同步。可达到VHS录像带图像质量。(4)可视电话图像分辨率为176144,采用ITU-TH263建议,码率为64kbs以下,经调制解调后,能在现有的模拟电话线上传送活动的彩色电视电话图像,因此也称为极低码率的图像编码。第第6 6章章 视频压缩技术视频压缩技术 (5)高清晰度电视图像分辨率可高达19201080,具有两倍于现有标准的水平和垂直清晰度,采用ISOMPEG-2标准,码率约为20Mbs。活动图像的压缩编码利用每幅图像内部的相关性进行帧内压缩编码,有变换编码和预测编码两种基本类型。还利用相邻帧之间的相关性进行帧间压缩编码,主要是运动补偿预测和混合编码。混合编码是变换编码和预

71、测编码相结合的编码方法。H.261、H.263、MPEG-1、MPEG-2和MPEG-4标准都采用了混合编码方案。第第6 6章章 视频压缩技术视频压缩技术 6.3.2帧间预测编码帧间预测将画面分为三种区域。(1)背景区相邻的帧背景区的绝大部分数据相同,帧间相关性很强。(2)运动物体区若将物体运动近似看作简单的平移,则相邻帧的运动区的数据也基本相同。假如能采用某种位移估值方法对位移量进行“运动补偿”,那么两帧的运动区之间的相关性也是很强的。第第6 6章章 视频压缩技术视频压缩技术 (3)暴露区是指物体运动后所暴露出的曾被物体遮盖住的区域。如果存储器将暴露区的数据暂存,则再次遮盖后暴露出来的数据与

72、存储的数据相同。若画面从一个场景切换到另一场景时,就没有帧间相关性了。第第6 6章章 视频压缩技术视频压缩技术 人眼对静止图像分辨力较高,在传输静止图像或图像的静止部分时,则要有较高的分辨率。人眼对于图像中运动物体的分辨率随着物体运动速率的增大而降低,摄像器件和显示器件也有一定的积分模糊效应。在传输图像中的运动部分时,可以降低这部分图像的分辨率,物体的运动速度越高,可用越低的分辨率进行传输,这种方法就叫做空间分辨率和时间分辨率的交换。第第6 6章章 视频压缩技术视频压缩技术 对于变化缓慢的图像,帧间相关性强,宜采用帧间预测。当景物的运动增大时,帧间相关性减弱,而由于摄像机的“积分效应”,图像的

73、高频成分减弱,帧内相关性反而有所增加,应采用帧内编码,编码器应进行帧内帧间自适应编码。对于运动的物体,估计出物体在相邻帧内的相对位移,用上一帧中物体的图像对当前帧的物体进行预测,将预测的差值部分编码传输,就可以压缩这部分图像的码率。这种考虑了对应区域的位移或运动的预测方式就称为运动补偿预测编码。帧间预测是运动补偿预测在运动矢量为零时的特殊情况。第第6 6章章 视频压缩技术视频压缩技术 运动补偿帧间预测编码包括以下四个部分:(1)物体的划分划分静止区域和运动区域;(2)运动估计对每一个运动物体进行位移估计;(3)运动补偿由位移的估值建立同一运动物体在不同帧的空间位置对应关系,从而建立预测关系;(

74、4)补偿后的预测信息编码对运动物体补偿后的位移帧差信号(DFD)以及运动矢量等进行编码传输。第第6 6章章 视频压缩技术视频压缩技术 混合编码是将变换编码和预测编码组合在一起,通常用DCT等变换进行空间冗余度的压缩,用帧间预测或运动补偿预测进行时间冗余度的压缩,以达到对活动图像的更高的压缩效率。通常把变换部分DCT放在预测环内,见图6-16,预测环本身工作在图像域内,便于使用性能优良、带有运动补偿的帧间预测。这种带有运动补偿的帧间预测与DCT结合的方案压缩性能高、编码技术成熟,编码延迟较短,现已成为活动图像压缩的主流方案。第第6 6章章 视频压缩技术视频压缩技术 6.3.3ITU-TH.261

75、在视频压缩的国际标准中,H.261建议具有特别的意义。它综合了图像编码40多年的研究成果,首次采用了DCT加帧间运动补偿预测的混合编码模式。它规范的数据格式、编码器模块结构、编码输出码流的层次结构、开放的编码控制与实现策略等技术,对后来制定的视频编码标准产生了深远的影响。H.261建议为不同生产厂的设备互通创造了条件,与之相对应的H.320会议电视系统在20世纪90年代得到了广泛应用,其结果又进一步推动了视频通信的标准化步伐。在H.320之后,ITU又相继推出了一系列应用于不同场合的视频通信国际标准:第第6 6章章 视频压缩技术视频压缩技术 H.321建议,用于ATM网络;H.322建议,用于

76、有质量保证的局域网;H.323建议,用于IP网络;H.324建议,用于PSTN网络;H.263建议,用于极低码率(小于64kbs)的场合,压缩效率约提高3dB。他们结合ITU-T.120多媒体会议数据传送协议,构成了功能强大的多媒体通信系统。第第6 6章章 视频压缩技术视频压缩技术 1990年7月ITU-T通过H.261建议“p64kb/s视听业务的视频编解码器”,其中p=130。该标准的应用目标是会议电视和可视电话,通常p=1,2时适用于可视电话,p在6以上时适用于会议电视业务。第第6 6章章 视频压缩技术视频压缩技术 1.公共中间格式为了便于不同制式彩色电视信号的互连,ITU提出先把不同制

77、式彩色电视信号都转换成公共中间格式(CIF,CommonIntermediateFormat)。亮度信号按每行352个像素,每帧288行进行正交抽样,抽样频率为6.75MHz;色差信号按每行176个像素,每帧144行进行正交抽样,抽样频率为3.375MHz;29.97帧/s逐行扫描。QCIF(QuarterCIF)格式亮度和色度样点数在水平和垂直方向都减半,亮度信号为176144,色差信号为8872,还是以29.97帧/s逐行扫描。第第6 6章章 视频压缩技术视频压缩技术 每帧图像(Picture)分为12个块组(GoB,GroupofBlocks),每个GoB包括33个宏块(MB,Macro

78、Block),每个宏块有6个块(B,Block),其中4个亮度块和2个色度块,块由88像素数据(变换系数TC)组成,像素是CIF格式中最基本的编码单位。CIF格式图像层次结构如图6-14所示。第第6 6章章 视频压缩技术视频压缩技术 图6-14CIF格式图像层次结构第第6 6章章 视频压缩技术视频压缩技术 2.数据结构CIF和QCIF的数据结构分为四个层次。(1)图像层由图像头和块组数据组成,图像头由一个20比特的图像起始码、视频格式、时间参数(帧数)等标志信息组成。(2)块组层由块组头和宏块数据组成。块组头由16比特的块组起始码、块组编号、量化步长等组成。第第6 6章章 视频压缩技术视频压缩

79、技术 (3)宏块层由宏块头和块数据组成。宏块头由宏块地址、宏块类型、量化步长等组成。(4)块层由变换系数(TC)和块结束符(EoB)等组成。图6-15是H.261数据结构示意图。第第6 6章章 视频压缩技术视频压缩技术 图6-15H.261数据结构示意图第第6 6章章 视频压缩技术视频压缩技术 3.编码器框图编码器框图如图6-16所示,两个双向选择开关由编码控制器CC控制,当它们同时接到上边时,编码器工作在帧内编码模式,输入信号直接进行DCT变换,经过量化处理后再进行变字长编码VLC,得到最后的编码输出。当双向开关同时接到下方时,第第6 6章章 视频压缩技术视频压缩技术 编码器利用存储在帧存储

80、器FM中的上一帧图像进行帧间预测,将输入信号与预测信号相减后,对预测误差进行DCT变换,经过量化处理后再进行变字长编码VLC,得到最后的编码输出。此时,编码器工作在帧间编码模式,是一个帧间预测与DCT组成的混合编码器。根据应用的需要,还可以加入运动估计和补偿处理MEP,来改善帧间预测的效果。为了使解码器能正确地解码,编码器的工作状态必须及时通知解码端,为此每个编码模式和控制参数等辅助信息也要进行编码传输。第第6 6章章 视频压缩技术视频压缩技术 图6-16H.261编码器原理框图第第6 6章章 视频压缩技术视频压缩技术 H.261采用的是“混合编码”法, 即帧间预测(DPCM)与帧内变换(2D

81、-DCT)相结合。若前后两帧很相似,则编码器进行帧间预测,然后对所得的帧间预测误差进行二维离散余弦变换(2D-DCT);若前后两帧图像不很相似,则对该当前帧图像进行帧内DCT编码,即把该帧图像中每一个88块进行DCT,再对所得的DCT系数进行量化,最后把所得的量化值进行二维变长编码。第第6 6章章 视频压缩技术视频压缩技术 为了减少预测误差,提高预测精度,可辅以运动估计、运动补偿,从而达到提高压缩比、改进图像质量的目的。在H.261中运动估计是可选项,但接收端运动补偿是必备项。当接收机接收无运动估计的编码图像时,则自动将运动矢量置零。第第6 6章章 视频压缩技术视频压缩技术 4.BCH纠错为了

82、提高信道的抗误码能力,H.261采用了一种叫BCH(511,493)的纠错编码。该纠错编码发送的比特流分成长度为493比特的数据组,对每一组数据进行某种逻辑运算,结果所得18比特校验数据放在493比特视频数据的后面,共计511比特数据为一组到接收端。如果发生误码,在接收端用校验码经特定的运算查验出错码并纠正。这种BCH(511,493)纠错码可在493比特数据中自动纠正2比特错误。H.261中规定,编码器必须进行纠错编码,解码器可选用纠错解码。第第6 6章章 视频压缩技术视频压缩技术 5.编码控制编码中采用了变长编码技术,经压缩编码后的数据是速率不均匀的码流,为了以恒定速率在通信网中传送,要用

83、缓冲存储器进行数据的平滑。根据缓冲存储器当前已缓存的数据量,控制源编码器中量化器的量化步长等参数,从而得到恒定的速率。H.261中没有具体规定码流控制方法。为了防止帧间预测误差的累积,编码器中采用了一种强迫更新的方法,H.261中规定宏块至少每传送132次,就需要以帧内模式传送一次,但对具体方法未作规定。第第6 6章章 视频压缩技术视频压缩技术 6.3.4ITU-TH.263ITU-T于1995年8月公布了低于64kbs的窄带通信信道的视频编码建议,即H.263。该标准是H.261的重要发展,可用于可视电话中极低比特率的编解码器上。例如,可视电话信号经过H.263压缩再经V.34调制后可沿PS

84、TN传送(码流可以压缩到28.8kbs,其中视频为20kbs左右),被编码的信号格式可以是S-QCIF,彩色亚取样420,也可以是QCIF、CIF或更大的输入格式,帧频较低。该编码器提供了与H.261同样的质量,但是比特数减少了一半。第第6 6章章 视频压缩技术视频压缩技术 1.更丰富的图像格式H.263标准中不仅有H.261中的CIF和QCIF格式,还有sub-QCIF、4CIF和16CIF等格式,如表6-4所示。第第6 6章章 视频压缩技术视频压缩技术 表6-4H.263图像格式第第6 6章章 视频压缩技术视频压缩技术 2.两种运动估值块H.261建议中只对1616像素的宏块进行运动估计,

85、而H.263建议中不仅可以用1616像素的宏块为单位进行运动估计,还可以根据需要对88像素的子块进行运动估计,即每个宏块可使用4个运动矢量。3.更高效的运动矢量编码在H.261中,对运动矢量采用一维前值预测与VLC相结合的方法编码,在H.263中则采用更为复杂的二维预测与VLC相结合的编码。第第6 6章章 视频压缩技术视频压缩技术 4.半像素运动估计精度在H.261中,运动的估值精度为整数像素,范围为(-16,+15),而在H.263中采用半像素精度,范围为(-16.0,+15.5)。H.263中采用双线性内插来得到运动估计用的半精度像素的预测值,如图6-17所示。第第6 6章章 视频压缩技术

86、视频压缩技术 图6-17双线性内插预测半精度像素第第6 6章章 视频压缩技术视频压缩技术 5.增加高级选项除了半像素精度进行运动估计以外,H.263的基本编码方法与H.261相同,为了能适合极低码率的传输,H.263增加了4个编码的高级选项,进一步提高了编码效率,在极低码率下获得了较好的图像质量。(1)无限制的运动矢量模式当某一运动矢量所指向的参考像素超出编码图像区域时,就用其边缘的图像值代替“这个并不存在的像素”,这样做可有效改进边缘有运动物体的图像的质量。第第6 6章章 视频压缩技术视频压缩技术 (2)基于语法的算术编码(SAC)可变长编码、解码过程都用算术编码、解码过程取代,将显著降低所

87、需的码率。(3)高级预测模式对P帧的亮度分量采用所谓交叠块运动补偿(OBMC)方法,即某一个88子块的运动补偿由本块和周围4个块的运动矢量加权平均得到。对某些宏块(1616)用4个运动矢量,每个子块(88)都有一个运动矢量,用它们取代原来一个宏块的运动矢量。本模式减少了方块效应,明显改进了图像质量。第第6 6章章 视频压缩技术视频压缩技术 图6-18PB帧双向预测过程示意图第第6 6章章 视频压缩技术视频压缩技术 (4)PB帧模式PB帧名称来源于MPEG标准。一个PB帧包含一个P帧和一个B帧,P帧是由前一个P帧预测所得,B帧是由前一个P帧和本PB帧单元中的P帧进行双向预测编码得到,双向预测过程

88、如图6-根据不同的应用需要,ITU-T的 H.263工 作 组 制 定 了 新 的 版 本 , 例 如H.263+(1998年 )、 H.263+(2000年 )等 。 最 新 的H.263+,高级选项多达19项。第第6 6章章 视频压缩技术视频压缩技术 6.3.5MPEG-1标准ISOIEC的联合技术委员会自20世纪90年代以来先后颁布的一系列图像和视频编码的国际标准促进了多媒体与图像业务的发展。其中,MPEG-1建议用于VCD之类的视频家电设备和视频点播(VoD,VideoonDemand)系统;MPEG-2的主要应用范围是数字电视广播和DVD系统。ITU的H.320标准把数字视频引入到企

89、业、办公室,ISO的MPEG-1、2把数字视频引入到千家万户。第第6 6章章 视频压缩技术视频压缩技术 活动图像专家组(MPEG,MovingPicturesExpertsGroup)的正式名称是ISOIECJTC1SC29WG11。MPEG-1是MPEG工作组制定的第一个标准(ISOIEC11172),标题是:“信息技术具有1.5Mbs数据传输率的数字存储媒体活动图像及其伴音的编码”,内容包括系统、视频、音频、一致性、参考软件等5部分。第第6 6章章 视频压缩技术视频压缩技术 1.图像格式SIFMPEG-1处理逐行扫描的图像时,对隔行扫描的图像源应先转换为逐行扫描格式再编码;输入的视频信号必

90、须是数字化的一个亮度信号和两个色差信号(Y,CB,CR),要使码率为11.5Mbs,应该选择图像速率在每秒24、25或30帧,水平分辨率在250400像素,垂直分辨率在200300线。对于典型的应用,MPEG-1定义了SIF格式。表6-5和图6-19分别为由CCIR601到SIF的格式转换数据和采样模式。第第6 6章章 视频压缩技术视频压缩技术 表6-5CCIR601到SIF的格式转换数据第第6 6章章 视频压缩技术视频压缩技术 图6-19由CCIR601到SIF的格式转换采样模式(a)ITU-R601(422)采样点;(b)MPEG-1(SIF)采样点第第6 6章章 视频压缩技术视频压缩技术

91、 2.图像组MPEG-1提出了图像组(GoP,GroupofPicture)的概念,从视频编码算法的角度而言,MPEG-1(以及MPEG-2)将视频图像帧(Picture)划分为三大类:I帧(Intra-codedpicture帧内编码图像帧):不参考其他图像帧而只利用本帧的信息进行编码。第第6 6章章 视频压缩技术视频压缩技术 P帧(Predictive-codedPicture预测编码图像帧):由一个过去的I帧或P帧采用有运动补偿的帧间预测进行更有效的编码;通常用于进一步预测之参考。B帧(Bidirectionallypredictedpicture双向预测编码图像帧):提供最高的压缩,它

92、既需要过去的图像帧(I帧或P帧),也需要后来的图像帧(P帧)进行有运动补偿的双向预测。第第6 6章章 视频压缩技术视频压缩技术 VCD中常用的图像组结构是:B.B.I.B.B.P.B.B.P.B.B.P.B.B.I.B.B.P,M=3 ,N=12(M为两个参考帧之间的B帧数目加一,N为一个图像组内的图像帧的总数目)。B帧有较高的压缩比,所以视频编码器总编码效率很高;I帧和P帧的压缩比不高,保证了重建图像的质量。第第6 6章章 视频压缩技术视频压缩技术 还有一种D帧(DCCodedPicture,直流编码帧)仅用于快进或退回显示低分辨率图像。实时地进行MPEC-1解码有相当的难度,当希望以正常速

93、度的10倍播放视频,则要求就更高了,而D帧是用来产生低分辨率图像的。每一D帧的入口正好是一块的平均值,没有更进一步的编码,这样容易进行实时播放。这一措施很重要,使人们能以高速度扫描影片,搜索特定场面。第第6 6章章 视频压缩技术视频压缩技术 3.固定数码率和可变数码率视频编码可以采用固定数码率(CBR,ConstantBitRate)或可变数码率(VBR,VariableBitRate)。视频编码采用固定数码率就是保持每个图像组(GoP)都有相同的平均数码率。当输入的图像内容有可能使输出的平均数码率超出额定值时,不得不瞬时地牺牲图像局部的、瞬时的主观质量为代价(例如,增大量化器的步距,或者瞬时

94、对图像的某些部分“跳过”(skip)而暂不编码;只要一般观众不容易觉察或者瞬时尚可接受),以维持输出的视频数码率保持不变。第第6 6章章 视频压缩技术视频压缩技术 另一方面,当图像内容不复杂时,又不得不大量地插入毫无意义的“填充码”(stuffingbits),来维持输出的视频数码率为预定的恒定值。固定数码率的视频编码算法简单易行,但编码效率不高。第第6 6章章 视频压缩技术视频压缩技术 可变数码率视频编码算法中不同图像组的平均数码率是可变的数值,它可以根据图像的内容而变动,保证解码后的重建图像的质量恒定(没有大的起伏的某种预定值)。其主要优点是显著地减少了“填充比特”,大大提高了传输(或存储

95、媒体)的频谱(或存储容量)之利用率,具有巨大的经济效益。其代价是编码器的技术难度大,成本高,因此,这种技术特别适合广播应用。第第6 6章章 视频压缩技术视频压缩技术 4.算法概述对I帧的编码类似JPEG,例如基于人的视觉特性的量化矩阵,对DC分量用特定的量化步长并且进行预测编码,对AC分量进行Z字形扫描和二维VLC编码。P帧编码利用过去的I帧或P帧进行运动补偿预测,可得到更有效的编码。B帧编码能提供最大限度的压缩,它需要参考过去和将来的I帧、P帧进行运动补偿,但B帧不能用作预测参考。第第6 6章章 视频压缩技术视频压缩技术 对于P帧和B帧的处理类似H.261,例如运动矢量的预测编码,编码模式和

96、宏块类型的VLC编码等。此外对于预测误差利用DCT可进一步压缩其空间冗余度,用同一个量化器对其进行均匀量化后,再进行Z字形扫描和二维VLC编码。第第6 6章章 视频压缩技术视频压缩技术 5.编码编码器与图6-16的H.261编码器框图类似,只是在对B帧编码时,要有两个帧存储器分别存储过去和将来的两个参考帧,以便进行双向运动补偿预测。编码器必须在图像质量、编码速率以及编码效率之间进行综合考虑,选择合适的编码工作模式和控制参数。第第6 6章章 视频压缩技术视频压缩技术 6.音频编码MPEG-1用32kHz、44.1kHz和48kHz的频率对音频波形采样,对数字音频信号实行快速傅里叶变换,将它从时域

97、变换到频域,把得到的频谱划分为32个频带,每个频带独立处理。当两个立体声道出现时,两个高度重叠的音源间的内部冗余也要被消除。编码结果的MPEG音频流的可调节范围为32448kbs。第第6 6章章 视频压缩技术视频压缩技术 7.视频流和音频流的同步音频和视频编码器各自独立工作,存在两个数据流在接收方怎样同步的问题。解决这个问题的方法是通过一个90kHz的系统时钟向两个编码器输出当前的时间值。这个值有33比特,可以使电影连续放映24小时而不绕回。这些时间戳被包含在编码输出中向接收方传送,利用它可以来同步音频流和视频流。符合MPEG-1标准的单片编码芯片有WINBOND公司的W99200。第第6 6

98、章章 视频压缩技术视频压缩技术 6.3.6MPEG-2标准MPEG-2标准是MPEG工作组制定的第二个国际标准,标准号是ISOIEC13818,题目是“通用的活动图像及其伴音的编码”。它主要包括系统、视频、音频、一致性、参考软件、数字存储媒体的命令与控制、高级音频编码、10比特视频编码和实时接口9个部分。作为一个通用的编码标准,应用范围更广,包括标准数字电视、高清晰度电视和MPEG-1的工作范围。MPEG-2的解码器可以对MPEG-1码流进行解码。第第6 6章章 视频压缩技术视频压缩技术 1.类和级为了适应广播、通信、计算机和家电视听产品的各种需求,适应不同的数字电视体系,MPEG-2有4种输

99、入格式,用级(levels)加以划分;有5种不同的处理方法,用类(profiles,也译成档次)加以划分。(1)低级(LL,LowLevel)的图像输入格式,以亮度像素(记为pel)数计,是35224030pels或35228825pels,最大输出码率是4Mbs。第第6 6章章 视频压缩技术视频压缩技术 (2)主级(ML,MainLevel)的图像输入格式完全符合ITU-R601标准,即72048030pels或72057625pels,最大输出码率为15Mbs(高类主级是20Mbs)。(3)高1440级(H14L,High-1440Level)的图像输入格式是14401152pel的高清晰

100、度格式,最大输出码率为60Mbs(高类为80Mbs)。(4)高级(HL,HighLevel)的图像输入格式是19201152的高清晰度格式,最大输出码率为80Mbs(高类为100Mbs)。第第6 6章章 视频压缩技术视频压缩技术 在MPEG-2的5个类中,每升高一类将提供前一类没使用的附加的码率压缩工具,编码则更为精细。类之间存在向后兼容性,若接收机能解码用高类工具编码的图像,也就能解码用较低类工具编码的图像。第第6 6章章 视频压缩技术视频压缩技术 (1)简单类(SP,SimpleProfile)是最低的类。(2)主类(MP,MainProfile),比简单类增加了双向预测压缩工具。主类没有

101、可分级性,但质量要尽量好。(3)信噪比可分级类(SNRP,SNRScalableProfile)(4)空间可分级类(SSP,SpatiallyScalableProfile)。SNRP和SSP两个类允许将编码的视频数据分为基本层以及一个以上的上层信号。基本层包含编码图像的基本数据,但相应的图像质量较低,上层信号用来改进信噪比或清晰度。以上4个类是逐行顺序处理色差信号的(例如420)。第第6 6章章 视频压缩技术视频压缩技术 (5)高类(HighProfile)则支持逐行同时处理色差信号(例如422),并且支持全部可分级性。MPEG-2的类和级见表6-6,表中MPEG-2格式用类和级的英文缩写词

102、来表示,例如MPML指的是主类和主级。目前标准清晰度数字电视采用这种格式。MPHL指的是主类和高级,在高清晰度数字电视中采用这种格式。在表6-6中只列出了在20种可选组合中的11种获准通过的组合,这些格式称为MPEG-2适用点。第第6 6章章 视频压缩技术视频压缩技术 表6-6MPEG-2的类和级第第6 6章章 视频压缩技术视频压缩技术 422标准是为演播室制定的要求较高的分量编码标准,在某些应用场合为压缩数码率可采用较低档次的编码标准,常用的有420和411标准。在420标准中,亮度信号与色差信号的抽样频率与422标准相同,但两个色差信号每两行取一行,即在水平和垂直方向上的分解力均取为亮度信

103、号的一半。在411标准中,Y、U、V的抽样频率为13.5、3.375、3.375MHz,即两个色差信号在垂直方向上的分解力与亮度信号相同,在水平方向上则为亮度信号的14。以上这些标准的幅型比都是43。第第6 6章章 视频压缩技术视频压缩技术 2.MPEG-2码流MPEG-2的结构可分为压缩层和系统层。一路节目的视频、音频及其他辅助数据经过数字化后通过压缩层完成信源压缩编码,分别形成视频的基本流ES(ElementaryStream)、音频的基本流和其他辅助数据的基本流;紧接着系统层将不同的基本流分别加包头打包为PES(PacketizedES)包。第第6 6章章 视频压缩技术视频压缩技术 PE

104、S包的结构如图6-20所示。包的头部有:起始码(packetstartcode),它由前缀(prefix)和起始码数值组成;包识别(steamID),代表这个包码流的性质是视频、音频或数据及包的序号;PES长度(PESpacketlength),表示这个字段后面有多少字节;PES头部标志(PESHeaderFlags)共14个比特,包含内容有SC为加扰指示;PR为优先级指示;DA表示相配的数据;CR有无版权指示;OC表示原版或拷贝;PD表示有无PTS(显示时间标志)或DTS(解码时间标志);ESCR表示PES包头部是否有基本码流的时间基准信息;第第6 6章章 视频压缩技术视频压缩技术 RATE

105、表示PES包头部是否有基本流速率信息;TM表示是否有8个比特的字段说明数字存储媒体(DSM)的模式;AC表示未定义;CRC表示是否有CRC字段;EXT表示是否有扩展标志。第第6 6章章 视频压缩技术视频压缩技术 图6-20PES和TS的结构第第6 6章章 视频压缩技术视频压缩技术 为了多路数字节目流的复用和有效的传输,将PES包作为负载插入传输包(TS包)中。TS包固定为188字节,其包头有固定的4字节的包头和可选的可变长的调整字段,如图6-20所示。TS包包头都含有包标识(PID)域,用来标识包的类型(如视频、音频、节目指定信息PSI等)。第第6 6章章 视频压缩技术视频压缩技术 当需要插入

106、节目参考时钟PCR(ProgramClockReference)或其他包头信息时就要加入调整字段。PCR非常重要,它以固定频率插入包头,表示编码端的时钟,并反映了编码输出码率。收端根据PCR可以用来调整解码端的系统时钟,以保证对节目的正确解码。包含视频PES包、音频PES包和其他辅助数据的PES包的各种PES包按一定的比率经过复用后可形成一路节目的TS流,如图6-21所示。第第6 6章章 视频压缩技术视频压缩技术 图6-21MPEG-2中视频流和音频流的多路复用第第6 6章章 视频压缩技术视频压缩技术 针对不同的应用环境(即信道存储介质),ISOIEC13818-1规定了两种系统编码句法:节目

107、流PS(ProgramStream)和传输流TS(TransportStream)。PS是针对那些不容易发生错误的环境(如光盘存储系统上的多媒体应用)而设计的系统编码方法。这种方法还特别适用于软件处理的环境。TS是针对那些很容易发生错误(表现为位值错误或组丢失)的环境(如长距离网络或无线广播系统上的应用)而设计的系统编码方法。第第6 6章章 视频压缩技术视频压缩技术 为了能对一路节目的TS流中所含的各种信息进行标识(如区分音、视频包),在复合的时候需要插入PSI信息(ProgramSpecificInformation),PSI信息以段(Section)为单位进行组织,Section可以作为负

108、载插入TS包中。然后以一定的比率插入一路节目的TS流中,形成完整的一路节目的TS流。在实际的通信系统中,一路6MHz的模拟电视带宽中可传送多路数字化节目,即在调制之前要将多路节目(可能具有不同的时基:PCR)的TS流进行再复用(Remultiplex),以适应传输的需要。第第6 6章章 视频压缩技术视频压缩技术 3.MPEG-2编码的新功能MPEG-2的编码器方框图与图6-16中的H.261编码器方框图类似,增加了以下新功能:(1)基于场或基于帧的DCTMPEG-2在把宏块数据分割为块的时候有按帧分割和按场分割之分,相应地在帧或场的模式下进行DCT编码。适当地利用子块的空间冗余度,能得到最佳的

109、压缩效果。第第6 6章章 视频压缩技术视频压缩技术 当序列是逐行时,采用的分割方式与MPEG-1相同;对隔行扫描的图像,根据帧、场的行间相关系数的大小来选择分割方式,对于静止或缓变图像和区域宜采用按帧的DCT编码;对于运动区域,宜采用按场的DCT编码。第第6 6章章 视频压缩技术视频压缩技术 (2)4种图像预测和运动补偿方式MPEG-2规定了4种图像的运动预测和补偿方式,即基于帧的预测模式、基于场的预测模式、168的运动补偿和双场(DualPrime)预测模式。第第6 6章章 视频压缩技术视频压缩技术 (3)编码的可分级性MPEG-2引入了3种编码的可分级性,即空间可分级性、时间可分级性以及信

110、噪比SNR可分级性。可分级编码的特点是整个码率被分为基本码流和增强码流两部分,基本码流可以提供一般质量的重建图像,但如果解码器“叠加”上增强部分的码流,就可以得到很高质量的重建图像。第第6 6章章 视频压缩技术视频压缩技术 可分级编码的优点是同时提供了不同的编码服务水平,例如可以在一个公共的信道实现HDTV和SDTV的同播。此外,MPEG-2还允许空间分级、时间分级以及SNR分级等以各种方式结合形成的多层次的分级扩展。单片MPEG-2编码芯片有IBM公司的MPEGS422(HPML,422)和MPEGS420(MPML)。第第6 6章章 视频压缩技术视频压缩技术 6.3.7MPEG-4标准MP

111、EG-4是适应多媒体应用的“音频视觉对象编码”标准,国际标准号是ISOIEC14496,包括版本1和版本2。版本1由系统、视觉信息、音频、一致性、参考软件、多媒体传送集成框架和工具(视频)优化软件等7个部分组成,于1998年10月通过,其中前6个与MPEG-2的相应部分相对应。版本2是MPEG-4的扩展部分。第第6 6章章 视频压缩技术视频压缩技术 MPEG-4规定了各种音频视频对象的编码,除了包括自然的音频视频对象,还包括图像、文字、2D和3D图形以及合成话音和音乐等。MPEG-4通过描述场景结构信息,即各种对象的空间位置和时间关系等,来建立一个多媒体场景,并将它与编码的对象一起传输。由于对

112、各个对象进行独立的编码,可以达到很高的压缩效率,同时也为在接收端根据需要对内容进行操作提供了可能,适应了多媒体应用中人机交互的要求。MPEG-4的视频编码分为合成视频编码和自然视频编码。第第6 6章章 视频压缩技术视频压缩技术 1.合成视频编码计算机图形和以往的压缩编码都属于合成视频信息,MPEG-4把人工合成信息数据算作一种新的数据类型,支持对人工合成VO(VideoObject)数据与自然VO数据的混合编码,即合成与自然混合编码(SNHC)。SNHC提供了对人工合成信息的具体描述,定义了有关图形文本的多种表达方式,例如2D网格对象、3D人脸和身体对象、3D网格对象等都是描述合成信息的。第第

113、6 6章章 视频压缩技术视频压缩技术 SNHC文本表达方式设计了合成图形对象的描述框架、通用的数据流结构和灵活的接口。SNHC支持媒体间更灵活的混合方式,能减少混合媒体的存储空间和带宽,为此提供了一种基于合成的自然视频编码纹理网格编码。它的核心是基于网格的纹理映射,将要表达的图像区域划分成合成网格,采用映射的方法将实际拍摄的自然纹理图像直接贴到该网格区域上。第第6 6章章 视频压缩技术视频压缩技术 2.自然视频编码MPEG-4自然视频码流的层次化数据结构分为如下5层:(1)视频序列(VS,VideoSequence)VS对应于场景的电视图像信号,VS层由VS0,VS1,VSn组成,是整个场景在

114、各段时间的图像,VS由一个或多个VO构成。(2)视频对象(VO,VideoObject)VO对应于场景中的人、物体或背景,它可以是任意形状。VO层由VO0,VO1,VOn组成,是从VS中提取的不同视频对象。第第6 6章章 视频压缩技术视频压缩技术 (3)视频对象层(VOL,VideoObjectLayer)VOL指VO码流中包括的纹理、形状和运动信息层。VOL用于实现分级编码,VOL层由VOL0,VOL1,VOLn组成是VO的不同分辨率层(一个基本层和多个增强层)。(4)视频对象平面组(GoV,GroupofVOP)GoV层是可选的。GoV由多个VOP组成。GoV提供了比特流中独立编码VOP的

115、起始点,以便于实现比特流的随机存取。第第6 6章章 视频压缩技术视频压缩技术 (5)视频对象平面(VOP,VideoObjectPlane)VOP层由VOP0,VOP1,VOPn组成,是VO在不同分辨率层的时间采样。VOP可以独立地进行编码(I-VOP),也可以运用运动补偿编码(P-VOP和B-VOP),VOP可以是任意形状。第第6 6章章 视频压缩技术视频压缩技术 MPEG-4基于对象概念的视频编解码器原理框图如图6-22所示。首先,对自然视频流进行VOP分割,由编码控制器为不同VO的形状、运动、纹理信息分配码率,并由VO编码器对各个VO分别进行独立编码,然后将编码的基本码流复用成一个输出码

116、流,编码控制和复用(MUX,Multipex多路复用)部分可以加入用户的交互控制或智能算法控制。第第6 6章章 视频压缩技术视频压缩技术 图6-22MPEG-4视频编解码器(a)编码器结构;(b)解码器结构第第6 6章章 视频压缩技术视频压缩技术 接收端经解复用(DEMUX,Demultipex多路信号分离),将各个VO分别解码,然后将解码后的VO合成场景输出。解复用和VO合成时同样可以加入用户交互控制。视频对象(VO)编码器包括三个部分:形状编码部分、运动补偿部分以及纹理编码部分。在电视安全监控中对图像进行数字录像时,常采用MPEG-4标准进行压缩,因为电视监控图像背景是固定不变的,人物较少

117、,活动缓慢,基于对象编码能得到较高的数据压缩率。第第6 6章章 视频压缩技术视频压缩技术 6.3.8ITU-TH.264ITU-T的H.264标准(ITU-TRec-H.264ISOIEC11496-10AVC)的工作由ISOIEC下属的运动图像专家组MPEG和ITU下属的视频编码专家组VCEG(VideoCoding Experts Group)共 同 成 立 的 联 合 视 频 小 组JVT(JointVideoTeam)负责完成。由于H.264采用了许多不同于以往标准中使用的先进技术,因此相对于以往的标准,在相同的码率下用H.264标准编码能够获得更高的图像质量。第第6 6章章 视频压缩

118、技术视频压缩技术 1.按功能进行分层H.264将整个编码结构分成网络抽象层NAL(NetworkAbstractionLayer)和视频编码层VCL(VideoCodingLayer)。视频编码层进行视频压缩、解压缩操作。而网络抽象层专门为视频编码信息提供文件头信息、安排格式以有利于网络传输和介质存储,具有更强的网络友好性和错误隐藏能力。第第6 6章章 视频压缩技术视频压缩技术 2.树状结构运动补偿H.264为亮度分量提供了1616,168,816和88四种宏块划分方式,还能将88宏块进一步划分成84、48和44三种子宏块。每个分块都有各自的运动向量,基于上述划分的运动补偿被称为树状结构运动补

119、偿。第第6 6章章 视频压缩技术视频压缩技术 31/4像素运动矢量估计为了得到更接近于原始图像的重构图像,H.264将运动矢量的精度提高到14像素。14像素采样值的获得分为两步:第一步是由多个整数点像素采样值经过FIR滤波器输出得到部2像素值;第二步是用12像素值进行双向线性插值得到14像素值。第第6 6章章 视频压缩技术视频压缩技术 4.整数变换为做进一步的压缩处理,从运动估计和补偿出来的结果将被从空间域转化为频率域。这在以前的编码标准中大多都采用了88的离散余弦变换,而在H.264中则采用了44的整数变换。其变换公式为Y=HXHT,其中X为要被变换的44像素块,而第第6 6章章 视频压缩技

120、术视频压缩技术 这种整数变换其实是DCT变换的一种近似,但它将DCT变换中的浮点运算改为整数运算,可以减少系统的运算量。同时,它用减小量化精度的方法来降低数据量,用对更小的数据块(44)进行处理来减小失真,从而进一步提高了图像质量和编码效率。第第6 6章章 视频压缩技术视频压缩技术 5.块间滤波器视频信息编码重构以后块间亮度落差会变大,图像出现马赛克现象,影响人的视觉感受。H.264通过在块间使用滤波器来平滑块间的亮度落差,使重构后的图像更加贴近原始图像。H.264的滤波器同时又是选择性的,对于原本就存在较大变化的边缘部分不采用滤波器,保证了原始信息不受破坏。第第6 6章章 视频压缩技术视频压

121、缩技术 6.熵编码H264使用了两种熵编码方法,即基于上下文的自适应变长编码(CAVLC, Contextbased AdaptiveVariableLengthCoding)与通用的变字长编码(UVLC,UniversalVariableLengthCoding)相结合的编码和基于上 下 文 的 自 适 应 二 进 制 算 术 编 码 (CABAC,ContextbasedAdaptiveBinaryArithmeticCoding)。采用CAVLC和CABAC可以根据上下文的内容,自适应调整符号概率分布,保证在当前编码过程中用较短的码字表示概率较大的符号。第第6 6章章 视频压缩技术视频压

122、缩技术 7.切换帧 H.264通过使用切换帧来实现不同传输速率、不同图像质量间的切换,这样能最大限度地利用现有资源而不出现因缺少参考帧引起的解码错误。要达到切换的目的就必须实现视频流的过渡,切换帧SP的思想是在两股视频流的基础上再引入一股视频流,这股视频流中的帧能够从源视频流的帧预测得到,同时能够预测目标视频流中的帧。第第6 6章章 视频压缩技术视频压缩技术 先对切换目标B2进行变换和量化,然后对经过运动补偿的被切换帧A1进行变换和量化。在变换域中形成参考值与真实值的差,再对其进行变长编码得到切换帧SPAB2。在预测视频流B的帧B2的过程中,只需将切换帧进行变长解码后得到的差值加到视频流A的帧

123、A1的变换量化结果上,再经过逆量化逆变换就得到了切换目标帧的预测B2。 H.264采用上述先进技术后具有更低的传输码率和更高的图像质量,可以预见H.264在许多应用场合将取代MPEG-2和MPEG-4。第第6 6章章 视频压缩技术视频压缩技术 6.3.9VCD和DVDVCD和DVD是MPEG标准的应用典型,它是由CD发展而来的。1.CD数字激光唱机简称CD(CompactDiscDigitalAudio)。它是用激光束读取CD唱片上数字化音频信号后,再经数/模转换为模拟音频信号输出。第第6 6章章 视频压缩技术视频压缩技术 录有数字化音频信号的CD唱片又称为光碟、激光唱片或镭射唱片。CD唱片由

124、透明的多元碳酸树脂(PPM)保护层、铝反射层、信迹刻槽和聚碳酸脂衬底组成。CD唱片的外径为120mm,厚度为1.2mm,重量为1418g。唱片有导入区、导出区和声音数据记录区。声音数据以坑、岛形式记录在由内向外的螺旋信迹上。第第6 6章章 视频压缩技术视频压缩技术 螺旋信迹约有20625圈,总长度约5300m。激光束从凹坑反射光的强度比从岛反射光的强度弱,激光束扫过凹坑的前沿或后沿时,反射激光束强度会发生变化。定义凹坑的前沿和后沿代表1码,坑和岛的平坦部分代表0码。坑、岛的长度越大,则0码的个数越多。第第6 6章章 视频压缩技术视频压缩技术 CD唱片录制(光刻)时模拟声音信号先经过020kHz

125、低通滤波,再经AD转换成PCM数字信号,采样频率为44.1kHz,每次采样对左右声道各采一个样,进行16比特量化,每6个采样周期为一帧,每帧有6216=192比特。为便于处理,将192比特分为24字,每字8比特。为提高解码可靠性,对不同帧的数字信号进行CIRC编码(CrossInterleaveReedSolomonCode,交叉交织里德索罗门码),和EFM编码(EighttoFourteenModulation,8-14比特变换调制)后驱动光刻机,刻录CD唱片。第第6 6章章 视频压缩技术视频压缩技术 交织和里德索罗门编码(RS编码)的介绍详见8.1.2信道编码,交叉交织里德索罗门码是交织和

126、RS编码的组合,方框图如图6-23所示。输入信息每8位一组,每24组经RS编码后加上4组奇偶校验组,这28组RS码在交织电路中分散突发错误,在第2级RS编码时再一次加上4组奇偶校验组,能检错8组纠错4组,可以有效纠正因为介质损坏、光头污染或定时抖动造成的突发差错,以保证优质音响效果。第第6 6章章 视频压缩技术视频压缩技术 图6-23CIRC编码方框图第第6 6章章 视频压缩技术视频压缩技术 EFM编码就是用14比特来表示8比特数据。14比特有214=16384种码型,能找到两个“1”码之间至少有两个“0”码且最多不超过10个“0”码的256种码型来代替原来8比特的PCM码, 限制连“0”码和

127、连“1”码的出现个数,保证从光盘读出的数据流中能正确提取位同步等时钟信息。在两个14比特数据相连接时,中间增加3比特结合码,也是为了在任何时刻的数据流中,满足两个“1”码之间,至少有两个“0”码最多不超过10个“0”码。这样,整个EFM数据流的直流成分和低频成分减少,保证了伺服系统稳定工作。第第6 6章章 视频压缩技术视频压缩技术 2.VCDVCD(VideoCD)是能放电视的CD机,又称数字视音光盘,VCD采用MPEG-1标准,存储了经压缩编码的彩色电视信号。VCD光盘上的数字信号经MPEG-1标准解压缩后,可重放清晰、无杂波干扰的彩色电视图像和达到CD质量的数字伴音。VCD重放图像质量达到

128、VHS录像机质量水平(NTSC制35224030帧秒和PAL制35228825帧秒的电视图像分解力)。VCD光盘直径为12cm,重放时间为74min。VCD光盘可在CD生产流水线上批量生产,生产成本低。1996年以后,我国VCD产业迅速发展,年产量大于1000万台。第第6 6章章 视频压缩技术视频压缩技术 Philips、Sony、JVC等公司在1993年共同制定了VCD1.1标准, 又称White Book。 1994年7月又对VCD1.1标准作了改进,增加了重放控制、多画面、交互式等功能,形成了VCD2.0标准。第第6 6章章 视频压缩技术视频压缩技术 图6-24VCD光盘录制过程方框图第

129、第6 6章章 视频压缩技术视频压缩技术 图6-24是VCD光盘录制过程的方框图。VCD信源编码采用MPEG-1标准对视音频数据进行压缩。CD-ROM格式编码采用CD-ROMXA标准,规定VCD的数据组织与系统描述应符合ISO9660规范。但VCD独特的数据组织须符合VCD的WhiteBook和VCD2.0版标准。信道编码采用CIRC纠错编码和EFM调制以提高数据信号存储、读出的可靠性。第第6 6章章 视频压缩技术视频压缩技术 图6-25为VCD播放过程的方框图。播放过程是录制的逆过程,激光头用激光束拾取光盘上的坑、岛信迹,变换成信杂比合适的电信号送到DSP(数字信号处理器),在DSP实现EFM

130、解调和CIRC解码。VCD解码集成电路包括CD-ROM格式解码、数据分离、音频和视频数据的MPEG-1解码等,如图6-25中虚线框所示。最后音频信号经DA转换成双声道模拟音频信号、视频信号后再经PAL编码成模拟全视频信号。第第6 6章章 视频压缩技术视频压缩技术 图6-25VCD光盘播放系统方框图第第6 6章章 视频压缩技术视频压缩技术 单片VCD解码集成电路型号很多,例如,美国C-Cube公司的CL480、484、680,日本NEC公司的PD61012,ESS公司的ESS3204,Panasonic公司的MN89101AM等。第第6 6章章 视频压缩技术视频压缩技术 3.DVD数字电视光盘简

131、称DVD(DigitalVideoDisc)。它能存储和重放广播级质量的电视图像及伴音。实际上DVD不仅能用来存放电视节目,还可以存放数据信息,所以DVD又称为数字多能光盘(DigitalVersatileDisc)。第第6 6章章 视频压缩技术视频压缩技术 (1)DVD产品分类DVD-ROMRAM(DVD读写驱动器)采用BOOKA标准。DVD-Video(DVD放像机)采用BOOKB标准。DVD-Audio(DVD音响)采用BOOKC标准。DVD-Recordable(DVD一次写、多次读)采用BOOKD标准。DVD-RAM(DVD随机读写)采用BOOKE标准。近年来还出现了PC-DVD,这

132、是指个人计算机领域的DVD产品。第第6 6章章 视频压缩技术视频压缩技术 (2)DVD的存储容量DVD光盘直径和CD、VCD一样都为12cm,厚度为1.2mm,但DVD光盘的存储容量高达4.717GB,而一片CD-ROM的存储量只有650MB。表6-7所列是各种DVD的存储容量。第第6 6章章 视频压缩技术视频压缩技术 表6-7DVD的存储容量第第6 6章章 视频压缩技术视频压缩技术 CD、VCD光盘只使用一个面、单层记录信息。DVD光盘采用单面双层记录信息,单面双层光盘的表层称为第0层,下层称为第1层。第0层是半透射层,它能让较长波长(650780nm)激光透过,并读取第1层上的坑、岛信息。

133、当第1层面上的信息读完时,接着由较短波长(635nm)的激光束聚焦于第0层表面,读取第0层面上的信息。因为635nm激光束是透不过第0层半透射层的,所以它不能读取下面第1层面上的信息。第第6 6章章 视频压缩技术视频压缩技术 (3)DVD的图像质量标准DVD采用MPEG-2Video标准,NTSC制电视图像分解力为720480、30帧s,PAL制电视图像分解力为720576、25帧s,压缩编码后的数据传输速率可变范围为110Mb/s,平均数据传输速率为4.69Mb/s。DVD兼容VCD的MPGE-1标准,VCD的电视图像分解力只有MPEG-2的一半,VCD只有1.5Mbs固定数据传输速率。DV

134、D图像信噪比可达到115dB,采用较宽色度带宽能消除彩色位移、图像抖动,且具有真正的彩色广播电视质量。第第6 6章章 视频压缩技术视频压缩技术 (4)DVD的音响质量标准DVD的音响标准采用MPEG-2Audio环绕立体声,或者采用DolbyAC-35.1环绕立体声,也有采用线性预测编码LPCM立体声的,音频信噪比达90dB。DolbyAC-35.1环绕立体声有前左、前右、后左、后右、中五个扬声器,再加一只0.1kHz以下的超低音扬声器。重放声音频率范围为20Hz20kHz,具有6声道数码音频、三维空间的振撼音响效果。此外,DVD还具有8种语言、32种文字字幕及多方向视角画面等功能。第第6 6

135、章章 视频压缩技术视频压缩技术 (5)DVD播放系统DVD播放系统如图6-26所示,主要由以下部分组成:DVD光盘读出机构主要由装盘机构、马达、激光拾信头组成。马达以恒定速度运动,激光器采用625nm红色激光波长,这样读出的信号分辨率好。第第6 6章章 视频压缩技术视频压缩技术 图6-26第第6 6章章 视频压缩技术视频压缩技术 DSP数字信号处理器将激光拾信头读出的脉冲数据转换成解码器适用的数据。其中包括8-16bit(EFMPLUS)解码和RS-PC(ReedSolomonProductCode)解码。数据分离器将激光拾信头读出的复合数据流分离为声音、图像及控制数据,然后进行MPGE-2电

136、视图像解压缩、DolbyAC3或MPEG-2Audio声音解压缩。解压缩编码后的数字信号经D/A变换为模拟信号,视频模拟分量信号经编码成为NTSC或PAL制的彩色全电视信号。微控制器用来控制、管理播放机的运行。第第6 6章章 视频压缩技术视频压缩技术 DVD的单片MPEG-2解码器芯片型号有:美国LSILOGIC公司的L64020,美国C-Cube公司的ZIVA-DS、ZIVA-D6,日本Sony公司的CXDl9XX、NEC公司的PD61021、富士通公司的MB86371等。为防止用录像机从DVD复制节目,在NTSCPAL编码部分设置了APS(AnalogProtectionSystem)模拟

137、防拷贝技术。第第6 6章章 视频压缩技术视频压缩技术 4.SVCD1998年8月,SVCD(SuperVCD)作为VCD更新换代产品的技术标准在北京正式制订完毕。SVCD标准作为中国产业专利,得到Philips、Sony、JVC、C-Cube、National等公司支持,向ISOIEC申请为国际化标准。第第6 6章章 视频压缩技术视频压缩技术 SVCD产品的基本内容包括:采用双倍速机芯,视频采用MPEG-2压缩编码、解码,光盘数据格式采用 2/3 D1, 即图像分解力为480480(NTSC制)或480576(PAL制),电视图像的水平清晰度提高到350线。SVCD光盘播放时间为45min,向

138、下兼容CD、VCD。SVCD的数据传输率在1.152.6Mb/s。SVCD音响采用两个层次:基本层依然与VCD一样采用MPEG-1Audio压缩标准, 但有4声道立体声; 扩展层采取MPEG-2Audio压缩标准,具有5.1声道立体声,可以组成家庭影院系统。第第6 6章章 视频压缩技术视频压缩技术 SVCD专用的单片MPEG-2解码芯片型号是SVD1811,是新科公司与美国、日本的一些公司合作开发的产品,包括音、视频的解码,核心是一块可编程多媒体微处理器,调整微处理器的微码,可实现不同的解压缩算法,可用于SVCD、DVD和多媒体PC等数字视频产品。第第6 6章章 视频压缩技术视频压缩技术 6.

139、4 音频压缩的原理和标准音频压缩的原理和标准6.4.1音频信号压缩的可能性人耳可以听到的声音是频率在20Hz20kHz之间的声波,称为可听声。音频信息就是指这一类声音,可听声有三类。(1)语音由口腔发出的声波,频率大致在200Hz3.4kHz之间,主要用于信息解释说明、叙述、答问,也可以作为命令参数输入语言。第第6 6章章 视频压缩技术视频压缩技术 (2)音乐声是由各种乐器产生的,音频范围都可以存在,本身可供欣赏,也可作为烘托气氛,是音频信息的重要组成部分之一。(3)效果声大自然物理现象产生的,如刮风、下雨、打雷等,还有一些人工产生的,如爆破声、拟音等,对语音和音乐起补充作用。第第6 6章章

140、视频压缩技术视频压缩技术 与视频信号的压缩一样,只有当音频信号本身具有冗余,才能对其进行压缩。根据统计分析,音频信号中存在着多种时域冗余和频域冗余,考虑人耳的听觉机理,也能对音频信号实行压缩。第第6 6章章 视频压缩技术视频压缩技术 1.时域冗余音频信号的时域冗余主要表现为:(1)幅度分布的非均匀性统计表明,大多数类型的音频信号中,小幅度样值比大幅度样值出现的概率要高。如语音中的间歇、停顿会出现大量的低电平样值,而实际讲话功率电平也趋向于出现在编码范围的较低电平端。第第6 6章章 视频压缩技术视频压缩技术 (2)样值间的相关性对语音波形的分析表明,取样数据的最大相关性存在于邻近样值之间,当取样

141、频率为8kHz时,相邻取样值间的相关系数大于0.85,甚至在相距10个样值之间,还可有0.3左右的相关系数。如果取样频率提高,样值间的相关性将更强。因而利用N阶差分编码技术,可以进行有效的数据压缩。第第6 6章章 视频压缩技术视频压缩技术 (3)周期之间的相关性虽然音频信号分布在20Hz20kHz的频带范围内,但在一定的瞬间,某一声音往往只是该频带内的少数频率成分在起作用。当声音中只存在少数几个频率时,在周期与周期之间,存在着一定的相关性。利用音频信号周期之间信息冗余度的编码器,比只利用邻近样值间的相关性的编码器效果要好,但编码器要复杂得多。第第6 6章章 视频压缩技术视频压缩技术 (4)基音

142、之间的相关性语音通常分为两种基本类型:第一类称为浊音(VoicedSound),是由声带振动产生的,每一次振动使一股空气从肺部流进声道,激励声道的各股空气之间的间隔称为音调间隔或基音周期。一般而言,浊音产生于发元音及发某些辅音的后面部分。第二类称为清音(UnvoicedSound),一般又分成摩擦音和破裂音两种情况:前者用空气通过声道的狭窄部分而产生的湍流作为音源;后者声道在瞬间闭合,然后在气压激迫下迅速地放开而产生了破裂音源。语音从这些音源产生,传过声道再从口鼻送出。清音比浊音具有更大的随机性。第第6 6章章 视频压缩技术视频压缩技术 浊音波形不仅显示出上述的周期之间的冗余度,而且还展示了对

143、应于音调间隔的长期重复波形。因此,对语音浊音部分编码的最有效的方法之一是对一个音调间隔波形来编码,并以其作为其他音段的模板。男、女声的基音周期分别为520ms和2.510ms,而典型的浊音约持续100ms,一个单音中可能有2040个音调周期。虽然音调周期间隔编码能大大降低码率,但是检测基音有时却十分困难。而如果对音调检测不准,便会产生奇怪的“非人音”。第第6 6章章 视频压缩技术视频压缩技术 (5)长时自相关函数上述样值、周期间的一些相关性,都是在20ms时间间隔内进行统计的所谓短自相关。如果在较长的时间间隔(如几十秒)进行统计,便得到长时自相关函数。长时统计表明,当取样频率为8kHz时,相邻

144、样值间的平均相关系数高达0.9。(6)静止系数在讲话的时候,会出现字、词、句之间的停顿。分析表明,语音间隙静止系数为0.6。显然,语音间隔本身就是一种冗余,若能正确检测出该静止段,便可“插空”传输更多的信息。第第6 6章章 视频压缩技术视频压缩技术 2.频域冗余音频信号在频域的冗余主要表现在如下两方面:(1)长时功率谱密度的非均匀性在相当长的时间间隔内进行统计平均,可得到长时功率谱密度函数,其功率谱呈现明显的非平坦性。这意味着没有充分利用给定的频段,或者说存在固有冗余度第第6 6章章 视频压缩技术视频压缩技术 (2)语音特有的短时功率谱密度语音信号的短时功率谱,在某些频率上出现峰值,而在另一些

145、频率上出现谷值。这些峰值频率,也就是能量较大的频率,通常称为振峰频率。此频率不止一个,最主要的是第一个和第二个,它们决定了不同的语音特征。与视频信号类似,整个功率谱以基音频率为基础,形成了高次谐波结构,与视频信号差异在于直流分量较小。第第6 6章章 视频压缩技术视频压缩技术 3.听觉冗余 音频信号最终是给人耳听的,可以利用人耳的听觉特性人耳的掩蔽效应对音频信号进行压缩。第第6 6章章 视频压缩技术视频压缩技术 图6-27掩蔽效应第第6 6章章 视频压缩技术视频压缩技术 一个较强声音的存在掩蔽了另一个较弱声音的存在,这就是人耳掩蔽效应。图6-27为掩蔽效应的原理图,a,b,c为同时存在的3个频率

146、相近的声音,a声音最强,虚线以下表示是由于a存在,使人耳听不到的区域,因此这条虚线叫做a声音的掩蔽曲线,图中的c声音在虚线以下,所以听不到。把每个频率的这种掩蔽特性相叠加,就可以求出整个频带的掩蔽曲线。第第6 6章章 视频压缩技术视频压缩技术 例如,当两人正在马路边谈话时,一辆汽车从他们身旁疾驰而过,此时双方均听不到对方在说些什么,原因是相互间的谈话声音被汽车的噪声所掩盖,这就是小声音信号被大声音信号掩蔽掉了。人耳的掩蔽效应是一个较为复杂的心理学和生理声学现象,主要表现为频谱掩蔽效应和时间掩蔽效应。第第6 6章章 视频压缩技术视频压缩技术 (1)频谱掩蔽效应人对各种频率可听见最小声级叫绝对可听

147、域,在20Hz20kHz的可听范围内,人耳对频率34kHz附近的声音信号最敏感,对太低和太高频率的声音感觉都很迟钝。第第6 6章章 视频压缩技术视频压缩技术 如果有多个频率成分的复杂信号存在,那么绝对可听域曲线取决于各掩蔽音的强度、频率和它们之间的距离。图6-28(a)是存在多个声音,只能听到掩蔽曲线以上的情况,图6-28(b)是人耳对各种频率的绝对可听域曲线,将图(a)和图(b)结合就成为图(c)。低于图6-28(c)曲线的频率成分人就听不见了,当然不必传送了。第第6 6章章 视频压缩技术视频压缩技术 图6-28全频带掩蔽效应(a)多频率掩蔽曲线;(b)绝对可听域曲线;(b)(c)全频带掩蔽

148、效应第第6 6章章 视频压缩技术视频压缩技术 (2)时间掩蔽效应时间掩蔽效应分为前掩蔽、同期掩蔽和后掩蔽。在时域内,听到强音之前的短暂时间内,业已存在的弱音可以被掩蔽而听不到,这种现象称为前掩蔽;当强音和弱音同时存在时,弱音被强音掩蔽,这种现象称为同期掩蔽;当强音消失后,经过较长的持续时间,才能重新听到弱音信号,这种现象称为后掩蔽。三种时域掩蔽效应的时间关系如图6-29所示。第第6 6章章 视频压缩技术视频压缩技术 图6-29时间掩蔽效应第第6 6章章 视频压缩技术视频压缩技术 由图6-29可以看到,在前掩蔽期间人耳的听域具有上升的趋势,且持续时间较短,大约只有10ms。在后掩蔽期间,人耳的听

149、域具有下降的趋势,且持续时间较长,一般在100200ms之间,这是由于人耳收集声强的时间大约为200ms。在编码时,可将时间上彼此相继的一些取样值归并成块,以降低码率。人耳除具有听觉掩蔽效应外,还对大于2kHz以上的高频率声音信号具有方向特性,即人耳不能分别判断频率接近的高频声音信号的方向,在声音编码中可利用此特性,把多个声道信号的高频部分耦合到一个公共声道,以达到压缩编码的目的。第第6 6章章 视频压缩技术视频压缩技术 6.4.2语音数字编码标准语音的数字编码发展较早,应用也比较成熟。随着技术的发展,ITU-TS制定了一系列标准,与语音通信相关的有G.711、G.721、G.722、G.72

150、8、G.729、G.723.1等。其中G.711是最为熟知的PCM标准,码率为64kbs。语音信号的PCM数据流,除了作为数字电话应用外,还常常被作为其他的语音处理的原始数据。符合该标准的芯片也很便宜。G.721标准采用ADPCM(自适应差值PCM)算法,码率降到32kbs,而语音质量高于电话质量,可达到调幅广播质量。第第6 6章章 视频压缩技术视频压缩技术 G.722标准采用子带编码和ADPCM相结合的编码方法,音频带宽拓展到57kHz,能将PCM的224kbs(16kHz取样,14bit量化)码率压缩到64kbs,而语音质量达到广播质量。第第6 6章章 视频压缩技术视频压缩技术 低码率的编

151、码技术,多数是基于线性预测(LP)模型参数编码。G.728标准是基于短延时码激励线性预测(CELP)编码算法,码率为16kbs,语音质量与G.721标准相当。标准的CS-ACELP(使用共轭结构代数码激励线性预测)算法,码率降低到8kbs,而G.729语音质量仍与G.721标准的质量相当,适用于个人移动通信等。更低码率的G.723.1标准是5.3kbs与6.3kbs的双速率语音编码标准,为低码率实时多媒体通信所应用。已报道有更低码率的600bs语音编码算法,不久将会有相应的产品及标准出现。第第6 6章章 视频压缩技术视频压缩技术 6.4.3MUSICAM和AC-31.MUSICAM编码MUSI

152、CAM编码叫做掩蔽型自适应通用子频带综合编码与复用(MaskingPatternAdaptedUniversalSubbandIntegratedCodingAndMultiplexing)。MUSICAM不仅采用了子带编码,变换域编码等频域措施,而且在量化比特分配等环节还充分利用了人耳的听觉特性,如听觉阈值(即低于该值的声音便听不到),听觉掩蔽效应等声心理学因素。MUSICAM编码方法与MPEG-1标准中关于声音的部分ISOIEC11172-3是一致的,欧洲的数字声广播及高清晰度电视都采用此标准。第第6 6章章 视频压缩技术视频压缩技术 MUSICAM编码的取样速率为32kHz、44.1kH

153、z与48kHz三挡;采用16比特均匀量化;单音码率为32kbs、64kbs、96kbs、128kbs、192kbs五挡;立体声码率为128kbs、192kbs、256kbs、384kbs四挡,比只采用PCM编码的激光唱片数据率1.4Mbs要低得多。第第6 6章章 视频压缩技术视频压缩技术 针对不同的应用,MUSICAM有三个不同的层次,称为Layer、Layer和Layer。层次越高,性能越好,复杂度也越高。Laver是MUSICAM编码方案的简化形式,适合于消费者应用,例如用于家庭数字记录、温切斯特盘等场合。可提供192kbs的强度立体声。Layer比Layer有进一步压缩,它既可用于消费者

154、也可作专业用,如音频广播、电视、记录、通信和多媒体,可提供128kbs高质量声音和96kbs的高强度立体声。第第6 6章章 视频压缩技术视频压缩技术 Layer通过使用非均匀量化,自适应分割和量化值的熵编码来提高编码效率。这一层主要用于通信,尤其是需要很低码率的窄带ISDN,可提供96kbs的单通道声编码或高质量的64kbs立体声编码,既包含有强度立体声,也有L-R、L+R立体声。第第6 6章章 视频压缩技术视频压缩技术 关于立体声的形式,ITU-R、SMPTE、EBU的专家组建议用一个中心信道C和两个环绕声信道Ls、Rs加上基本的左和右立体声信道L和R作为基准的声音格式。这叫“32立体声”(

155、3向前2环绕信道),共需5个信道如图6-30所示。在用作图像的伴音时,三个向前的信道保证足够稳定的方向性和清晰度。MUSICAM编、解码器原理框图如图6-31所示。第第6 6章章 视频压缩技术视频压缩技术 图6-305声道立体声扬声器的安排第第6 6章章 视频压缩技术视频压缩技术 图6-31MUSICAM编、解码器原理方框图(a)编码器;(b)解码器第第6 6章章 视频压缩技术视频压缩技术 编码器的输入信号是每声道为768kbs的数字化声音信号(PCM信号),用滤波器组分割成等宽的32个子带(取样频率为48kHz时,子带宽度为750Hz)信号,将子带信号进行建立在听觉特性基础之上的自适应量化,

156、从而可以完成人耳察觉不到量化噪声的高质量声音编码,输出信号是经过压缩编码的数字音频信号。解码和编码相反,首先将输入的比特数据进行解压缩。然后经合成滤波器组将32个子带取样合成为32个音频取样,即由频域变换到时域,形成PCM样值。第第6 6章章 视频压缩技术视频压缩技术 MPEG-2音频标准(ISOIEC13818-3)也以64kbs的码率或低于这个码率提供较高质量的单音和通常的立体声信号。这个目标可以通过将取样率降低到16kHz、22.05kHz和24kHz来达到,提供的带宽达到7.5kHz、 10.5 kHz和 11.5 kHz。 和 MPEG-1(采 用MUSICAM的ISOIEC1117

157、2-3)相比较只是比特率的表和比特分配要改变。MPEG-1音频Layer、和的编码及解码原理全部保持。第第6 6章章 视频压缩技术视频压缩技术 2.AC-3编码美国高级电视系统委员会(ATSC)规定电视伴音压缩标准为杜比实验室开发的AC-3系统。该系统的音响效果为高保真立体环绕声。目前市场流行的称为“家庭影院”的音响系统多数采用此标准。第第6 6章章 视频压缩技术视频压缩技术 杜比AC-3规定的取样频率为48kHz,它锁定于27MHz的系统时钟。音频系统接受的基带音频输入可做到每个音频节目的码流多达6个音频信道。这6个信道是:中心、左(Left)、右(Right)、左环绕(LeftSurrou

158、nd)、右环绕(RightSurround)和低频增强(LFE,LowFrequencyEnhancement)。第第6 6章章 视频压缩技术视频压缩技术 LFE信道的带宽限于20120Hz,主信道的带宽为20kHz。美国的HDTV标准中AC-3可以对1到5.1信道的音频源编码。所谓0.1信道是指用来传送LFE的信道,其动态范围可达到100dB。音频节目有两类:主要业务(mainservice)和辅助业务(associatedservice)。主要业务包含所有音频节目的内容,除了对话。辅助业务是指定要和主要业务一起使用的,可以包括对话和解说词等。第第6 6章章 视频压缩技术视频压缩技术 经AC

159、-3压缩以后的码率根据用途不同有以下四种:(1)主要音频业务(mainaudioservice)384kbs;(2)单信道辅助业务(singlechannelassociatedservice)128kbs;(3)双信道辅助业务(twochannelassociatedservice)192kbs;(4)主要业务和辅助业务同时解码的组合码率572kbs。第第6 6章章 视频压缩技术视频压缩技术 AC-3编码器接受声音PCM数据,最后产生压缩数据流。AC-3算法通过对声音信号频域表示的粗略量化,可以达到很高的编码增益,其编码过程如图6-32(a)所示。第一步把时间域内的PCM样值变换成为频域内成

160、块的一系列变换系数。每块包含512个样值点,其中256个样值在连续的两块中是重叠的,重叠的块被一个时间窗相乘,以提高频率选择性,然后被变换到频域内。由于前后块重叠。每一个输入样值出现在连续两个变换块内。第第6 6章章 视频压缩技术视频压缩技术 因此,变换后的变换系数可以去掉一半而变成每块包含256个变换系数,每个变换系数以二进制指数形式表示,即一个二进制指数和一个尾数。指数集反映了信号的频谱包络,对其进行编码后,可以粗略地代表信号的频谱。同时,用此频谱包络决定分配给每个尾数多少比特数。如果最终信道传输码率很低,而导致AC-3编码器溢出,此时要采用高频系数耦合技术,以进一步减少码率。最后把6块(

161、1536个声音样值)频谱包络、粗量化的尾数以及相应的参数组成AC-3数据帧格式,连续的帧汇成了码流传输出去。第第6 6章章 视频压缩技术视频压缩技术 AC-3解码器基本上是编码的反过程,图6-32(b)是其原理方框图。AC-3解码器首先必须与编码数据流同步,经误码纠错从码流中分离出各种类型的数据,如控制参数、系数配置参数、编码后的频谱包络以及量化后的尾数等。然后根据声音的频谱包络产生比特分配信息,对尾数部分进行反量化,恢复变换系数的指标和尾数,再经过合成滤波器组由频域表示变换到时域表示,最后输出重建的PCM样值信号。第第6 6章章 视频压缩技术视频压缩技术 图6-32AC-3编、解码器原理方框

162、图(a)编码器;(b)解码器第第6 6章章 视频压缩技术视频压缩技术 图6-32AC-3编、解码器原理方框图(a)编码器;(b)解码器第第6 6章章 视频压缩技术视频压缩技术 思考题和习题思考题和习题1.填空题 (1)运动检测自适应技术,对静止图像或慢运动图像降低其_轴抽样频率,例如每两帧传送一帧;对快速运动图像降低其_抽样频率。(2)边缘检测自适应技术,对于图像的平缓区或正交变换后代表图像低频成分的系数_量化,对图像轮廓附近或正交变换后代表图像高频成分的系数_量化。第第6 6章章 视频压缩技术视频压缩技术 (3)奈奎斯特取样定理表明只要取样频率大于或等于模拟信号中最高频率的_倍,就可以不失真

163、地恢复模拟信号。(4)量化区间总数远远小于输入值的总数,所以量化能实现数据_。(5)节目流PS(ProgramStream)是针对那些_容易发生错误的环境而设计的系统编码方法。传输流TS(TransportStream)是针对那些_容易发生错误的环境而设计的系统编码方法。第第6 6章章 视频压缩技术视频压缩技术 (6)DVD光盘表层是_层,它能让较长波长(650780nm)激光透过,并读取下层上的坑、岛信息。当下层的信息读完时,接着由透不过表层的较短波长(635nm)的激光束聚焦于表层,读取表层的信息。(7)EFM编码(EighttoFourteenModulation,8-14比特变换调制)

164、就是用_比特来表示_比特数据。(8)时间掩蔽效应分为_掩蔽、_掩蔽和_掩蔽。第第6 6章章 视频压缩技术视频压缩技术 (9)杜比AC-3规定的6个信道是:_、_、_、_、_和_。(10)数码相机的像素指标只有_个,而所拍摄的数字图像的分辨率指标却可以有_个。第第6 6章章 视频压缩技术视频压缩技术 2.选择题(1)下列编码中不属于熵编码的是_。霍夫曼编码算术编码游程编码变换编码(2)下列编码中压缩数据量的是_。DCTDWTFFTVLC(3)小波变换使图像的能量分布发生了改变,图像的主要能量集中在_区。HHHLLHLL第第6 6章章 视频压缩技术视频压缩技术 (4)下列应用场合对图像质量要求最低

165、的是_。数字电视 会议电视 VCD 可视电话(5)下列标准中适合于数字电视的是_。JPEG JPEG2000 H.263 MPEG-2(6)下列标准中适合于远程医疗的是_。JPEG JPEG2000 H.263 MPEG-2(7)下列标准中适合于可视电话的是_。JPEG JPEG2000 H.263 MPEG-2第第6 6章章 视频压缩技术视频压缩技术 (8)下列光盘中采用单面双层记录信息的是_。CD VCD SVCD DVD(9)下列方法中H.264标准不采用的方法是_。感兴趣区域处理树状结构运动补偿1/4像素运动矢量估计整数变换(10)H.264标准新采用的图像帧是_。SP帧 I帧 P帧

166、B帧第第6 6章章 视频压缩技术视频压缩技术 3.判断题 (1)在相邻场或相邻帧的对应像素之间存在极强的相关性,称为时间相关性。(2)对彩色全电视信号直接进行PCM编码称为全信号编码。(3)BT.601建议对不同制式的信号采用相同的取样频率13.5MHz。(4)霍夫曼编码是一种可变长编码。(5)正交变换编码实现了压缩数据量压缩。第第6 6章章 视频压缩技术视频压缩技术 (6)数码相机已有一个LCD取景器再加平视取景器纯属多余。(7) 在H.263中运动的估值精度为整数像素, 在H.264中采用14像素精度。(8)MPEG-2的解码器不能对MPEG-1码流进行解码。(9)块间滤波器用来平滑块间的

167、亮度落差,重构后的图像更加贴近原始图像。(10)欧洲的数字声广播及高清晰度电视都采用MUSICAM标准。第第6 6章章 视频压缩技术视频压缩技术 4.问答题 (1)什么是分量编码?BT.601建议为何采用分量编码?(2)信源符号S1、S2、S3、S4、S5的出现概率分别为1/3、 1/4、 1/5、 1/6、 1/20,进行霍夫曼(Huffman)编码。(3)信源符号S1、S2、S3、S4、S5的出现概率分别为1/3、1/4、1/5、1/6、1/20,对符号序列S1,S3,S5,S3进行算术编码。第第6 6章章 视频压缩技术视频压缩技术 (4)游程编码是如何实现数据压缩的?(5)小波变换的作用是什么?小波变换压缩数据量吗?(6)JPEG2000标准的特点,举例说明其应用前景。(7)数字相机的主要技术指标有哪些?(8)什么是公共中间格式?CIF和QCIF、SUB-QCIF、4CIF和16CIF是什么关系?(9)什么是空间分辨率和时间分辨率的交换?(10)MPEG-2标准分为哪些类和级?(11)VCD、SVCD、DVD之间有什么差别?

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号