付婷+13213081－金锄头文库

资源描述

《付婷+13213081》由会员分享，可在线阅读，更多相关《付婷+13213081（46页珍藏版）》请在金锄头文库上搜索。

1、课程设计报告题目：多种静态图像算法比较学生姓名：付婷 3080 邵梓洪 1321319 任课教师: 梁凡月10日1.绪论11研究背景随着信息技术的发展，图像信息被广泛应用于多媒体通信和计算机系统中,但是图像数据的一种明显特点就是信息量大。具有庞大的数据量，如果不通过压缩，不仅超过了计算机的存储和解决能力,并且在既有的通信信道的传播速率下，是无法完毕大量多媒体信息实时传播的,因此,为了更有效的存储、解决和传播这些图像数据,必须对其进行压缩,因此有必要对图像压缩编码进行研究。由于构成图像的各像素之间,无论是在水平方向还是在垂直方向上都存在着一定的有关性，因此只要应用某种图像压缩编码措施提

2、取或者减少这种有关性, 就可以达到压缩数据的目的。数字图像的冗余重要表目前如下几种形式：空间冗余:规则物体和规则背景的表面物理特性都具有有关性，数字化后体现为数字冗余。例如：某图片的画面中有一种规则物体,其表面颜色均匀，各部分的亮度、饱和度相近,把该图片作数字化解决,生成位图后,很大数量的相邻像素的数据是完全同样或十分接近的,完全同样的数据固然可以压缩,而十分接近的数据也可以压缩,由于恢复后人亦辨别不出它与原图有什么区别,这种压缩就是对空间冗余的压缩。时间冗余:序列图像（如电视图像和运动图像)和语音数据的前后有着很强的有关性,常常涉及着冗余。在播出该序列图像时，时间发生了推移,但若干幅画面的同

3、一部位没有变化,变化的只是其中某些地方,这就形成了时间冗余。记录冗余:空间冗余和时间冗余是把图像信号看作概率信号时所反映出的记录特性,因此,这两种冗余也被称为记录冗余。编码冗余:同样长度的编码可以表达不同的信息。构造冗余:相似的,对称的构造如果都加以记录就浮现构造冗余。知识冗余：由图像的记录方式与人对图像的知识差别而产生的冗余。人对许多图像的理解与某些基本知识有很大的有关性。许多规律性的构造,人可以由先验知识和背景知识得到。而计算机存储图像时还得把一种个像素信息存入,这就形成冗余。视觉冗余：视觉系统对于图像场的注意是非均匀和非线性的,视觉系统不是对图像的任何变化都能感知。所谓的图像压缩编码技术

4、就是对要解决的图像数据按一定的规则进行变换和组合,从而达到以尽量少的数据流(代码)来表达尽量多的数据信息。在众多的图像压缩编码原则中,JPG和JPEG被广泛用于不同类型，不同辨别率的彩色和黑白静止图像。1.2 图像压缩技术的发展和现状. 图像编码技术发展历史194年提出电视信号数字化后,图像压缩编码的研究工作就宣布开始了。在这项技术发展的初期，限于客观条件，仅对帧内预测法和亚取样内查复原法进行研究，对视觉特性也做了某些极为有限但可贵的研究工作。196年J.O Neal对比分析了D和PCM并提出了用于电视的实验数据。96年进行了线性预测编码的实际实验。196年举办首届图像编码会议。70年代开始进

5、行了帧间预测编码的研究。8年代开始对运动估值和模型编码进行研究。进入90年代，TU-和IO制定了一系列图像编码国际建议，如H.26、JEG、MPEG1、H.6、.23、MEG4等。变换编码是1968年H.ndrew等人提出的,采用的是二维离散傅立叶变换,此后相继浮现用其她变换措施的变换编码,其中涉及二维离散余弦变换。1.22 图像编码技术的现状通过几十年的发展，图像编码技术业已成熟,某些国际建议的制定极大地推动了图像编码技术的实现和产业化，从而推动图像编码技术以更快的速度发展,目前的研究方向有两个:（1) 更好地实现既有的图像编码国际建议。研制出集成度更高、性能更好的图像编码专用芯片，使编

6、码系统成本更低、可靠性更高。解决好既有的图像编码系统开发中的技术问题。例如:提高图像质量、提高抗码能力等。（2)对图像编码理论和其她图像编码措施的研究。目前已经提出和正在进行研究的图像编码措施有：多辨别率编码、基于表面描述的编码、模型编码、运用人工神经网络的编码、运用分形几何的编码、运用数学形态学的编码等等。1.3 论文组织构造本文的重要内容是，简介三种静态图像压缩算法，即基于CT的PEG压缩算法，基于小波变换的JPE压缩算法及基于U正交变换的压缩算法,并用MATLAB进行实验仿真，比较各自的优缺陷。第1章绪论,对于图像压缩的研究意义、可行性、压缩技术的现状和发展等。第2章对上述的三种图

7、像编码算法一一做详尽的论述。第章是对这三种算法的一种仿真，并对实验成果作出分析，比较重建后图像的质量,各自的压缩比和信噪比。图像压缩编码理论算法 2.1 基于DCT的JG压缩算法2.1 图像分块对图像进行编码前，将每个分量图像分割成不重叠的88像素块, 每一种8像素块称为一种数据单元(DU)。在彩色图像中, JPEG分别压缩图像的每个彩色分量。虽然PEG可以压缩一般的红绿蓝分量,但在C空间的压缩效果会更好。这是由于人眼对色彩的变化不如对亮度的变化敏感，因而对色彩的编码可以比对亮度的编码粗糙些,这重要体目前不同的采样频率和量化精度上。因此，编码前一般先将图像从B空间转换到CbCr空间，再把各

8、分量图像分割成8数据块。在对图像采样时，可以采用不同的采样频率,这种技术称为二次采样。由于亮度比色彩更重要,因而对Y分量的采样频率可高于对Cb、r的采样频率，这样有助于节省存储空间。常用的采样方案有YUV42和YUV1。把采样频率最低的分量图像中一种DU所相应的像区上覆盖的所有各分量上的DU按顺序编组为一种最小编码单元(MCU)。对灰度图像而言,只有一种Y分量,CU就是一种数据单元。而对彩色图像而言，以4:1:的采样方案为例,则一种MC由4个Y分量的U、个b分量的U和个r分量的DU构成。.1.2离散余弦变换DC DCT变换在图像压缩中有诸多应用,它是PEG，PG 等数据压缩原则的重要数学基本

9、。在压缩算法中,先将输入图像划分为88或161,的图像块,对每个图像块作DCT 变换；然后舍弃高频的系数,并对余下的系数进行量化以进一步减少数据量；最后使用无失真编码来完毕压缩任务。解压缩时一方面对每个图像块做DT 反变换,然后将图像拼接成一副完整的图像。 CT 变换运用傅立叶变换的性质，采用图像边界褶翻将图像变换为偶函数形式, 然后对图像进行二维傅立叶变换，变换后仅涉及余弦项，因此称之为离散余弦变换。二维离散余弦正变换公式为 (-1）式中,。二维离散余弦逆变换公式为（212)式中,。JPEG采用的是88大小的子块的二维离散余弦变换。在编码器的输入端，把原始图像顺序地分割成一系列8的子块，子

10、块的数值在-28到127之间。采用余弦变换获得4个变换系数8。变换公式，如式(-3）所示。（2-1-3) 和度S有一定的变化，故 BW_Word(i,j)= S1S2 and B(i,j)=1 （23)式中, W(i，)是Cany算子检测的边沿,W_(,j)是文字的边沿点，S1和S表达索书号文字S分量相应的范畴。实验中,去S10,=00。经边沿点分量分割后的图像如图2-5所示,图中的边沿点为重要的文字边沿点。图-5 分割出的索书号图像.4文字图像行区域检测由于文字图像中解构相对比较复杂,其边沿点数量也就比较多,分布比较集中。因此文字图像区域中行记录平均的边沿点数量比非文字图像区域中的多，则:

11、 y（wod）y0 (nn-wod) (24）式中， y0(word）为文职图像区域的行平均边沿点个数，Ny0(on-ord)为非文字图像区域的行平均边沿点个数。虽然文字图像区域中也存在者字符见得间隔，必能完全保证每一行的边沿点数量都比非文字区域的行边沿点数量多。但是从概率角度可以觉得,文字图像区域的每一行边沿点适量不小于政府图像边沿点数量的行平均值，而非文字图像区域者相反,即: Ny（wod) Ny0（wod)N (no-wrd) (25）式中Ny（od）是文字图像区域中某一行的边沿点数量，Ny （nowor)是非文字图像区域中某一行的边沿点数量，y0（word)所示是整幅图像边沿点数量的行

12、平均值。边沿点数量记录如图-6所示。图2-6行方向边沿点数量记录检测出的也许文字图像应先进行合并,形成也许的文字图像区域。受文字图形自身构造繁简限度不同的影响,以及索书号也许有多行字符串构成，而两行字符串之间也许存在间隔,使的图像文字区域中的某些行的边沿点数量低于平均值,设立行方向的间隔阈值Ty=10.即去过两也许文字图像行的间距DTy，这经性合并,否则视为两个独立的文字图像区域。经也许文字图像行合并后，图2-1所示的索书号文字图像区域中存在两个索书号图像区域。目前其中涉及也许文字图像行最多的区域为索书号文字图像。25文字图像列区域检测在检测出行区域文字图像中进一步拟定。同理： N0(

13、word）Nx0(on-wrd) （2-）式中， Nx0（wor)为文字图像区域的列平均边沿点个数，x(nn-word）为非文字图像区域的列平均边沿点个数。文字图像区域列边沿点数两也有下属关系：（wod） Nx0(od）Nx（nonord) (2)式中 Nx（wod)是文字图像区域中某一列的边沿点数量,Nx (n-wr)是非文字图像区域中某一列的边沿点数量，Nx0（wor)所示是整幅图像边沿点数量的列平均值。边沿点数量记录如图-7所示。图-7 列方向边沿点数量记录检测出的也许文字图像应先进行合并,形成也许的文字图像区域。受文字图形自身构造繁简限度不同的影响，以及索书号也许有多列字符串构成,而两列字符串之间也许存在间隔，使的图像文字区域中的某些列的边沿点数量低于平均值，设立行方向的间隔阈值0.即去过两也许文字图像行的间距DxTx,这经性合并,否则视为两个独立的文字图像区域。经也许文字图像行合并后,图2-1所示的索书号文字图像区域中存在两个索书号图像区域。目前其中涉及也许文字图像行最多的区域为索书号文字图像。 2边界调节检测出的文字图像中,由于文字大小写，吱声构造等导致字符排列不争

展开阅读全文

付婷+13213081

最新文档