《第一章绪论剖析》由会员分享,可在线阅读,更多相关《第一章绪论剖析(40页珍藏版)》请在金锄头文库上搜索。
1、图像处理与计算机视觉,图像处理与计算机视觉是当前计算机科学的一个热门研究方向,它应用广泛,有良好的发展前景。 伴随着人工智能、模式识别学科的飞速发展,计算机视觉的研究正在不断升温,从日常应用中的光学字符识别(OCR)和汽车自动驾驶,到医学应用中的病灶检测与分析,再到未来人机智能交互领域的人脸识别、情感计算等。而图像处理是计算机视觉研究中必不可少的图像预处理环节。,第一章 绪 论,1.1 序言 1.2 图象处理技术的分类 1.2.1 模拟图象处理 1.2.2 数字图象处理 1.3 数字图象处理的特点 1.4 数字图象处理的主要方法及主要内容 1.4.1 数字图象处理方法 1.4.2 数字图象处理
2、的主要内容 1.5 数字图象处理的硬件设备 1.6 数字图象处理的应用 1.7 数字图象处理领域的发展动向,1.1 序言,概述 人类传递信息的主要媒介是语音和图象。据统计,人类所接受的信息,视觉信息占60%,听觉占20%,其他(味觉、触觉、嗅觉等)占20%。所以,作为传递信息的重要媒体和手段-图象信息是十分重要的(“百闻不如一见”,“一目了然”。但图象通信的发展大大落后于语音通信。 数字图象处理技术起源于20世纪20年代。1964年美国喷气推进实验室处理了太空船发回的月球照片,这标志着第三代计算机问世后数字图象处理的概念开始得到应用。其后,数字图象处理技术发展迅速,目前已成为工程学、计算机科学
3、、信息科学、统计学、物理学、化学、医学甚至社会科学等领域各学科之间学习和研究的对象。并且已给人类带来了巨大的经济和社会效益。,图象处理科学的作用和意义 (1)图象是人们从客观世界获取信息的重要来源。 人类获取信息的60%以上是通过视觉获得的。视觉信息的特点是信息量大,传播速度快,作用距离远,有心理和生理作用,再加上大脑的思维和联想,具有很强的判断能力。其次,人的视觉十分完善,人眼灵敏度高,鉴别能力强,不仅可以辨别景物,还能识别人的表情,因此,图象信息对人类是十分重要的。 (2)图象信息处理是人类视觉延续的重要手段。 人眼只能看到可见光(0.380.8um),而至今人类发现可成象的射线已有多种(
4、波长从0.003nm-100cm)。如:r射线、X射线、紫外线、红外线、微波等。这些射线均可成象。利用图象处理技术将这些不可见射线所成图象加以处理并转换成可见图象,大大延伸了人类视觉的功能,扩大了人类认识客观世界的能力。 (3)图象处理技术对国计民生有重要意义。,1.2 图象处理技术的分类,图象处理技术基本可分为两大类:模拟图象处理和数字图象处理。 1.2.1 模拟图象处理 模拟图象处理包括:光学处理(利用透镜)和电子处理。如:照相、遥感图象处理、电视信号处理等。 模拟图象处理的特点是:速度快,多为实时处理,理论上可达到光的速度,并可同时并行处理。电视图象信号是模拟图象处理的典型例子,它处理的
5、是活动图象,25帧/秒。 模拟图象处理的缺点是:精度较差,灵活性差,很难有判断能力和非线性处理能力。 1.2.2 数字图象处理 数字图象处理一般都用计算机或实时的硬件进行处理,因此也称为计算机图象处理。,数字图象处理的优点是:处理精度高,处理内容丰富,可进行复杂的非线性处理,有灵活的变通能力,一般来说只要改变软件就可改变处理内容。 其缺点是:处理速度较慢,特别是进行复杂的处理时更是如此。 一般用它处理静止画面居多,如果实时处理常规精度的数字图象需要具有100Mips的处理能力;其次是分辨率及精度尚有一定限制。如:常规精度图象为512X512X8bit,分辨率高的可达2048X2048X12bi
6、t,如果精度及分辨率再高,所需处理时间将显著增加。 广义上说,一般的数字图象很难为人所理解,因此,数字图象处理也离不开模拟技术,为实现人机对话和自然的人机接口,特别需要人去参与观察和判断的情况下,模拟图象处理技术是必不可少的。,1.3 数字图象处理的特点,数字图象处理的特点: (1) 图象数据量大 一幅单色512X512(256级灰度)图象数据量达256kB; 一幅彩色640X480(24位真彩色)数据量达900kB; X射线照片一般有64256kB的数据量; 而一幅遥感图象的数据量可达数十MB。 (2)图象处理技术综合性强 图象处理技术涉及通信技术、计算机技术、电子技术、电视技术,以及数学物
7、理等方面的基础知识。 (3)图象信息理论与通信理论密切相关 将通信中的一维时间问题,推广到了图象中的二维空间问题。,1.4 数字图象处理的主要方法及内容,1.4.1 数字图象处理方法 数字图象处理方法大致可分为两大类:空域法和变换域法。 1、空域法 把图象看作是平面中各个象素组成的集合,直接对这一二维函数进行相应的处理。空域处理法主要有以下两种: (1)邻域处理法 包括:梯度运算,拉普拉斯算子,平滑算子和卷积运算等。 (2)点处理法 灰度处理,面积、周长、体积、重心、中心计算等。 2、变换域法 变换域法首先对图象进行正交变换,得到变换域系数阵列,然后再实施各种处理,处理后再反变换到空间域,得到
8、处理结果。 包括:滤波、数据压缩、特征提取等处理。,1.4.2 数字图象处理的主要内容 包括:图象信息的获取、存储、传送、处理、输出和显示。 1、图象信息的获取(Image information acquisition) 这一过程主要包括摄取图象、光电转换及数字化等几个步骤。主要是把一幅图象转换成适合输入计算机或数字设备的数字信号。获取图象的主要方法有:电视摄象机、飞点扫描器、扫描鼓、扫描仪、显微光密度计、及红外摄象仪、多光谱象机等。 2、图象信息的存储(Image information storage) 图象信息的特点是数据量大。一般作档案存储主要采用磁带、磁盘或光盘。为解决海量存储问题
9、主要研究数据压缩、图象格式及图象数据库技术等。 3、图象信息的传送(Image information transmission) 图象信息的传送可分为系统内部传送与远距离传送。内部传送多采用DMA技术以解决速度问题,外部远距离传送主要解决占用带宽问题。目前,已有多种国际压缩标准来解决这一问题,图象通信网正在逐步建立。,4、数字图象处理(Digital image processing) 数字图象处理主要包括以下内容:几何处理、算术处理、图象增强、图象复原、图象重建、图象编码、图象识别、图象理解等。 (1)几何处理 几何处理主要包括:坐标变换,图象的放大、缩小、旋转、移动,多个图象配准,全景畸
10、变校正,周长、面积、体积计算等。 (2)算术处理 算术处理主要对图象施以加、减、乘、除等运算,该处理主要针对象素点进行,非常有用,如医学图象的减影处理就有显著的效果。 (3)图象增强 图象增强处理主要是突出图象中感兴趣的信息,而减弱或去除不需要的信息,从而使有用信息得到加强,便于区分或解释。主要方法有:直方图增强、伪彩色增强法、灰度窗口等技术。,(4)图象复原 图象复原处理的主要目的是去除干扰和模糊,恢复图象的本来面目。如去噪就属于复原处理。图象噪声包括随机噪声和相干噪声,随机噪声干扰表现为麻点干扰,相干噪声表现为网纹干扰。去模糊也是复原处理的任务,这些模糊来自透镜散焦,相对运动,大气湍流,及
11、云层遮挡等。这些干扰可用维纳滤波、逆滤波、同态滤波等方法加以去除。 (5)图象重建 几何处理、图象增强、图象复原都是从图象到图象的处理,而重建处理则是从数据到图象的处理。该处理的典型应用就是CT技术。图象重建的主要算法有代数法、迭代法、傅立叶反投影法、卷积反投影法等,其中以卷积反投影法运用最为广泛,因为它的运算量小、速度快。值得注意的是三维重建算法发展很快,而且由于与计算机图形学相结合,把多个二维图象合成三维图象,并加以光照模型和各种渲染技术,能生成各种具有强烈真实感及纯净的高质量图象。三维重建技术也是当今颇为热门的虚拟现实和科学可视化技术的基础。,(6)图象编码 图象编码研究属于信息论中信源
12、编码范畴,其主要宗旨是利用图象信号的统计特性及人类视觉的生理学及心理学特性对图象信号进行高效编码,即研究数据压缩技术,以解决数据量大的矛盾。一般,图象编码的目的有:减少数据存储量;降低数据率以减少传输带宽;压缩信息量,便于特征提取,为识别作准备。 按年代划分,图象编码方法可大致分为两类:第一代和第二代编码法。以去除冗余为基础的编码方法(19481988)称为第一代编码。如:PCM、DPCM、M、亚取样编码法;变换编码中的DFT、DCT、Walsh-Hadamard变换等方法及以此为基础的混合编码法均属于经典的第一代编码法。而第二代编码法多是1980年代以后提出的新的编码方法,如:金字塔编码法、
13、Fractal编码、基于神经元网络的编码方法、小波变换编码法、模型基编码法等。现代编码法的特点是:充分考虑人的视觉特性;恰当地考虑对图象信号的分解与表述;采用图象的合成与识别方案压缩数据率。 在多媒体应用中,常用编码标准有:JPEG、H.261、H.263、MPEG等。,(7)模式识别 模式识别是数字图象处理的又一研究领域。模式识别方法大致有三种:统计识别法、句法结构模式识别法、模糊识别法。 统计识别法侧重于特征;句法结构识别侧重于结构和基元;模糊识别法是把模糊数学的一些概念和理论用于识别处理。在模糊识别处理中充分考虑人的经验,同时也考虑了人的非逻辑思维方法及人的生理、心理反映,该方法目前尚处
14、于研究阶段,方法还不成熟。 (8)图象理解 图象理解是由模式识别发展起来的方法。该处理输入的是图象,输出的是一种描述。这种描述并不仅是单纯的用符号作出详细的描绘,而且要利用客观世界的知识使计算机进行联想、思考及推论,从而理解图象所表现的内容。图象理解也叫景物理解。在这一领域还有许多问题需要深入研究。 以上8项任务就是图象处理所涉及的主要内容。,5、图象的输出与显示 图象处理的最终目的是为人或机器提供一幅便于解释和识别的图象,因此,图象输出也是图象处理的重要内容之一。图象输出的方式有硬拷贝和软拷贝两种。 硬拷贝方法常用的有:打印、照相等。 软拷贝方法主要有以下几种。 (1)CRT显示 (2)液晶
15、显示器 (3)场致发光显示器,1.5 数字图象处理的硬件设备,数字图象处理的硬件构成如下图所示。早期的数字图象处理系统为提高处理速度,增加容量,都采用大型机。后来发展成以小型机为主的系统,如:VAX/750等机型。现在的图象处理系统向着两个方向发展,一是微型图象处理系统,主机为PC机,配以图象卡及显示设备就构成了最基本的微型图象处理系统。另一发展方向是向大型机方向发展,以解决大数据量与处理能力之间的矛盾。 当前,要从根本上解决处理能力、速度与数据量巨大的问题,还应发展阵列机和并行处理技术。因此,并行处理技术不仅是计算机科学中的重要研究对象,在实时图象处理中也是很重要的。,图象输入设备,A/D,
16、主计算机,D/A,监视器,键盘/显示器,1.6 数字图象处理的应用,应用示例: (1)遥感 (2)医学应用 (3)在通信中的应用 (4)工业生产的质量控制 (5)安全保障、公安等方面的应用 (6)教学和科研领域 (7)电子商务 (8)物联网 (9)在电力系统中的应用,图象质量自动调整,多模态生物特征融合 音视频特征关联模型 多模态生物特征数据库 多层级融合策略与框架 生物特征鉴别平台,Biometric Recognition,指纹识别,人脸识别,北京颐和园高分辨率卫星影像。,水体界线的确定 在近红外图像上,水体呈黑色;,图像理解的困难,基于数字图象处理的炉膛火焰检测技术,1、传统火焰检测方法的主要缺点: 视场小。当煤种变化或负荷变化引起着火位置漂移时,将严重影响检测效果。 只能给出有无火焰的开关量信号。 抗干扰能力差。 2、基于数字图象处理火焰检测技术的功能: 视场大(传像光纤的视角可达80)。 应用边缘检测和图象分割技术,对火焰图像进行处理,可进一步分析炉膛火焰的燃烧状况,估算出有关参数。,火焰温度场,锅炉空气动力场试验应用,指