艾海舟数字图象处理课件

上传人:第*** 文档编号:35906091 上传时间:2018-03-22 格式:PDF 页数:218 大小:5.77MB
返回 下载 相关 举报
艾海舟数字图象处理课件_第1页
第1页 / 共218页
艾海舟数字图象处理课件_第2页
第2页 / 共218页
艾海舟数字图象处理课件_第3页
第3页 / 共218页
艾海舟数字图象处理课件_第4页
第4页 / 共218页
艾海舟数字图象处理课件_第5页
第5页 / 共218页
点击查看更多>>
资源描述

《艾海舟数字图象处理课件》由会员分享,可在线阅读,更多相关《艾海舟数字图象处理课件(218页珍藏版)》请在金锄头文库上搜索。

1、说说明明“数字图象处理” 是一门面向计算机专业高年级本科生和研究生开的 选修课,本课件是为了配合该课程的教学编制的,参考了多方面的材 料,提供丰富的链接,便于不同程度的学生自学时参考。作为面向计 算机专业学生开的课程,不仅要讲授基本原理和技术,还需要注重数 据结构、算法、工具及编程实践方面的训练。艾海舟,2001 艾海舟,数字图象处理(多媒体课件) , (第二版) , 清华大学计算机系,2001 年 7 月。序序本课件是为了配合数字图象处理课程的教学需要制作的, 考虑远程教 育的需求,采用 html 语言制作,在讲解基本原理和方法的基础上, 注重实践和培养解决实际问题的能力,并提供程序实例,便

2、于更多的 读者学习数字图象处理这门需要编程实践的课程。本课件在制作时,针对计算机专业学生的特点,在讲解基本图象处理 技术的基础上,特别重视编程实践,要求学生不仅在原理和技术上, 而且要在程序设计的层次上熟练掌握图象处理技术。 因此我收集了各 种资料,包括标准测试图象、图象处理源代码、演示程序、各种相关 工具,当然还有许多相关的文本资料,特别是万维网(WWW)上的 丰富资料,分门别类,制作了一张光盘供学生学习参考。特别要说明 的是,我所收集的资料并不局限于数字图象处理,它还包含了计算机 视觉、模式识别、图象与视觉计算等课程所涉及的广泛内容,以及十 分丰富的资源链接索引, 对于相关学科的研究人员和

3、研究生也具有重 要的参考价值。第第一一章章概概述述目目录录1. 什么是数字图象? 2. 数字图象处理系统的基本组成结构 3. 数字图象处理的应用 4. 数字图象处理中的数据结构作业1 1. . 什什么么是是数数字字图图象象?数字图象是指由被称作象素的小块区域组成的二维矩阵。 对于单色即灰度图象而 言,每个象素的亮度用一个数值来表示,通常数值范围在 0 到 255 之间,即可用 一个字节来表示,0 表示黑、255 表示白,而其它表示灰度。如下图所示:图 1.1 灰度图象(128x128)及其对应的数值矩阵(仅列出一部分(26x31))彩色图象可以用红、绿、蓝三元组的二维矩阵来表示。通常,三元组的

4、每个数值 也是在 0 到 255 之间,0 表示相应的基色在该象素中没有,而 255 则代表相应的 基色在该象素中取得最大值,这种情况下每个象素可用三个字节来表示。图 1.2 彩色图象(128x128)及其对应的数值矩阵(仅列出一部分(25x31))数字图象是对二维连续光函数进行等距离矩形网格采样,再对幅度进行等间 隔量化得到的二维数据矩阵。 采样是测量每个象素值而量化是将该值数字化的过 程。数字图象在本质上是二维信号,因此信号处理(以一维信号为对象展开的课 程)中的基本技术(如 FFT)可以用在数字图象处理中。但是,由于数字图象只 是一种非常特殊的二维信号,反映场景的视觉属性,只是二维连续信

5、号的非常稀 疏的采样,希望从单个或少量采样中获得有意义的描述或特征,无法照搬一维信 号处理的方法,需要专门的技术。实际上数字图象处理更多地依赖于具体应用问 题,是一系列的特殊技术的汇集,缺乏贯穿始终的严格的理论体系。数字图象处理是一个多学科交叉的领域,涉及光学、电子学、数学、摄影技 术、计算机技术等众多学科,是一个高度综合的技术学科。解释:数字图象处理是一门计算机的技术课程,而且是一种非常特殊的专业课程, 而非有系统理论体系的基础课程。本课程只讲述基本原理和一般方法,不涉及具体领域中的特殊方法,如医学 图象处理已经成为一个专门的研究领域,有许多特殊的处理方法。学生在学习时的感觉是内容的系统性不

6、强,涉及的知识面宽但不很深(高级 部分除外,如小波变换等),需要出色的综合能力。而在技术上需要很强的程序 设计能力,可以说图象处理是门对学生的技术能力即动手能力要求很高的课程。图象在计算机中表现为二维数据矩阵,难点是矩阵所涉及的各种变换与其在 信号原理中的对应关系。图象处理涉及很多变化参数,为了达到好的图象处理效果,参数的选择是关键。为了实现好的图象处理功能,方便的交互手段包括调整 参数、图象的显示、存储等是很重要的。相关资料:数字图象(图象处理基础在线讲义:http: /www.ph.tn.tudelft.nl/Courses/FIP)2 2. .数数字字图图象象处处理理系系统统的的基基本本

7、组组成成结结构构数字图象处理系统由图象数字化设备、 图象处理计算机和图象输出 设备组成,如下图所示:图 1.3 数字图象处理系统图象数字化设备:扫描仪、数码相机、摄象机与图象采集卡等图象处理计算机:PC、工作站等图象输出设备:打印机等3 3. . 数数字字图图象象处处理理的的应应用用随着微电子与计算机技术的高速发展,图象数字化设备如 CCD 摄象机、扫描仪、 数码相机、图象采集卡的成本大大降低,普通的微机已经可以胜任部分图象处理 任务,使得图象处理的应用越来越广泛,可以预见在不久的将来,图象及视频处 理的应用将与目前语音处理的应用一样变得日益普及和重要。图象处理的重要应用包括:遥感视觉监视、保

8、安工业检测与测量宇宙探险、军事侦察、高精度制导医疗诊断通讯影视业、娱乐、公众服务解释:数字图象处理是与模式识别与计算机视觉等学科紧密相关的学科方向。 数字 图象处理通常作为模式识别或计算机视觉系统的预处理部分,用于图象采集、变 换、特征提取等前期工作,如图象增强、几何矫正、边缘提取、轮廓跟踪等;而 模式识别则重点在于抽取有效特征, 分类和识别物体, 如指纹识别、 签字验证等; 计算机视觉的核心任务是景物理解,追求人工的视觉功能,如立体信息的获取, 运动分析等。4 4. .数数字字图图象象处处理理中中的的数数据据结结构构数字图象处理中常用的数据结构包括矩阵、链码、属性图等;此外还常用分 层表示的

9、数据结构,如金字塔和四叉树(pyramids and quadtrees)结构。数据结构是指数据的组织方式,对算法的选择和其实现的容易程度有明显的 影响。数据结构的选择在程序设计中是关键性的步骤。算法 + 数据结构 = 程序 (Algorithm + Data Structure = Program)逻辑 + 控制 = 算法(Logic + Control = Algorithm)本节是如下资料的摘译:Milan Sonka, Chapter 3, Data Structures in Image Analysis (.download_IPCVPRDIP of Milan Sonka dat

10、astructureinimageprocessing.htm)。建议读者阅读原文。4 4. .1 1 图图象象数数据据的的表表示示层层次次图象数据的表示层次反映图象处理的不同阶段, 表达图象数据的不同抽象 程度。总的来说有如下几个逐级升高的表示层次。象素层图象:由原始数据组成,是象素亮度的整数矩阵;分割图象:图象被分割为可能属于同一物体的区域;几何表示:2D 和 3D 形状信息;关系模型: 数据更高层次的抽象,使使用数据更为有效。4 4. .2 2 规规范范的的图图象象数数据据结结构构规范的图象数据结构有矩阵、链码、图、物体属性表、关系数据库等 (matrices,chains, graph

11、s, lists of object properties, relational databases, etc.)。它们不仅用于图象信息的直接表示,而且还是更复杂的图 象分层表示方法的基础,如金字塔和四叉树(pyramids and quadtrees)结构。矩阵:低层图象表示的最普通的数据结构,矩阵元素是整型数值;这类图 象数据通常是图象获取设备(摄象机、扫描仪等)的直接输出。链码:描述物体的边界,链码中的符号一般对应于图象基元的邻接关系。 如下图所示。链码可以用静态数据结构来表示,如 1 维数组,取其大小为链 码的最大可能长度;也可以用动态数据结构来表示,且这样在节省存储空间 方面更合适

12、。行程编码:通常用于图象矩阵中符号串的表示。例如 ,传真机就使用这 种方式。在二值图象中,行程编码仅记录图象中属于物体的区域,该区域表 示成以表为元素的表。 图象的每行表示成一个子表, 它的第一个元素为行号, 然后是两个纵坐标构成的项,第一个为行程的开始的纵坐标(列号),第二 个为行程的结束的纵坐标。 一行中可以有若干个这样的序列项。 如下图所示:行程编码也可用于含有多个亮度层次图象的表示,这时子表中必须记录序列 的亮度值。拓扑数据结构:图象描述成一组元素及其相互关系的图结构。例如,赋值 的属性图,区域邻接图。区域邻接图例子如下:关系结构:信息集中在语义上重要的图象组成部分(它们是图象分割的结

13、 果)即物体之间的关系上,适合用于高层次的图象理解工作。例如,使用关 系结构描述自然场景的示意图(物体及其关系属性表)如下:4 4. .3 3 分分层层数数据据结结构构分层数据结构将图象描述成若干不同粒度的层次,使算法可以根据需要将处 理控制在较小的数据量上;只有必要时,处理才会在最细的数据分辨率上进行。 两种典型的分层表示数据结构是金字塔和四叉树(pyramids and quadtrees)结 构。金字塔(pyramids)图象的 M-pyramid 金字塔结构是一个图象序列ML, ML-1, ., M0 ,其 中 ML是具有原图象分辨率的图象,即原图象本身,然后依次降低一倍分辨率 得到该

14、图象序列。当原图象的分辨率是 2 的整数幂时,M0则仅对应于一个象 素。当需要对图象的不同分辨率同时进行处理时,可以采用这种数据结构。 分辨率每降低一层,数据量则减少 4 倍,因而处理速度差不多提高 4 倍。M-pyramid 金字塔结构存储所有图象矩阵需要的象素个数为:一般而言,同时使用几个分辨率层次比仅使用单个层次优越。这些图象 可以表示成树状金字塔结构: T-pyramid. T-pyramid 是树结构,每个结点 有 4 个子结点,如下图所示:T-pyramid 金字塔结构的存储表示与 T-pyramid 相似,树的弧不必存储,这 是因为由于其结构的规范性树的子结点和父结点的地址都很容

15、易计算出来。四叉树(Quadtrees)四叉树是对T-pyramids的改进, 除叶子结点外每个结点有4个子结点(西 北 NW: north-western, 东北 NE: north-eastern, 西南 SW: south-western, 西南 SE: south-eastern).与 T-pyramids 一样,在每个层 次图象被分解 4 个象限,但无须保留所有的叶结点。如果父结点有 4 个与它 的值(如,亮度)一样的子结点,则无须保留这些子结点。如下图所示。分层图象表示的缺欠是: 依赖于物体的位置、方向和相对大小; 两个仅有微小差别的相似图象可能会具有非常不同的金字塔结构或四叉 树

16、结构; 甚至当两个图象描述的是完全相同而只是略微移动了的景物时, 可能会产 生完全不同的表示。说明:有关链接参考资料的自学问题课件中涉及相当多的通过链接方式访问的参考资料(如 htm/html 网页、pdf 或 word 文档,等等。),主要的目的是提供丰富的素材,便于不同程度的读者 自由学习,不是基本要求,感兴趣的读者可以参考。这种内容是传统教材无法实 现的,是电子课件的主要特点之一。学生如果能够充分发挥主观能动性,将会突 破课件自身内容局限性,对课程的学习十分有益。参参考考文文献献Milan Sonka, Chapter 3, Data Structures in Image Analysis (. .download_IPCVPRDIP of Milan Sonkadatastructureinimageprocessing.htm)。- -作作业业1. 编制读入并显示bmp格式的程序

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号