数字图像识别与解释

上传人:新** 文档编号:592529067 上传时间:2024-09-21 格式:PPT 页数:55 大小:482KB
返回 下载 相关 举报
数字图像识别与解释_第1页
第1页 / 共55页
数字图像识别与解释_第2页
第2页 / 共55页
数字图像识别与解释_第3页
第3页 / 共55页
数字图像识别与解释_第4页
第4页 / 共55页
数字图像识别与解释_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《数字图像识别与解释》由会员分享,可在线阅读,更多相关《数字图像识别与解释(55页珍藏版)》请在金锄头文库上搜索。

1、第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释数字图像处理北京大学计算机研究所陈晓鸥第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释第四节识别与解释3.4.1 图像分析引言3.4.2 图像分析系统的组成3.4.3 模式与模式类3.4.4 决策论法3.4.5 结构法第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.1 识别与解释:图像分析引言图像分析引言图像分析的定义图像分析的目标自动图像分析系统行为能力的概念化分类自动图像分析系统的现状第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释

2、3.4.1 识别与解释:图像分析引言图像分析的定义图像分析是一个发现、辨认和理解模式的过程,这些模式都与执行与图像相关的任务有关。图像分析的目标计算机图像分析的主要目的之一是,赋予某些具有感觉能力的机器,以类似人的大脑的能力。例如OCR第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.1 识别与解释:图像分析引言自动图像分析系统行为能力的概念化分类获取、发现信息:从背景中提取有关信息学习、应用知识:抽象、归纳信息特征的学习过程,并应用到新的对象中。构造、推理知识:从不完整的信息中构造推论出新的知识,并加以应用。第第三三章章 数数字字图图像像分分析析 第第四四节节

3、 识识别别与与解解释释3.4.1 识别与解释:图像分析引言自动图像分析系统的现状我们可以设计出这种系统,但仍然缺乏理论依据。有待人类视觉认识理论的进一步研究。我们可以做出在某一应用上超过人的能力的系统,但缺乏扩展性。过分依赖应用。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.2 识别与解释:图像分析系统组的成图像分析技术分类的三种基本范畴低级处理:图像获取、预处理,不需要智能中级处理:图像分割、表示与描述,需要智能高级处理:图像识别、解释,缺少理论,为降低难度,设计得更专用。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释图像分析技

4、术分类的三种基本范畴知识库知识库分割分割表示与描述表示与描述识别识别与与解释解释预处理预处理图像获取图像获取低级处理高级处理中级处理结果问题3.4.2 识别与解释:图像分析系统组的成第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释图像识别与解释的基本方法识别的统计分类方法:用向量形式表达模式;分派模式向量到不同的模式类。识别的结构方法:用符号匹配,模式被表示为符号形式(如形状数、串和树)图像解释的方法:图像解释技术是基于谓词逻辑、语义网络和特定产品的系统。3.4.2 识别与解释:图像分析系统组的成第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释

5、释3.4.3 识别与解释:模式与模式类模式与模式类模式的定义模式类的定义模式识别的定义常用的模式序列模式向量模式串模式树第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.3 识别与解释:模式与模式类模式的定义模式是图像中的一个对象或某些感兴趣本质的数量或结构的描述模式是由一个或多个描述子来组成,换句话说,模式是一个描述子的序列(名词“特征”经常被用来代指描述子)模式是一组特征或一组描述子第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释模式类的定义模式类是具有某些公共特征的模式的系列模式类用w1,w2,wM表示,M是类的个数模式识别的定义

6、根据图像中对象的特征组成的模式,确定对象是属于那一个模式类,即为模式识别模式与模式类举例已知汽车的长、宽、高(x1,x2,x3),希望识别出,大客车、小轿车、卡车(w1,w2,w3)3.4.3 识别与解释:模式与模式类第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释常用的模式序列模式向量、模式串、模式树模式向量模式向量用粗体的小写字母表示,如x,y形式如下:其中每一个xi代表第i个描述子,n是这种描述子的数量。模式向量被表示为一列或表示成x = (x1, x2, , xn)T,其中T指出是转秩x = x1x2.xn3.4.3 识别与解释:模式与模式类第第三三章章 数数

7、字字图图像像分分析析 第第四四节节 识识别别与与解解释释模式向量举例假设我们想描述三种蝴蝶花(多毛的、维吉尼亚、多色的)通过测量它们花瓣的宽度和长度。这里涉及一个两维的模式向量:其中x1、x2分别对应花瓣的长和宽三种模式类用w1、w2、w3表示x = x1x23.4.3 识别与解释:模式与模式类第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释 由于所有的花瓣在宽和长上都有某种程度的变化,所以描述这些花瓣的模式向量也将有变化,不仅在不同的类之间,而且也在类的内部在这种情况下每一种花变成二维欧几里德空间的一个点3.4.3 识别与解释:模式与模式类第第三三章章 数数字字图图

8、像像分分析析 第第四四节节 识识别别与与解解释释3.4.3 识别与解释:模式与模式类1234567x1 花瓣长x2 花瓣宽多毛的维吉尼亚多色的第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释对结果的分析 对花瓣长宽的测量,成功地将多毛的蝴蝶花与其它两种分离,但对于分离维吉尼亚和多色的是失败的。这个结论说明了分类的特性选择问题,在这个问题中,类的可分离性的程度,完全依赖于对模式尺寸测量的选择3.4.3 识别与解释:模式与模式类第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释模式串用于以对象特征的结构或空间关系作为模式的识别模式串举例:梯状的模式

9、3.4.3 识别与解释:模式与模式类abaaabbb(1) S-aA(2) A-bS (3) A-b第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释模式树 以分层目录结构排序的模式类,一般多采用树结构模式树举例3.4.3 识别与解释:模式与模式类图像图像城市城市田园田园城区城区内城内城市郊市郊公路公路 草地草地森林森林娱乐区娱乐区 商业区商业区娱乐区娱乐区 商业区商业区第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法决策论法决策论法的基本概念匹配最小距离分类器相关匹配第第三三章章 数数字字图图像像分分析析 第第

10、四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法决策论法的基本概念决策论识别法的定义设:模式向量:x = (x1, x2, ,xn)T,对于:M个模式类w1,w2,wM,寻找M个决策函数d1(x), d2(x), , dM(x),具有这样的特性:如果模式x属于模式类wi,那么:di(x) dj(x) j = 1, 2, , M; j i换句话说,如果一个未知模式x属于第i个模式类,把x代入所有的决策函数,di(x)的数值最大。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法决策论法的基本概念决策边界的定义对于模式x,如果决

11、策函数值有:di(x) - dj(x) = 0 此x值,被称为wi与wj的决策边界。通常用一个单一的函数标识两个类之间的决策边界,定义为:dij(x) = di(x) - dj(x) = 0 如果dij(x) 0 x 属于类wi 如果dij(x) 0 x 属于类wj第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法匹配最小距离分类器以蝴蝶花的例子为例:1为多色(w1)和多毛(w2 )的两种蝴蝶花,确定两个原形(或称模板)m1和m22对于一个未知模式向量x,判断x与m1和m2的距离,如果与m1的距离小于与m2的距离,则x属于w1,否则属于w

12、2 。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法1234567x1 花瓣长花瓣长x2 花瓣宽花瓣宽多毛的多毛的多色的多色的m1m2x第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法匹配最小距离分类器(1)算法思想:对于M个模式类wj j = 1,2,.,M为每一个模式类确定一个原形模式向量mj对于一个未知模式向量x,如果x与mi的距离最小,就称,x属于wi。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法匹配最小距离

13、分类器(2)最小距离分类器定义:1计算模式类wj的原形向量:mj = 1/Nj x j = 1,2, , M x wj其中Nj是属于模式类wj的模式向量的个数。通过计算已知属于wj的模式向量的各分量的均值得到原形模式向量mj第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法匹配最小距离分类器2计算x 与mi的距离dj(x) = | x mj | j = 1, 2, , M其中| a | = (aTa)1/2是欧几里德范式(平方和开方)3 决策如果,di(x) = min(dj(x) j = 1, 2, , M就说:x 属于wi第第三三章章

14、 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法匹配最小距离分类器改写成求最大的标准形式,决策函数为:dj(x) = xTmj 1/2mjTmj j = 1,2, , M如果,di(x) = max(dj(x) j = 1, 2, , M就说:x 属于wi4类wi和wj之间的决策边界是:dij(x) = di(x) - dj(x) = xT(mi mj) 1/2(mi mj)T(mi mj) = 0第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法(3)举例:多色的和多毛的蝴蝶花,用w1和w2

15、分别表示,有简单的原形向量m1 = (4.4, 1.3)T m2 = (1.5, 0.3)T决策函数是:d1(x) = xTm1 1/2m1Tm112 d2(x) = xTm2 1/2m2Tm212 决策边界的等式:d12(x) = d1(x) d21 2 8.9 = 0第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法1234567x1 花瓣长花瓣长x2 花瓣宽花瓣宽多毛的多毛的多色的多色的第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法匹配相关匹配(1) 相关匹配的基本思想:a

16、. 用样板子图像直接作为模式(不是用描述子)b. 通过子图像与原图像直接进行相关计算,把相关计算作为决策函数。c. 相关计算获得最大值的位置,就被认为匹配成功。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法相关匹配(1) 相关匹配基本思想第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法匹配相关性匹配Mx原点原点Nyf(x,y)(s,t)Jsw(x-s,y-t)Kt第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法匹配相关匹

17、配(2) 算法描述决策函数是相关函数c(s,t) = f(x,y)w(x-s,y-t) x y对图像的每一个点进行相关计算,只计算重叠部分。问题:在边界处将失去准确性,其误差与子图像的尺寸成正比第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法相关性匹配(3) 改进相关函数对振幅的变化太敏感,f(x,y)加倍,c(s,t)也加倍。用相关系数函数代替相关函数f(x,y) f(x,y)w(x-s,y-t) w(s,t)= f(x,y)f(x,y)2w(x-s,y-t) w21/2 x y x y(s,t)的值域为(-1,1)第第三三章章 数数

18、字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法相关性匹配(4) 对旋转和比例变化的分析当被匹配图像中,对象的尺寸和角度与模式不一致,此方法将失效。尺寸的正则化,解决空间比例的问题。正则化模板与原图。如果知道原图像的旋转角度,我们可以通过旋转原图像,对齐模式解决。如果被匹配的对象的角度任意,有结论:此方法不能用于这种问题。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:决策论法匹配相关性匹配(5) 关于空域计算相关函数,可以在频域计算。f(x,y)w(x,y) f(s,t)w(s,t)但在何种情况下,没有

19、更有优势的理论根据。相关系数方式只能在空域进行。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法结构法匹配形状数匹配串第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法结构法决策法,通过量化的方法处理模式,最大限度地忽略了模式形状的内在结构关系。结构法,则力求通过准确地抓住这些不同模式类的内在结构关系来进行模式识别。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法匹配形状数(1) 匹配形状数的基本思想通过比较两个对象边界的形状数的

20、相似程度,来匹配对象。例如:未知模式原形模式类第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法匹配形状数(2) 基本概念-a a.两个区域边界的相似级别k的定义:相同形状数的最大序号:即:当考虑用4向链码表示的封闭区域边界的形状数时,A和B具有相似级别k,如果满足s4(A) = s4(B), s6(A) = s6(B), s8(A) = s8(B), sk(A) = sk(B), sk+2(A) sk+2(B), sk+4(A) sk+4(B), ,这里s表示形状数,下标表示序号。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识

21、别别与与解解释释3.4.4 识别与解释:结构法匹配形状数(2) 基本概念-bb.两个区域边界A和B形状数的距离D(A,B) 相似级别的倒数:D(A,B) = 1 / k 距离满足如下性质:D(A,B) 0D(A,B) = 0 iff A=BD(A,C) maxD(A,B),D(B,C)第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法匹配形状数(3) 算法思想a. 用不同密度的网格划分边界区域,获得不同序数的形状数。b. 如果使用相似级别k,k越大说明越相似。c. 如果使用相似距离D,D越小说明越相似d. 可以利用相似树来进行判别第第三三章

22、章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法匹配形状数(4)举例假设我们有一个形状F,想在另5个形状(A,B,C,D,E)中找到与其最相似的形状ABCDEF第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法 这个问题类似于有五个原型形状,想找出一个给定的尚不确定的形状的最佳匹配的问题。这个问题可以利用相似树和矩阵来可视化468101214ABCDEFABCDEFBCDEFAAAABECFBEDDDCFCF BEA B C D E FABEDCF 6 6 6 6 6 8 8 10 8 8 8

23、12 8 8 8 第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法串匹配(1)串匹配的基本思想比较两个边界的串编码的相似程度,来进行匹配(2)三个基本概念设: 两个区域边界A和B已分别被编码为串a1a2an和b1b2bm。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法串匹配a.两个串的匹配数M: 当ak= bk 时我们说发生了一个匹配。令M代表A、B中匹配的总数。b.不匹配的符号数量Q:Q = max(|A|,|B|)- M 这里|arg|是字符串的长度。当且仅当A和B完全相同时,

24、Q = 0。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法串匹配c. A和B相似度的简便衡量R: R = M/Q = M / max(|A|,|B|) - M 因此,当A和B完全匹配时,R = ;当A和B中任何字符都不匹配时,M = 0,R = 0。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法串匹配(3)算法思想a.由于匹配是逐字符进行的,b.选择一个好的开始点,可以大大减少计算量。任何将两个串规则化为相同字符开头的方法都是有效的,只要这种方法不是穷举起点。c.最大的R给出了最

25、好的匹配。第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法串匹配(4)举例模式模式第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法串匹配现有两个模式类:模式类1:有、 5个样例模式类2:有、 5个样例第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法串匹配现将模式与模式类1的5个样例做串匹配,有R值的结果表: 第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法串匹配现将模式与模式类2的5个样例做串匹配,有R值的结果表: 第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释3.4.4 识别与解释:结构法 将模式与模式类2的5个样例做串匹配,有R值的结果表: 1.18 1.02 1.02 0.93 .89 将模式与模式类1的5个样例做串匹配有R值的结果表: 第第三三章章 数数字字图图像像分分析析 第第四四节节 识识别别与与解解释释请提问

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号