数字图象处理-模式识别的理论与方法

资源描述

《数字图象处理-模式识别的理论与方法》由会员分享，可在线阅读，更多相关《数字图象处理-模式识别的理论与方法（61页珍藏版）》请在金锄头文库上搜索。

1、第 10 章模式识别的理论和方法一个图像识别系统可分为三个主要部分。其框图如图(10.1)所示。(1)图像信息的获取；(2)信息的加工和处理，抽取特征；(3)判断或分类。图101 图像识别系统框图被识图像图像获取信息处理特征抽取判决结果10. 1 概述模式识别的主要方法可分为两大类：l 统计学方法l 语言学方法两类方法的不足：l 第一种方法没有利用图像本身的结构关系l 第二类方法没有考虑图像在环境中受噪声的干扰10. 2 统计模式识别法1)常用的决策规则l 基于最小错误率的贝叶斯决策在图像识别中，我们总希望尽量减少分类错误，利用贝叶斯（Bayes）公式能够得到错误率最小

2、的分类规则，这就是基于最小错误率的贝叶斯决策。10. 21 决策理论方法设: 为状态下观察 X 类的条件概率密度；为状态下观察 X 类的条件概率密度；利用贝叶斯公式：得到的条件概率称为状态的后验概率。基于最小错误率的贝叶斯决策规则为：如果，则把X归类为；如果，则把X归类为。l 基于最小风险的贝叶斯决策最小风险的贝叶斯决策是考虑各种错误造成损失而提出的决策规则。2 线性判别函数线线性判别别函数是指判别别函数是图图像所有特征量的线线性组组合，即式中代表第i个判别函数；是系数或权；为常数项或称为阈值。在两类之间的判决界处有下式的形式。(104)(105)3. 最小距离分类器线

3、性分类器中重要的一类是用输入模式与特征空间中作为模板的点之间的距离作为分类的准则。假设有m类，给出m个参考向量与模式类相联系。4. 最近邻域分类法在最小距离分类法中，取一个最标准的向量作为代表。将这类问题稍微扩张一下，一类不能只取一个代表，把最小距离的概念从一个点和一个点间的距离扩充到一个点和一组点之间的距离。这就是最近邻域分类法的基本思路。（1020）式(1020)是一个二次型判别函数。通常二次型判别函数的决策边界是一个超二次曲面。5. 非线性判别函数统计学习理论是一种小样本统计理论，它为研究有限样本情况下的统计模式识别和更广泛的机器学习问题建立了一个较好的理论框架，同时也发展了一种新

4、的模式识别方法支持向量机，能够较好地解决小样本学习问题。1024 统计学习理论与支持向量机图1034 机器学习的基本模型有三类基本的机器学习问题:模式识别函数逼近概率密度估计经验风险最小化并不一定意味着期望风险最小，学习机器的复杂性不但与所研究的系统有关，而且要和有限的学习样本相适应。l支持向量机支持向量机（Support Vector Machines，简称SVM方法）是实现统计学习理论的一种具体方法，其主要内容在1992年1995年间才基本完成，目前仍处在不断发展阶段。设：线性可分样本为，i=1，n，是类别标号。d维空间中线性判别函数的一般为，分类面方程为： (10161)而要求分

5、类线对所有样本正确分类，就是要求它满足i=1，2，n (10162) 因此，满满足上述条件且使最小的分类类面就是最优优分类类面。过两类样本中离分类面最近的点且平行于最优分类面的超平面H1、H2上的训练样本就是式(10162)中使等号成立的那些样本，它们叫做支持向量（Support Vectors）。因为它们支撑了最优分类面，最优分类面的示意图如下图，图中用圆圈标出的点为支持向量。图1039 D4和D84组成的纹理图像图1040 D5和D92组成的纹理图像图1042 自建的测试图像图1041 D12和D17组成的纹理图像图1043 自建的测试图像1 0 .3句法结构模式识

6、别统计决策识别法的基本做法是首先从待识别模式中提取特征参数，然后用这些特征参数把模式表达为特征空间中的点，然后再根据各点之间的距离进行分类和识别。缺点： l 对比较复杂的模式需要较多的特征才能描述它，而特征提取是比较困难的环节，对于同一模式往往有不同的抽取方法，就目前来看尚没有统一的理论依据。l简单的分类并不能代表识别，对于复杂的模式，识别的目的并不是仅仅要求把它分配到某一类别中去，而且还要对不同的对象加以描述，在这方面统计决策法就有极大的局限性。l 句法结构模式识别法主要着眼于模式结构，采用形式语言理论来分析和描述模式结构，因此，它具有统计识别法所不具备的优点。10.3.1 形式语言

7、概述所谓句法结构就是将一个复杂的模式一部分一部分地加以描述，将复杂的模式分成若干子模式，如此分下去直至最简单的子模式（或称基元）为止。10.3.2 句法结构方法预处理主要包括编码、滤波、复原、增强及缝隙填补等一系列操作。基元抽取包括分割、特征（基元）抽取。基元的选择要尽可能少，而且容易被识别。结构分析可判别所得到的表达式在句法上是否正确。如果句法是正确的，就能得到模式的完整描述，即一个剖析式或剖析树。句法方法在以下领域多有应用：）波形分析；）声音识别与理解；）文字识别；）二维数学表示式；）指纹分类；）图像分析与理解；）机器部件识别；）自动视觉检查；）LANDSAT资源勘探用

8、陆地卫星数据解释等。10.4 模糊集识别法简介在模式识别中，有些问题是极其复杂的，要使计算机识别某一模式，就要分析综合所有的特征，计算和比较大量的信息后才能作出判断。而人在识别过程中只根据一些模糊的印象就可以做到较准确的识别。10.4.1 模糊集合及其运算 1. 模糊子集l没有明确外延的概念就称作模糊概念l论域是指被讨论的全体对象，有时也称为空间，论域元素总是分明的l论域中元素从属于模糊集合的程序不是绝对的0或1，它可介于0和1之间l在模糊数学中，把元素对普通集合的绝对隶属关系加以灵活化，提出隶属度的概念l隶属度用隶属函数来描述1. 隶属原则和模糊模式识别的直接方法设是论域U上的n个模糊子集

9、，若对每一个都建立一个从属函数，对于任一元素，若满足(10106)则认为隶属于，这就是隶属原则。10.4.2 模糊模式识别的方法例子：任何三角形都可用三个边a、b、c及三个顶角A、B、C来表示。把等腰三角形、等边三角形、直角三角形、等腰直角三角形看成是模糊集、、、。要运用直接方法识别，首先要确定它们的从属函数。取论域：，其中A、B、C表示三角形的三个内角，由此，可定义它们的从属函数，进一步求得模糊几何图形的从属度。设、、、、分别为等腰三角形、直角三角形、等边三角形、等腰直角三角形及非典型一般三角形的从属函数，则有：(10107)(10108)(10109)(10

10、110)(10111) 如果有三角形甲，其内角分别为、、；三角形乙，其内角分别为、、，根据隶属原则能确定它们分属哪一类三角形。由隶属原则，判定三角形甲是直角三角形。由隶属原则，判定三角形乙是一般三角形。相似系数有夹角余弦、相关系数等几种定义。如果用表示样本与样本之间的距离，则也有如下一些距离的定义：3. 模糊聚类分析（）绝对值距离(10125)（）欧氏距离(10126)（）马氏距离(10127)式中V是一个阶的协方差矩阵，其元素为：(4) 兰氏距离(10128)聚类分析的基本思想是将比较接近的样本归为一类。系统聚类法可分三个步骤进行：l第一、计算各样本之间距离，将距离最

11、近的两点合并为一类；l第二、定义类与类间的距离，将最近的两类合并为新的一类；（类与类之间的定义有最小距离法、最大距离法、中间距离法、重心法等）l第三、反复做第二步，使类与类之间不断合并，最后完成聚类分析。 10.5 模式识别的几种应用模式识别的应用较广，大致可有如下几个方面：字符识别；医学诊断；遥感图像解译；人脸和指纹鉴别；污染监测；自动检查和自动化；可靠性；社会经济；语音识别和理解；考古等。1051 生物特征识别l 指纹识别指纹具有两大特性:1) 没有两个人的指纹是相同的；2) 当指纹不受损伤时终生不变。首先，指纹分为七类（平斗、左箕、右箕、平弓、帐弓、左双箕、右双箕）。第一类再分为十八

12、个小类，然后测量斜率。总的过程是分类、分层、分窗口，在这个过程中包括细化，连接断线等处理; 尔后整个窗口用一个树代表，树的每一个分支是窗口中的一根隆线，然后找出文法; 最后做一树状自动机。（1）人脸识别系统的基本组成参数人脸图像库人脸检测定位特征提取和选择训练图像预处理识别特征提取和选择图像预处理人脸检测定位待测人脸图像训练过程识别过程l 人脸识别（2）. 人脸识别基本算法基于几何特征的方法该方法要求选取的特征矢量有一定的独特性，既要反映不同人脸的差异，还要具有一定的弹性，以减少或者消除光照差异等影响。几何特征向量是以人脸器官的形状和几何关系为基础的特征向量，其分量通

13、常包括人脸指定两点间的欧式距离、曲率、角度等。基于神经网络的方法早期用于人脸识别的神经网络主要是Kohonen自联想映射神经网络，当人脸图像受噪声污染严重或部分缺损时，用Kohonen网络恢复完整的人脸的效果较好。Cottrell等人使用级联BP神经网络进行人脸识别，对部分受损的、光照有所变化的人脸图像识别能力也较好。基于代数特征的方法这类算法是采用代数特征向量，即人脸图像在由“特征脸”张成的降维子空间上的投影。基于代数特征识别的主要原理是利用统计方法提取特征，从而形成子空间进行识别。（3）当前主流算法1）特征脸（eigenface）算法特征脸方法的优点：图像的原始灰度数据直接用来学

14、习和识别，不需要任何低级或中级处理；不需要人脸的几何和反射知识；通过低维可以有效的对高维数据进行压缩；与其它匹配方法相比，识别简单有效。特征脸方法存在的不足：图像中所有的像素被赋予了同等的地位，可是角度、光照、尺寸及表情等干扰会导致识别率下降，因此，须先进行尺度归一化处理；在姿态和光照变化时识别率明显下降；要求背景单一，；学习时间长，只能离线计算。2）弹性图匹配方法弹性图匹配方法（Elastic Graph Matching）是一种基于动态链接结构(Dynamic Link Architecture，DLA)的方法。它将人脸用格状的稀疏图（即拓扑图）表示，图中的节点用图像位置的Gabor小波分解得到的特征向量标记，图的边用连接节点的距离向量标记。其优点是：人脸稀疏图（即拓朴图）的顶点采用了小波变换特征，对光照、位移、旋转及尺度变化都不敏感。弹性图匹配法能保留二维

展开阅读全文