模式识别45236.doc－金锄头文库

资源描述

《模式识别45236.doc》由会员分享，可在线阅读，更多相关《模式识别45236.doc（3页珍藏版）》请在金锄头文库上搜索。

1、1、模式识别主要由四部分组成：数据获取、预处理、特征提取和选择、分类决策。2、预处理的目的就是去除噪声，加强有用的信息。3、特征提取和选择是为了有效地实现分类识别，对原始数据进行变换，得到最能反映分类本质的特征。4、分类决策就是在特征空间中用统计方法把被识别的对象归为某一类。5、统计决策理论是处理模式分类问题的基本问题之一，它对模式分析和分类器的设计有着实际的指导意义。6、几种常用的决策规则：（1）基于最小错误率的贝叶斯决策（尽量减少分类的错误）（2）基于最小风险的贝叶斯决策（考虑各种错误造成的不同损失）（3）在限定一类错误率条件下是另一类错误率为最小的两类别决策（限制其中某

2、一类错误率不得大于某个常数而是另一类错误率尽可能小）（4）最小最大决策（5）序贯分类法（先用一部分特征来分类，逐步加入特征以减少分类损失）（6）分类器（基于上面的四种决策规则对观察向量x进行分类是分类器设计的主要问题）7、对观察样本进行分类是模式识别的目的之一。8、在分类器设计出来以后总是以错误率的大小，通常来衡量其性能的优劣。9、再利用样本集设计分类器的过程中，利用样本集估计错误率是个不错的选择。10、对于错误率的估计问题可分为两种情况：（1）对于已设计好的分类器，利用样本来估计错误率。（2）对于为设计好的分类器，需将样本空间分成两部分，即分为设计集和检验集，分别用以设计分

3、类器和估计错误率。线性判别函数1、在实际问题中，我们往往不去恢复类条件概率密度，而是利用样本集直接设计分类器。即首先给定某个判别函数类，然后利用样本集确定出判别函数类中的未知参数。2、将分类器设计问题转化为求准则函数极值的问题，这样就可以利用最优化技术解决模式识别问题。3、决策树，又称多级分类器，是模式识别中进行分类的一种有效方法，对于多类或多峰分布问题，该方法尤为方便。利用数分类器可以把一个复杂的多类别分类问题转化为若干个简单的分类问题来解决。它不是企图用一种算法、一个决策规则去把多个类别一次分开，而是采用分级的形式，是分类问题逐步得到解决。4、最近邻法也是一种分段线性分类器。非线

4、性判别函数1、若在数分类器的各节点上采用线性判别函数，就构成了一个分段线性分类器。2、分段线性判别函数是一种特殊的非线性判别函数，它确定的决策面是由若干个超平面段组成的。3、近邻法是分段线性判别函数的一种极端情况，即将各类中全部样本都作为“代表点”。4、所以的近邻法：最近邻法、k-近邻法、剪辑近邻法、压缩近邻法、可做拒绝决策的近邻法、最佳距离度量近邻法。特征的选择与提取1、特征选择和提取的基本任务是如何从许多特征中找到那些最有效的特征。2、可以把特征分为3类：（1）物理的；（2）结构的；（3）数学的。人们通常用物理和结构识别对象，但计算机使用数学识别对象。3、基本概念（1）特征

5、形成：根据被识别的对象产生出一组基本特征，它可以是计算出来的（当识别对象是波形或数字图像时），也可以用仪表或传感器测量出来的（当识别对象是事务或某种过程时），这样产生出来的特征叫做原始特征。（2）特征提取：原始特征的数量可能很大，或者说样本是处于一个高维空间中，通过映射（或变换）的方法可以用低维空间来表示样本，这个过程叫做特征提取。映射的特征叫做二次特征。所谓特征提取在广义上就是指一种变换。（3）特征选择：从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的，这个过程叫做特征选择。4、特征选择与提取的任务是求出一组对分类最有效的特征，因此需要一个定量的准则来衡量特征对分类的有效

6、性，常用的判据主要有：用于可分性判据的类内类间距离、基于概率分布的可分性判据、基于熵函数的可分性判据。5、特征提取的方法：按欧氏距离度量的特征提取方法、按概率距离判据的特征提取方法、按散度准则函数的特征提取器、基于判别熵最小化的特征提取。6、特征选择的任务是从一组数量为D的特征中选择出数量为d（Dd）的一组最有特征来，为此有两个问题要解决，一是选择的标准，即要选择出是某一可分性达到最大的特征组来；而是要找一个较好的算法，以便在允许的时间内找出最优的那一组特征。7、最优搜索算法“分支定界”算法；次优搜索算法（1）单独最优特征组合；（2）顺序前进法；（3）顺序后退法；增l减r法。8、特征选

7、择是一个组合优化问题，其解决方法有：（1）模拟退火算法；（2）Tabu搜索算法；（3）遗传算法。基于K-L展开式的特征提取前面是从模式类可分离性的观点讨论了特征提取的准则问题，下面我们将分析用较少量的特征对样本进行描述以达到降低特征空间维数的方法。1、对于一个全自动的人脸自动识别系统，其首要工作是人脸图像的分割以及主要器官的定位。另外，由于这里K-L变换方法在本质上依赖于图像灰度在空间分布上的相关性，因此还需要对人脸图像进行一系列的预处理，以达到位置校准和灰度归一的目的。2、达到图像校准目的的主要步骤：（1）进行图形旋转；（2）根据一定的比例关系进行图像剪裁；（3）进行图像缩小和放大

8、变换，得到统一大小的校准图像。完成上述工作之后，需要对校准图像做灰度拉伸，以改善图像的对比度。然后采用直方图修正技术使图像具有统一的均值和方差，以部分地消除光照强度的影响。3、模式识别问题往往包括5个阶段：（1）问题的提出和定义；（对一个实际的问题抽象成一个模式识别问题）（2）数据获取和预处理；对于已经确定的问题（分类目标），研究获取什么样的数据才能有效地实现模式识别任务；预处理一般分为两种情况：一是使数据的质量更好；而是样本集的预处理（没得到重视）。（3）特征提取和选择；在已经得到数据样本之后如何用数学的办法对数据进行必要的变换和选择，使所得的特征更易于分类。（4）分类器的设计；（5）分类及结果解释。对于监督模式识别情况，这一阶段就是用设计好的分类器对新的或者类别标号未知的样本进行分类；对于未监督模式识别情况，则往往需要将得到的分类进行解释，赋予各类一定的专业含义，同时也判断所得分类是否符合问题需要。4、印刷体汉字识别和离线手写体识别通常通过扫描仪把已经印刷或写在纸上的文字输入到计算机中，最为一副图像存储在计算机的存储器中，然后根据需要对这些图像做图像处理，从中提取出用于识别的特征。离线手写体识别则需要一种专门的输入设备，使得能在写字人写字的同时将所写的笔画轨迹、写字人用力等信息直接输入到计算机中。这样的数据不是图像形式，因此可以避免图像处理这一步骤。

展开阅读全文

模式识别45236.doc

最新文档