关于仿生模式识别技术研究与应用进展探究.doc

上传人:bao****ty 文档编号:132488774 上传时间:2020-05-16 格式:DOC 页数:23 大小:122KB
返回 下载 相关 举报
关于仿生模式识别技术研究与应用进展探究.doc_第1页
第1页 / 共23页
关于仿生模式识别技术研究与应用进展探究.doc_第2页
第2页 / 共23页
关于仿生模式识别技术研究与应用进展探究.doc_第3页
第3页 / 共23页
关于仿生模式识别技术研究与应用进展探究.doc_第4页
第4页 / 共23页
关于仿生模式识别技术研究与应用进展探究.doc_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《关于仿生模式识别技术研究与应用进展探究.doc》由会员分享,可在线阅读,更多相关《关于仿生模式识别技术研究与应用进展探究.doc(23页珍藏版)》请在金锄头文库上搜索。

1、关于仿生模式识别技术研究与应用进展探究 模式识别经过多年的发展,已形成了一系列经典的理论和方法。传统模式识别的目的是将对象( 样本) 进行分类,因此也被称作模式分类,传统模式识别认为所有可用的信息都包含在训练样本集中,考虑的出发点是特征空间中若干类别样本的最佳分类划分,代表性方法有Fisher 判别分析、支撑向量机( SVM)等。这些方法解决了很多问题,并在多个领域得到了成功应用,为科学发展和社会进步做出了巨大贡献,但这些传统方法也存在一些固有的缺陷:1) 对事物进行学习时通常至少需要两类才可进行“区分”,例如在人脸检测中,学习的任务仅是人脸这一个类别,但在训练分类器时,分类器需要学习“人脸”

2、和“非人脸”两种类型;2) 已训练好的分类器类别之间的最优分类边界是确定的,若要增加学习新类,则需要重新训练分类器,这将会打乱现有知识( 最优分类边界改变) ;3) 未经训练类别的样本很容易被误认为是已训练的某一类,分类器不能有效对其进行正确拒识,这是由于分类边界只是将一个无限特征空间划分为多个无限空间。 中国科学院半导体研究所王守觉院士通过分析人类认识事物的特点,提出了一种全新思想的模式识别方法-仿生模式识别( biomimetic pattern recognition,BPR)。仿生模式识别认为,事物具有“同源连续性规律”,即同类事物的两个不同样本之间,至少有一个渐变过程,在这个渐变过程

3、中的所有样本仍属于该类; 也可以这样认为: 同类样本在特征空间中是连续分布的,任意两个样本点之间具有某种连续变化的关系。“同源连续性规律”是现实中人类直观认识世界的普遍存在的规律,同时也是仿生模式识别方法用于提高对事物的识别能力的“先验知识”。引入“同源连续性规律”后,研究仿生模式识别如何对某类事物进行学习,就是研究在高维特征空间中如何对该类样本进行最优连续“覆盖”( 即对一类样本的“识”) ; 它不同于传统模式识别方法侧重于“别”,即如何在高维特征空间中对不同类样本进行最优“划分”。可见,在特征空间中对某一类样本的分布进行最优覆盖是仿生模式识别的首要目标,覆盖后在特征空间中形成的连续、闭合的

4、复杂几何形体区域赋予该类的属性; 则仿生模式识别的识别过程就是判断特征空间中待识别样本点是否落入此几何形体内。若是,则该样本点属于此几何形体所代表的类别; 否则认为不属于该类。仿生模式识别于2002 年被提出后,被迅速应用到多种识别任务中,获得了有效的识别结果,并展现出独特的优势:1) 仿生模式识别既能够“识”,又能够“别”,对于没有训练过的样本,不会将其错误归为已训练样本中的某一类,而是能够将其正确拒识,实际应用中误识率非常低;2) 仿生模式识别可以不断学习新事物( 类别) ,并且学习某类时不需要负样本( 非此类或他类样本) 参加训练,学习新类时不需要重新学习已知类,即不会影响原有已经学习好

5、的知识;3) 仿生模式识别在低训练样本数量情况下仍能获得较高的正确识别率,这得益于引入了“同源连续性规律“的先验知识,因而有效的信息不再局限于训练样本。低训练样本数、高识别率的特点,更适合一些不易获取大量训练样本的特殊场合下的识别任务。仿生模式识别由于其独特的优点,在国内逐渐受到关注,越来越多的研究机构加入研究队伍,从理论、方法以及应用等多方面开展研究,这些研究机构包括中科院半导体研究所、同济大学、中国农业大学、浙江工业大学、厦门大学、深圳大学、中科院苏州纳米技术与纳米仿生研究所、长沙理工大学、合肥工业大学、吉林大学、西安电子科技大学等众多高校和研究机构。仿生模式识别的研究成果不断涌现,先后用

6、于目标识别、生物特征识别、信号处理、医学图像识别、基因预测和近红外定性分析,涉及机器视觉、安防、农业、生物医学、通信以及互联网等众多领域,获得了有益的效果。2002 年迄今,在国内学术期刊发表的与仿生模式识别直接相关的论文有80余篇,相关的国内硕士和博士学位论文30 余篇,在国际期刊和会议上发表的论文40 篇左右,此外,还有3 本专著出版。仿生模式识别是我国自主创新的方法与技术,从提出至今,已有十多年的发展,但目前还没有对该技术的全面总结。本文旨在对仿生模式识别进行全面的综述。首先介绍仿生模式识别的基本原理,再对仿生模式识别的实现方法进行分析和对比研究,并给出了仿生模式识别在多个应用领域的使用

7、效果,最后探讨仿生模式识别的未来研究方向,希望能够为该方法的进一步发展和实际应用提供参考。1 仿生模式识别的基本原理1.1 仿生模式识别的基点-“同源连续性”规律 仿生模式识别把同一类事物称为“同源”,这里所谓的“同一类”是指在源头或原理上是相同的一类,而不是拼凑或合并而成的同一类。例如,在手写体汉字识别中,同为简体汉字的手写体认为是同源的; 如果手写体汉字中包含了简体和繁体两种字体,“简体”和“繁体”是不同源的,则认为是简体和繁体两类事物的归并。后文所提到的同类,若无特别说明,都是指“同源”同类。依据上述“同源”的定义,同类样本之间有如下“同源连续性”规律:自然界中待认识的事物,若两个事物同

8、类但不完全相等,则可以用一个渐变的或非量子化的过程来描述这两个事物之间的关系,在此变化过程中的所有事物与这两个事物同属一类。“同源连续性”规律可用数学描述为:在n 维特征空间Rn 中,假设A 为某一同类样本( 事物) 全体的集合,如果样本x,y A,则对于任意ε>0,必定存在一个集合B 满足如下条件:B =x1,x2,x3,x l x1 = x,xl = y,l ∈ N,ρ( xm,xm+1) < ε,1 ≤ m ≤ l - 1 A式中ρ( xm,xm+1) 表示样本xm与xm+1间的距离。1.2 仿生模式识别的

9、学习过程 基于1.1 节的“同源连续性”规律,两个同类样本间存在连续渐变的关系,并且位于这个渐变过程中的样本点仍属于同一类。仿生模式识别的目标就是把分布在特征空间中的同类样本实现连续覆盖,以二维空间的情况示意图所示。三角形、十字形、圆点表示分别表示三类不同样本,椭圆表示仿生模式识别采用某种覆盖方法在特征空间内形成类别子空间的“认识”方式。也就是说,仿生模式识别的学习过程,就是特征空间中对同类样本点进行连续覆盖的过程,不同的覆盖算法构成了仿生模式识别的学习算法。通常,特征空间Rn 是n≥3 的高维特征空间,某类事物样本分布子空间在这样的高维空间中是非常复杂的,实际设计学习算法时,将类别子空

10、间分解为多个封闭的简单几何形体空间( 如图1 三角形类所示,类别空间被分解成多个首尾相接的椭圆) ,则用这些简单几何形体的并近似原来的类别子空间,可使仿生模式识别的学习算法灵活、高效。1.3 仿生模式识别的识别过程 对于仿生模式识别而言,某一类事物的全体样本点在特征空间Rn 中的连续映射的“像”所构成的点集( 设为集合A) 是一个闭合的子空间,这个闭合的子空间因实际事物的不同,在特征空间中表现为不同维数的“流形”。现实中获取到的样本点往往包含噪声,因而实际应用仿生模式识别时,用特征空间中的集合Pa取代集合A; 其中x、y 是特征空间中的点,k 为选定的距离常数。因而,仿生模式识别的识别过程就是

11、判断特征空间Rn 中表示“被识别事物”的点( 未知样本点) 是否属于集合Pa,其中Pa =∪ ni = 1 Pai,Pai表示第i 个简单几何形体。仿生模式识别的识别过程在二维特征空间中,在二维特征空间R2中,假设A 事物样本点的全体为空间A( 现实中A 无法确定) ,y1、y2为训练样本,采用圆形作为覆盖单元,k 为距离常数,则分别以y1、y2为圆心、k 为半径的两个圆所代表的集合Pa1、Pa2的并构成集合Pa。识别过程即是判断特征空间中的未知样本点z 是否属于集合Pa。若是,则该样本点属于A 类; 若否,则不属于A 类。 综上所述,仿生模式识别与传统模式识别的差别传统模式识别仿生模

12、式识别基本出发点多类样本的区分一类类样本的认识理论基础所有可用的信息都包含在训练集中同源连续性规律数学工具统计学拓扑学学习方法高维空间的空间划分高维空间的复杂几何形体覆盖仿生模式识别为模式识别技术的发展开辟了一条新路径,同时也提出了实现仿生模式识别需要研究的多方面问题,目前的研究主要集中在如下几点:1) 类别子空间的拓扑流形分析: 仿生模式识别是一类一类地“认识”事物,在学习某类事物时,需要先分析该类训练样本点的分布,依据同类样本点在特征空间中的分布特性,确定这种分布具有何种拓扑属性,从而确定类别子空间在特征空间中的流形。在确定类别空间的流形及其维数后,仿生模式识别再考虑用何种覆盖方法。2)

13、覆盖方法研究: 研究发现,同一类样本在高维特征空间中的分布表现为一个非常复杂的几何形体,虽然具有一定的拓扑流形属性,但要实现对这个几何形体的覆盖会遇到很多困难,例如选择何种几何覆盖单元、如何确定覆盖的顺序、怎样进行连续覆盖等,这也就成为仿生模式识别研究的热点。3) 识别方法研究: 在确定使用哪种覆盖方法后,识别通常会比较简单,只需计算待识别样本点是否落入特征空间中表征某一类的几何形体内。若是,则将样本点识别为该类; 若否,则认为不属于该类。理论上,不同类事物在特征空间的覆盖形体不会交叉重叠,因此,决不会出现误识。然而,在工程应用实践中,所采集到的训练样本及待识别样本中往往包含不同程度的“噪声”

14、,特征提取过程中也会丢失一些信息,最终有可能导致类别空间重叠,需要解决处于重叠空间中未知样本的归属问题。除上述几个主要研究方向,也有学者将仿生模式识别思想其他方法相结合,从而提高该方法解决问题的能力。2.1 样本点分布的拓扑分析 仿生模式识别的核心是覆盖,而分析类别空间的流形是确定用何种覆盖方法的前提。样本点分布的拓扑属性简单分为两种情况,一种情况是拓扑结构是已知的或可以预测的; 另一种情况是拓扑结构是未知的。例如在采集训练样本时,设定严格的采集条件,按照一定的规律或顺序采集,此时,样本点分布的拓扑结构是知的或者是可以估计的。采用了特定的样本采集方式: 摄像头在同一水平面上采集目标的0360&

15、deg;方向的图像,此时目标方向的改变只有一个变量,可认为目标全体样本在特征空间中的分布近似呈环状的一维流形。王宪保等的双螺旋曲线识别任务,识别目标-双螺旋曲线是分布在二维空间的一维流形。王守觉、徐健等在一项人脸身份确认研究中,使用三个摄像头组成一组镜头,这一组镜头同时采集同一人脸的图像得到多个样本点,这多个样本点的分布状况部分反映了该人脸在特征空间中的分布状况,后续用一个多权值神经元对这一组样本进行覆盖完成学习。在高维空间中,遇到更多的是拓扑结构未知的情况,目前还没有有效分析高维空间中点分布状况的系统方法和工具,并且流形的维数越高,分析的难度越大,目前的研究大多假定样本呈一维流形分布,在这些

16、实验中,采用一维流形覆盖,都能够取得很好的识别效果。研究了不限定流形维数的仿生模式识别实现方法,研究发现随着覆盖维数的增加,样本的识别率也逐渐提高,但提高幅度逐渐变小。2.2 覆盖算法研究 覆盖算法的实现是仿生模式识别的研究重点,神经网络被证明是有效的方法。Wang Shoujue,Zhao Xingtao 等提出一种超香肠神经网络,网络由超香肠神经元( hyper sausage neuron,HSN) 构成,HSN 在特征空间中可看成是以两个样本点的连线作为中心线,与中心线距离小于阈值的所有点的集合。在3 维空间中,神经元可看成是一个以两个样本点之间的线段作为中线的圆柱体、分别以两个样本点为球心的半个超球共3 个区域的并,构成一个新的空间区域,因其在3 维空间中像一根香肠,称之为超香肠神经元。王守觉、徐健、LaiJiangliang

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号