模式识别(第1章绪论)

上传人:子 文档编号:52063563 上传时间:2018-08-18 格式:PPT 页数:48 大小:526.50KB
返回 下载 相关 举报
模式识别(第1章绪论)_第1页
第1页 / 共48页
模式识别(第1章绪论)_第2页
第2页 / 共48页
模式识别(第1章绪论)_第3页
第3页 / 共48页
模式识别(第1章绪论)_第4页
第4页 / 共48页
模式识别(第1章绪论)_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《模式识别(第1章绪论)》由会员分享,可在线阅读,更多相关《模式识别(第1章绪论)(48页珍藏版)》请在金锄头文库上搜索。

1、模式识别Pattern Recognition许建华南京师范大学计算机学院2009年秋季Date第 1 章 绪论1.1 模式识别与模式的概念1.2 模式识别系统1.3 关于模式识别的若干基本问题Date1.1 模式识别与模式的概念1.1.1 基本概念两个例子:幼儿认动物图书归类Date幼儿认动物 老师教幼儿学(学习) 幼儿自己认(决策) 错分现象猫?虎?Date图书归类 归类 3:数学类图书 物理学图书 化学类图书 计算机类图书 小说类图书 法律类图书 根据内容或者外观聚成相应的类 物以类聚,人以群分归类 1 :精美印刷的书普通印刷的书归类 2:大开本的书小开本的书微型开本的书Date人的模式

2、识别能力人通过视觉、嗅觉、听觉、味觉、触觉接收外界信息、再经过人脑根据已有知识进行适当的处理后作出的判别事物或者划分事物性质(类别)的能力Date模式识别 (Pattern Recognition)用计算机来实现人的模式识别能力,即用计算机实现人对各种事物或现象的分析、描述、判断、识别Date模式(Pattern)存在于时间,空间中可观察的事物,并具有时间或空间分布的信息 Date说明1 模式不是事物本身,而是从事物获得的信息。比如,人的照片、个人资料 2 可以区分模式之间是否相似(与问题有关)3 模式一般用向量来表示,下标可以反映时间特性、空间特性或者其他标识(不同年龄的身高、图象的各个象素

3、点的灰度值、个人资料)Date模式识别的目的对于某一个模式,将其正确地归属到某一个类别例:正确识别不同人不同写法的数字0-9Date模式识别可以看成是从模式向类别所作的映射例:不同写法的数字“1”数字1的类别模式类别连续 或者 离散离散Date美国邮政数字识别数据库(USPS):7300个训练样本,2000个测试样本,16X16图像019Date模式(向量):通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息(有人称样本或样本向量)模式类:模式所属的类别或同一类中模式的总体(简称类)Date1.1.2 模式识别技术的划分 划分的原则 问题或样本性质 理论基础 应用领域Date根据问题

4、的划分有监督模式识别:先有一批带类别标签的样本,根据样本集设计分类器,再判断新的样本类别(分类)无监督模式识别:只有一批样本,根据样本之间的相似性直接将样本集划分成若干类别(聚类)Date根据理论基础的划分统计模式识别:概率论与数理统计模糊模式识别:模糊逻辑人工神经网络:神经科学、最优化、概率论与数理统计结构模式识别:形式语言注:本课程主要讨论前三部分内容 Date根据应用领域的划分图象识别:染色体分类、遥感图象识别人脸识别:文字识别:中外文印刷体、手写体识别数字识别:0-9印刷体、手写体识别,典 型例子:邮政手写数字识别指纹识别:掌纹识别:语音识别:Date1.1.3 刊登模式识别研究成果的

5、中文期刊模式识别属于人工智能专题,其成果可以刊登在计算机、电子与自动化类的中文专业期刊上较好期刊:中国科学(信息科学版)、计算机学报、计算机研究与发展、自动化学报、电子学报、软件学报、模式识别与人工智能、控制与决策等核心期刊:计算机科学、控制理论与应用 、计算机工程与应用、小型微型计算机系统 、计算机工程、计算机应用 、信息与控制 、计算机应用研究 、计算机应用与软件等说明:不包含综合性的期刊(如,大学学报)Date1.2 模式识别系统模式识别系统:由设计和实现两个过程组成设计(训练、学习):指用一定数量的样本(称为训练集或学习集)进行分类器的设计实现(决策、分类、判决):指用所设计的分类器对

6、待识别的样本进行分类决策Date模式识别系统的基本构造模式识别系统的主要组成部分:数据获取、预处理、特征提取和选择、分类决策数据 获取预 处 理特征提取 与选择分类器设计分类决策训练过程决策过程Date说明1 这一系统构造适合于统计模式识别、模糊模式识别、人工神经网络中有监督方 法2 对于结构模式识别方法,只需用基元提取代替特征提取与选择3 对于聚类分析,分类器设计与决策合二为一,一步完成Date数据的获取通过各种传感器,将光或声音等信息转化为电 信息,或者将文字信息输入计算机信息可以分成:一维波形:声波,心电图,脑电图等二维图象:文字,图象等物理量:人的身高、体重,商品的重量、质量 级别等逻

7、辑量(0/1):有无、男女等Date预处理目的:去除噪声,增强有用的信息常用技术:一维信号滤波去噪,图象的平滑、增强、恢复、滤波等Date心电图DateDate特征提取和选择目的:从原始数据中,得到最能反映分类本质的特征特征形成:通过各种手段从原始数据中得出反映分类问题的若干特征(有时需进行数据标准化)特征选择:从特征中选取若干最能有利于分类的若干特征特征提取:通过某些数学变换,降低特征数目Date测量空间:原始测量数据组成的空间特征空间:进行模式分类的空间。一个模式(样本)向量对应于特征空间中的一个点Date分类器设计根据训练样本集,确定判决规则,使得按这样判决规则对被识别对象进行分类时,错

8、误率最小、损失最小或者某一准则函数值最小Date分类决策在特征空间中用判决规则将被识别对象归属为某一类别Date模式识别关注的内容 特征选择与提取 分类器的设计 分类决策规则Date1.3 关于模式识别的一些基本问题1.3.1 模式(样本)表示方法用 n 维列向量来表示 一个(模式)样本,说明该样本具有 n 个数字特征x= (x1 , x2 , , xn)T常称之为模式向量或者样本向量Date说明1 向量中的分量有先后顺序,在多数情况下具有明确的物理意义2 一维波形直接按时间顺序排列3 二维图象按行或列顺序排列4 物理量或逻辑量按规定顺序排列5 非数字特征转换成数字特征或者逻辑量,按规定顺序排

9、列6 通过提取、选择后,按照规定顺序排列Date低维模式向量的几何图示法一维样本:一维坐标轴上的点二维样本:二维平面坐标上的点三维样本:三维空间坐标中的点 DateDate说明模式的向量表示适合于统计模式识别、模糊模式识别、人工神经网络等在结构模式识别中,用基元(链码)表示模式Date1.3.2 模式类的紧致性临界点(样本):在多类样本集中,当一些样本的特征值发生微小变化后,就变成另一类样 本,这样的样本称为临界样本(点)无临界点许多临界点非常多临界点Date紧致集:同一模式类样本的分布比较集中 ,没有或临界样本很少,这样的模式类 称紧致集紧致集的性质 要求临界点很少 集合内的任意两点的连线,

10、在线上的点属于同 一集合 集合内的每一个点都有足够大的邻域,在邻域内只包含同一集合的点 Date模式识别的要求:样本集满足紧致性,才能很好地进行分类如果不满足紧致性,可以采取适当的变换(与具体问题有关),尽可能地使样本集满足紧致性Date1.3.3 样本之间的相似性 两个样本 xi ,xj 之间的相似度量满足以下要求: 应为非负值 样本本身相似性度量应最大 度量应满足对称性 在满足紧致性的条件下,相似性应该是两点(样本)之间距离的单调函数Date在实际应用中,用各种距离表示相似性(不相似 性)距离的定义:距离是一个双变量的实值函数,记d(x,y),满足三个条件: 非负性:d(x,y) 0,且d

11、(x,y) 0 ,当且仅当 x = y 对称性: d(x,y) d(y,x) 三角不等式: d(x,y) d(x,z) + d(z,y) Date 非负性:d(x,y) 0,且d(x,y) 0 ,当且仅当 x = y 对称性: d(x,y) d(y,x) 三角不等式: d(x,y) d(x,z) + d(z,y) x xy yz zDate常用距离设 x=( x1, x2 , xn )T,y= ( y1, y2,yn )T明考夫斯基(Minkowski) 距离Date欧几里德(Euclidean)距离(q=2)绝对值距离或Manhattan距离(q=1)切比雪夫(Chebyshev)距离(q=) Date马哈拉诺比斯(Mahalanobis)距 离 其中协方差矩阵和均值为Date1.3.4 数据的标准化目的:消除各个分量之间数值范围大小对算法的影响方法:标准化成0,1或者-1,+1、方差标准化Date标准化到0,1或者-1,+1:将每一个分量转换 到0,1或者-1,+1样本集中,某一个特征的最大值与最小值为:标准化Date方差标准化 一个样本集中,某一个特征的均值与方差为:标准化Date本章的重点: 模式识别系统的构造 距离的概念 输出的标准化或预处理Date

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号