c1:形式识别概述[优质文档]

上传人:繁星 文档编号:88296977 上传时间:2019-04-23 格式:PPT 页数:23 大小:101KB
返回 下载 相关 举报
c1:形式识别概述[优质文档]_第1页
第1页 / 共23页
c1:形式识别概述[优质文档]_第2页
第2页 / 共23页
c1:形式识别概述[优质文档]_第3页
第3页 / 共23页
c1:形式识别概述[优质文档]_第4页
第4页 / 共23页
c1:形式识别概述[优质文档]_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《c1:形式识别概述[优质文档]》由会员分享,可在线阅读,更多相关《c1:形式识别概述[优质文档](23页珍藏版)》请在金锄头文库上搜索。

1、2019/4/23,1,第1讲 模式识别概述,育贾悔翰迫钱腋传效弟沛拢形迎咯骸霹萝僧滇欺久汛鉴赁杏贫樊募坞态兴C1:模式识别概述C1:模式识别概述,2019/4/23,2,1-1 模式识别的基本概念,一.模式识别的基本定义 模式(pattern)存在于时间,空间中可观察的事物,具有时间或空间分布的信息。 模式识别(Pattern Recognition)用计算机实现人对各种事物或现象的分析,描述,判断,识别。其目标是将对象划分成不同的类别。 有监督模式识别-分类 无监督模式识别-聚类,惩恭寿欢弗梆患惯兰嫡塔戈镀责锹牢剧嗓泻氛夸令并挚揣拖弃锚禾怨怂绅C1:模式识别概述C1:模式识别概述,2019

2、/4/23,3,二.模式识别的发展史,1929年 G. Tauschek发明阅读机 ,能够阅读0-9的数字。 30年代 Fisher提出统计分类理论,奠定了统计模式识别的基础。因此,在6070年代,统计模式识别发展很快,但由于被识别的模式愈来愈复杂,特征也愈多,就出现“维数灾难”。但由于计算机运算速度的迅猛发展,这个问题得到一定克服。统计模式识别仍是模式识别的主要理论。,捎糜什旬粗洱婆摊霖脱撒郧河蚊诀御沧芬派树官俊舷鹏顽雪态稿扫含劳纬C1:模式识别概述C1:模式识别概述,2019/4/23,4,50年代 Noam Chemsky 提出形式语言理论 美籍华人付京荪 提出句法结构模式识别。 60年

3、代 L.A.Zadeh提出了模糊集理论,模糊模式识别理论得到了较广泛的应用。 80年代 Hopfield提出神经元网络模型理论。近些年人工神经元网络在模式识别和人工智能上得到较广泛的应用。 90年代 小样本学习理论,支持向量机也受到了很大的重视。,硕渣覆绳皂唬捧乳罪熔酬跟舅邮对溺巡荚钦苏达饿殉锋孪涤耶傣胞如徊涯C1:模式识别概述C1:模式识别概述,2019/4/23,5,三.关于模式识别的国内、国际学术组织,1973年 IEEE发起了第一次关于模式识别的国际会议“ICPR”,成立了国际模式识别协会-“IAPR”,每2年召开一次国际学术会议。 1977年 IEEE的计算机学会成立了模式分析与机器

4、智能(PAMI)委员会,每2年召开一次模式识别与图象处理学术会议。 国内的组织有电子学会,通信学会,自动化协会,中文信息学会.。,加嘎屁肥乏墓染幢函总利余橙跑争壶半墙纂赌坚届绅会咽卯钒至梢化旁霉C1:模式识别概述C1:模式识别概述,2019/4/23,6,1-2 模式识别系统,信息的获取:是通过传感器,将光或声音等信息转化为电信息。信息可以是二维的图象如文字,图象等;可以是一维的波形如声波,心电图,脑电图;也可以是物理量与逻辑值。 预处理:包括AD,二值化,图象的平滑,变换,增强,恢复,滤波等, 主要指图象处理。,献喉添啡字芥泉倍瘩闲卢惋迅侍啤验法唉俏证害地训逃氓编牺朽疑资典引C1:模式识别概

5、述C1:模式识别概述,2019/4/23,7,特征抽取和选择:在模式识别中,需要进行特征的抽取和选择,例如,一幅64x64的图象可以得到4096个数据,这种在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征。这就是特征提取和选择的过程。 分类器设计:分类器设计的主要功能是通过训练确定判决规则,使按此类判决规则分类时,错误率最低。把这些判决规则建成标准库。 分类决策:在特征空间中对被识别对象进行分类。,沃朴除奢渔古汁摆努紫职安嚎赴孟佑赴压什料榔息稳虽烂眨屠柏泼鸿衔蹬C1:模式识别概述C1:模式识别概述,2019/4/23,8,1-3 模式识别的应用,1 .字符识别:包括印刷体字符的

6、识别;手写体字符的识别(脱机),各种OCR设备例如信函分拣、文件处理、卡片输入、支票查对、自动排板、期刊阅读、稿件输入;在线手写字符的识别(联机),各种书写输入板。 2. 医疗诊断:心电图,脑电图,染色体,癌细胞识别,疾病诊断,例如关幼波肝炎专家系统。 3. 遥感:资源卫星照片,气象卫星照片处理,数字化地球,图象分辨率可以达到1米。,毅讽绘绽饰粗傀榴上铜膨旭蹈探葬眺浩鼎刽泪临痉杆刚涨祷廷妖涌摔陛俐C1:模式识别概述C1:模式识别概述,2019/4/23,9,4. 指纹识别 脸形识别 5. 检测污染分析,大气,水源,环境监测。 6. 自动检测:产品质量自动检测 7. 语声识别,机器翻译,电话号码

7、自动查询,侦听,机器故障判断。 8. 军事应用,纬键心社拨贴恼舍悲狙派贩撇鄂改孰访拢捣椭吓羔减美她罪祸晾皑垒稿裴C1:模式识别概述C1:模式识别概述,2019/4/23,10,1-4 模式识别的基本问题,一.模式(样本)表示方法 向量表示 : 假设一个样本有n个变量(特征) = (X1,X2,Xn)T 2. 矩阵表示: N个样本,n个变量(特征),丽萎弛旗漓桶感辙填付块幕原唉些溅岩黄道恭敛峦痘笛惰张木架劳跟刃捉C1:模式识别概述C1:模式识别概述,2019/4/23,11,3. 几何表示 一维表示 X1=1.5 X2=3 二维表示 X1=(x1,x2)T=(1,2)T X2=(x1,x2)T=

8、(2,1)T 三维表示 X1=(x1,x2, x3)T=(1,1,0)T X2=(x1,x2 , x3)T=(1,0,1)T,锣坚敢拿钱铣迹摧跋驭尔庞馆总醇瞒府毕质卉怪忻莫济咀斋趋断店伦酿杭C1:模式识别概述C1:模式识别概述,2019/4/23,12,4. 基元(链码)表示: 在右侧的图中八个基元 分别表示0,1,2,3, 4,5,6,7,八个方向 和基元线段长度。 则右侧样本可以表示为 X1=006666 这种方法将在句法模式识 别中用到。,鼠庄摆酥负胸侗艾架加矫蓟仔静奏雌夹溯疮捐阅涌醋晋卫乎配志配吠瓜切C1:模式识别概述C1:模式识别概述,2019/4/23,13,二.模式类的紧致性,1

9、. 紧致集:同一类模式类样本的分布比较集中,没有或临界样本很少,这样的模式类称紧致集。,度狠妹鞍河甥漫镀非擂麓邑婆撑瞩那衅夺尖门缉伞楚言烹侯缠丙凄畅卉该C1:模式识别概述C1:模式识别概述,2019/4/23,14,2. 临界点(样本):在多类样本中,某些样本的值有微小变化时就变成另一类样本称为临界样本(点)。 3. 紧致集的性质 要求临界点很少 集合内的任意两点的连线,在线上的点属于同一集合 集合内的每一个点都有足够大的邻域,在邻域内只包含同一集合的点 4. 模式识别的要求:满足紧致集,才能很好的分类;如果不满足紧致集,就要采取变换的方法,满足紧致集.,暗锭盐诚眨矫邱谜旁驯肉襟匠弟扰瘁庸罪殃

10、苔碎婴轻库酚佩息途一剔咎釉C1:模式识别概述C1:模式识别概述,2019/4/23,15,三.相似与分类,1.两个样本xi ,xj之间的相似度量满足以下要求: 应为非负值 样本本身相似性度量应最大 度量应满足对称性 在满足紧致性的条件下,相似性应该是点间距离的 单调函数 2. 用各种距离表示相似性: 绝对值距离 已知两个样本 xi=(xi1, xi2 , xi3,xin)T xj=(xj1, xj2 , xj3,xjn)T,赞镁役惕验灭薪贿猩璃雅域泥罢播谭恿跌抚颜嘘英捧闹哎养绊桃乌喜劝屉C1:模式识别概述C1:模式识别概述,2019/4/23,16, 欧几里德距离 明考夫斯基距离 其中当q=1

11、时为绝对值距离,当q=2时为欧氏距离,卜痔妨骆囚害抿桔妒啤搁功少顿狠辙唱旨榨哭仟浆戚滨槐氨肉羌磅凶夫满C1:模式识别概述C1:模式识别概述,2019/4/23,17, 切比雪夫距离 q趋向无穷大时明氏距离的极限情况 马哈拉诺比斯距离 其中xi ,xj为特征向量, 为协方差。使用的条件是 样 本符合正态分布,遮酌裕爽蝉廓联摹坪吉乳迸霓唬轨缅膳氟瘦追悯翠何吟漓磅琶桨琴夜芜痈C1:模式识别概述C1:模式识别概述,2019/4/23,18, 夹角余弦 为xi xj的均值 即样本间夹角小的为一类,具有相似性 例: x1 , x2 , x3的夹角如图: 因为x1 , x2 的夹角小,所以x1 , x2 最

12、相似。,x1,x2,x1,x2,x3,棱楼哉决户蠕示搐厦热献泛并睛箱庙绑甲绊嘴芦任挖墓妙屡碧吗牟遵芳底C1:模式识别概述C1:模式识别概述,2019/4/23,19, 相关系数 为xi xj的均值 注意:在求相关系数之前,要将数据标准化 3. 分类的主观性和客观性 分类带有主观性:目的不同,分类不同。例如:鲸鱼,牛,马从生物学的角度来讲都属于哺乳类,但是从产业角度来讲鲸鱼属于水产业,牛和马属于畜牧业。 分类的客观性:科学性 判断分类必须有客观标准,因此分类是追求客观性的, 但主观性也很难避免,这就是分类的复杂性。,祈碎耙褒娟诌肘潘墨弃韩握捞差血拾祝曾枣果型惫渺翼室咖捅剿碑驹鲁豆C1:模式识别概

13、述C1:模式识别概述,2019/4/23,20,四.特征的生成 1.低层特征: 无序尺度:有明确的数量和数值。 有序尺度:有先后、好坏的次序关系,如酒 分为上,中,下三个等级。 名义尺度:无数量、无次序关系,如有红, 黄两种颜色 2. 中层特征:经过计算,变换得到的特征 3. 高层特征:在中层特征的基础上有目的的经过运 算形成 例如:椅子的重量=体积*比重 体积与长,宽,高有关;比重与材料,纹理,颜色有关。这里低、中、高三层特征都有了。,挫所县盆屹蛾承操枪督特另烫娱库觅艰滇带哀宗脯霸驹宠殖瘪蒲框箍涕堪C1:模式识别概述C1:模式识别概述,2019/4/23,21,五.数据的标准化 1.极差标准

14、化,一批样本中,每个特征的最大值与最小值之差。 极差 极差标准化 2. 方差标准化 Si 为方差 标准化的方法很多,原始数据是否应该标准化,应采用 什么方法标准化,都要根据具体情况来定。,丛驴灸棉供鸡拷席沉僳徒扑杠脊蒜敬氦巴偿枫痪柱判掸博姑宠领住村驳钟C1:模式识别概述C1:模式识别概述,2019/4/23,22,how understand data,data set instances attributes missing values & numeric values,蹲撒贤逻帐馋惊坟尔隋轰两尉绰苛质婿负乔迭矾拳痘吻幢社璃匪到段将蛔C1:模式识别概述C1:模式识别概述,2019/4/23,23,how to do experiments,Weka k-fold cross-validation, leave-one-out, split two-tailed t-test,论程增卒唁奴淳低配钩痰扮顽导馆骚窑视肪某夫珍魔斤夺哲药夜攘彤镶谋C1:模式识别概述C1:模式识别概述,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号