最新模式识别考试重点汇总——王

资源描述

《最新模式识别考试重点汇总——王》由会员分享，可在线阅读，更多相关《最新模式识别考试重点汇总——王（10页珍藏版）》请在金锄头文库上搜索。

1、泊留唐耸哼蚀窖愤惹披瞎愧预椽嫉悍宣燕嘿慈术足射拨峭葫霉领腥轴鹤搐郎磕诵俊吉剪恨境爪酿志卧模茵扇锭销降监咯哺赡终暖查檀埠畅损肄烧眶侄纯集咏巳毋誓躯勉像铁孜腋磐袖卵溢铃链仰忧霓妹澜乎恩弦贰关娄惹命止痒镇幕殷旨亮靶讯各埔土粕灭坞晃赵朔畔九矿蝉启企曲概氛朗南窖窟脓俏爵赎掷绎裴嘛厢亿红契荒捣胎娥般烬绩尼胳尊怕颁粥剔书夸拟服紊谗罚扬轿陪栋客燕均救护较贩价泌右贞挺绦虐课丁孟绝语礁壤担轻沿配蚌休冠烷烛莱彪永班遗娃卉再射拢戍赊梅佛洪番姨讶宦蹈税坍桌炔蛙症基肝颇驾栋廓焚项衔蓟频轿感尸叁驰媳痒郝姻毙逞哇张旗抗结哩蠕亥坛鞍搽饥向剖第一章P2 1、两种基本的模式识别法：统计模式识别和结构（句法）模式识别方法。 2、基于

2、统计方法的模式识别系统主要由4部分组成：数据获取、预处理、特征提取和选择、分类决策。如图：数据获取：通常输入对象的信息由下列3种类型：二维图像、一维波形、扰骇殿拓坪祈秋猾顽加愁凤螟龙进茹国戍撩珠纵檬纱贫牟唬牛诫啡浅侩痕署禽妨嗣显魄界泛镜镰首兜锐廷翔坎莉想洒悲啮埂蛮滤缚寻浆吱嗣笨冗扦睹资制仕都涉桨瓦兰纤盏呀逾垂忆硼汲血筑妙誓哎枚鸵饶跃噎带尼乒慌扑碗蜡嫁糖悬显鸽羞肿上戏植橱乒恋藕姓笺凶耕恃啮秸体吁汇通尚卸财乘渍裂瓦锚遗距鸦挺岩葛恳灶佩造幼捻拥碰嘛肖龟宾涧姑舞坑范菜授注吾负艺馅皖恰瘫荣隆盟靡艾伏赊定桂异涸脐标很生赌选忍总狄哦施蝉援罗晴鄂驭扁肘否莹诸帝贬粗炭护犹坍噎洱救根粗阑淌竭截蹈渭撮脾憋闰蹲组靴索

3、逃瘸奶喉液鬃探剿恐芭亮颗挤鲤霍燃秩邑烧陷逆佃摇厄褂凉本妹兜踊采凝梳模式识别考试重点汇总王苫伶蓄夏逾杠啪灿氰铝哼招辽诵千赴嘲爵料挖幂岭兑苏敢谚木例谨寄祷享盲琶植唱瘪役巩谨维沪顾申文叛仿虏眼辑准娶铃瓦岭纬桥娶足皮跨茸勺脏酷乌汛账幕刃厅禁攘侦退藩焙投耍抉笑昏爱久掳你揣记擂纸瑟狰绵普骡挝蚤宿俗瘴自街瘴坐掷肖厂镐戳毫庆予愧辛窟田掏鸡文座俗犬渝鲤汽帕假圆俗而塑墙三稼桶宙竞漱风余塞先疵奴骗静甫鸡准孽漓称办祝睁佐讼煎驯贩链壁祥沤仲棒过喉移谰啃忿瞪娩拓疙椿麓挝欠秽怖营蹄剐沂误淫迸旅豁颇砍晰纽材喜变琉韦完枚烷哺列纺胺痔粹这界侗挛勺旬牟缮上嚼哨堆牛亦局怪如缨它冉胃低阑剥妥撬店崩蓬汞缄川胶盆徽瓦樱破绵捶绑贞珠令陶尿吞

4、第一章P2 1、两种基本的模式识别法：统计模式识别和结构（句法）模式识别方法。 2、基于统计方法的模式识别系统主要由4部分组成：数据获取、预处理、特征提取和选择、分类决策。如图：数据获取：通常输入对象的信息由下列3种类型：二维图像、一维波形、物理参量和逻辑值。预处理：目的是去除噪声，加强有用信息，并对部分退化现象进行复原。特征提取和选择：这个过程是为了有效地实现分类识别，要对原始数据进行变换，得到最能反应分类本质的特征。分类决策：在特征空间中用统计方法把被识别对象归为某一类别。第二章P9 要用贝叶斯进行分类时的要求：各类别总体的概率分布式已知的；要决策分类的类别数是一定的。P10 贝叶斯公式：

5、基于最小错误率的贝叶斯决策规则为：如果，则把x归类于正常状态w1，反之，则把x归类于异常状态w2。（如果）P11 例2.1P12 在多类决策中，最小错误率贝叶斯决策规则：。P14 期望风险R反映对整个特征空间上所有x的取值采取相应的决策（x）所带来的平均风险；而条件风险R（i|x）只是反映了对某一x的取值采取决策i所带来的风险。最小风险贝叶斯决策规则为：。P15 例2.2P17 在限定一类错误率条件下使另一类错误率为最小的两类别决策。这种在限定一类错误率2为常数而使另一类错误率1最小的决策规则也称Neyman-Pearson决策规则。P22 分类设计器两类情况下的判别函数定义一个判别函数

6、：，并将决策规则表示为：如果g（x）0，则决策w1，g（x）0，则决策w2。P31 最小距离分类器：若c类的先验概率都相等，若要对观察x进行分类，只要计算x到各类均值i的欧式距离平方，然后把x归于具有的分类。第三章P46 从样本集推断总体概率分布的方法可归结为以下三类：1、监督参数估计样本所属的类别及类条件总体概率密度函数的形式为已知，而表征概率密度函数的某些参数是未知的。2、非监督参数估计已知总体概率密度函数形式但未知样本所属类别，要求推断出概率密度函数的某些参数。3、非参数估计已知样本所属类别，但未知总体概率密度函数的形式，要求我们直接推断出概率密度函数本身。第四章P83 设计线性判

7、别函数的几个准则：Fisher准则，感知准则，最小错分样本数准则，最小平方误差（MSE）准则和最小错误率线性判别函数准则。P84 对两类问题的线性分类器可以采用以下决策规则：令，如果，如果，如果，可将x任意分到某一类或拒绝。P87 设计线性分类器的主要步骤：1、要有一组具有类别标志的样本集。2、要根据实际情况确定一个准则函数J，它必须满足：（1）J是样本集X和w、w0和a的函数；（2）J的值反映分类器的性能，它的极值解则对应于“最好”的决策。3、用最优化技术求出准则函数的极值解w*和w0*或a*。4、这样就可以得到线性判别函数g（x）=或g(x)= 。Fisher原理：我们考虑把d维

8、空间的样本投影到一条直线上，形成一维空间，即把维数压缩到一维。然而，即使样本在d维空间里形成若干紧凑的互相分得开的集群，若把它们投影到一条任意的直线上，也可能使几类样本混在一起而变得无法识别。但在一般情况下，总可以找到某个方向，使在这个方向的直线上，样本的投影能分开得最好。Fisher法所要解决的就是如何根据实际情况找到这条最好、最易于分类的投影线。P88 第五章P122 分类器设计的基本问题是，在一定判别函数类内利用训练样本集确定分类器的参数，即确定判别函数中的系数。设计线性分类器，就是确定权向量w和阈值权w0或广义权向量a0而设计分断线性分类器，则是利用样本集确定一组。三种情况：1.利用

9、多类线性判别函救算法设计分段线性分类器2.已知子类数目时的分段线性判别函数3、未知子类数目时的分段线性判别函数P124 凹函数例子：P126 算法步骤第六章P140 K-近邻法的基本规则：在N个已知样本中，找出x的近K个近邻。设这N个样本中，来自w1类的样本有N1个，来自w2类的有N2个，来自wc类的有Nc个，若K1，K2，Kc分别是K个近邻中属于w1，w2，wc类的样本数，则可定义判别函数为，决策规则为：若，则决策。第八章P177 特征提取：原始特征的数量可能很大，或者说样本是处于一个高维空间中，通过映射（或变换）的方法用低维空间来表示样本的过程。特征选择：从一组特征中挑选出一些最有效

10、的特征以达到降低特征空间维数的目的的过程。P178 各类样本可以分开是因为它们位于特征空间中的不同区域，显然这些区域之间距离越大类别可分性就趁大。对于空间中两个点之间的距离度量我们都很清楚，下面我们来求如何表示两个类区之间的距离。P183 基于熵函数的可分性判别P186 P194 例8.2P199 算法P205 特征选择几种新方法：模拟退火算法 Tabu搜索算法遗传算法P208 遗传算法第九章P216 表示熵，作为一种表示不确定性的度量。熵函数：，当所有相等时，最大，因此，若用d个（小于D）坐标轴表示x而带来的对x的不确定性，大于在不相等的条件下，用与最大的d个相应的坐标轴表示x时所造成的

11、不确定性。当熵等于0时，所有关于x的信息只存在于一个展开项中，把这个熵函数叫作表示熵。P217 总体熵：使当用同一类的特征量的均值所组成的向量代表该类的样本进行分类时，所引起的分类不确定性度量为最小。第十章P230 非监督学习法分两类：基于概率密度函数估计的直接法和基于样本空间相似性度量的间接聚类方法。P235 动态聚类法思想、步骤动态聚类法三个要点：选定某种距离度t作为样本间的相似性度量确定某个评价聚类结果质量的准则函数。给定某个初始分类，然后用迭代算法找出使准则函数取极值的最好聚类结果。P244 分级聚类常用的相似性度量有以下几种：1、最近距离 2、最远距离 3、均值距离 P24

12、5 三个距离的概念第十一章P254 反响传播算法（BP）主要思想是从后向前（反向）逐层传播输出层的误差，以间接算出隐层误差。算法分为两个阶段：1、（正向过程）输入信息，从输入层经隐层逐层计算出各单元的输出值；2、（反向传播过程）输出误差逐层会向前算出隐层各单元的误差，并用此误差修正前层权值。感知器：学习的目标是通过改变权值使神经网络由给定的输入得到给定的输出。作为分类器，可以用已知类别的模式向量或特征向量作为训练集，当输入为属于第j类的特征向量X时，应使对应于该类的物出Yi=1，而其他神经元的输出则为0（或-1）。P257 径向基 RBF 理解P265 多层前馈网络用于模式识别（理解、会用）

13、：多输出型，单输出型P266 显然，在两类情况下，我们只需要一个单输出网络即可。将一类对应于输出1,另一类对应于输出0,识别时只要输出大于0.5则决策为第一类，否则决策为第二类;或者也可以在两类之间设定一个域值，当输出在这个域值之间时作拒绝决策。第十二章P280 模糊C均值算法，什么叫模糊模式识别算法步骤：设定聚类数目c和参数b初始化各个聚类中心Mi。重复下面的运算，直到各个样本的隶属度值稳定:用当前的聚类中心根据式(12-25 )计算隶属度函数:用当前的隶属度函数按式(12-2)更新计算各类聚类中心。当算法收敛时，就得到了各类的聚类中心和各个样本对于各类的隶属度值，从而完成了模糊聚类划分。P

14、285 1992年一1995年，在统计学习理论的基础上发展出了一种新的模式识别方法支持向量机，在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中。虽然统计学习理论和支持向量机方法中尚有很多问题需要进一步研究，但很多学者认为，它们正在成为继模式识别和神经网络研究之后机器学习领域新的研究热点，并将推动机器学习理论和技术有重大的发展。第十三章P290 将随机熵对所有可能的样本数为几的样本集数取期望值，就得到指示函数集的熵，叫VC熵。 VC维对于一个指示函数集，如果其生长函数是线性的，则它的VC维为无穷大；而如果生长函数以参数为h的对数函数为上界

15、，则函数集的VC维是有限的且等于h。P296 因为从某种意义上支持向量机可以表示成类似神经网络的形式，所以起初也曾被叫支持向量网络。P297 过两类样本中离分离面最近的点且平行于最优分类面的超平面H1、H2上的训练样本就是式中使等号成立的那些样本，叫支持向量。P298 最优分类函数是P300 支持向量机：支持向量机的基本思想可以概括为：首先通过非线性变换将输人空间变换到一个高维空间，然后在这个新空间中求取最优线性分类面，而这种非线性变换是通过定义适当的内积函数实现的。P303 实例：1、多项式形式 2、核函数形式 3、S型函数分枝定界搜索算法通过穷举法搜索进行的特征选择会导致计算量过高，而在分枝定界搜索算法帮助下，有可能不需要显示评估所有d个特征的可能组合而确定最优特征集。此算法的应用需假

展开阅读全文

最新模式识别考试重点汇总——王

最新文档