模式识别期末试题－金锄头文库

资源描述

《模式识别期末试题》由会员分享，可在线阅读，更多相关《模式识别期末试题（9页珍藏版）》请在金锄头文库上搜索。

1、一、填空与选择填空（本题答案写在此试卷上,3分) 1、模式辨认系统的基本构成单元涉及: 模式采集、特性提取与选择和模式分类。2、记录模式辨认中描述模式的措施一般使用特真矢量 ;句法模式辨认中模式描述措施一般有串、树、网。、聚类分析算法属于 (1）；鉴别域代数界面方程法属于（3)。(1）无监督分类 (2)有监督分类 (3）记录模式辨认措施(）句法模式辨认措施、若描述模式的特性量为0-1二值特性量,则一般采用 (4) 进行相似性度量。(）距离测度（2）模糊测度 (3）相似测度（）匹配测度5、下列函数可以作为聚类分析中的准则函数的有（1）（3)(4) 。（1）（

2、2） (3） (4)、Fishr线性鉴别函数的求解过程是将维特性矢量投影在 (2) 中进行。（1）二维空间 (2)一维空间 (3)N-1维空间7、下列鉴别域界面方程法中只合用于线性可分状况的算法有 (1) ；线性可分、不可分都合用的有 (）。 (1)感知器算法 (2）-K算法（3）积累位势函数法 8、下列四元组中满足文法定义的有（1)（2)（4) 。(1)(A,B， 0, 1, A0, A 0A1 ， A 10 ， B B ,B 0, A)（2)(A, ,0， A 0A, A) （)(S, a， b,S 0S， S 11S， S 0， ,S)（4)(, 0， 1， A01，A 1， A

3、 1A0,A)9、影响层次聚类算法成果的重要因素有( 计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目)）。1、欧式距离具有（ 1、2 );马式距离具有( 、3、4 )。（1)平移不变性（)旋转不变性（3)尺度缩放不变性（4）不受量纲影响的特性1、线性鉴别函数的正负和数值大小的几何意义是(正(负）表达样本点位于鉴别界面法向量指向的正(负）半空间中;绝对值正比于样本点到鉴别界面的距离。)。12、感知器算法 1 。 (1）只合用于线性可分的状况;(2）线性可分、不可分都合用。3、积累势函数法较之于K算法的长处是（该措施可用于非线性可分状况（也可用于线性可分状况) );位势函数K(x,

4、xk)与积累位势函数K(x)的关系为()。 14、在记录模式分类问题中，聂曼-皮尔逊判决准则重要用于（某一种判决错误较另一种判决错误更为重要)状况；最小最大判决准则重要用于（先验概率未知的）状况。15、“特性个数越多越有助于分类”这种说法对的吗?( 错误 )。特性选择的重要目的是(从n个特性中选出最有助于分类的的个特性（m)，以减少特性维数)。一般在（可分性判据对特性个数具有单调性）和（ Cnmn )的条件下,可以使用分支定界法以减少计算量。16、散度Jij越大，阐明i类模式与wj类模式的分布(差别越大）;当i类模式与wj类模式的分布相似时,ij=(0）。、已知有限状态自动机=（,，d，

5、q,),=0，1；q0,q1;d:d（0，0)= ,d(q0,1）= 1，d(q1,0)=q0，（q,)=q0；q=q0；F=q0。既有输入字符串:(a），（b) ,（c) ，(d)0001，试问，用Af对上述字符串进行分类的成果为( 1:a,d;2:，c ）。、影响聚类算法成果的重要因素有( )。已知类别的样本质量；分类准则；特性选用;模式相似性测度。1、模式辨认中,马式距离较之于欧式距离的长处是（）。平移不变性；旋转不变性；尺度不变性;考虑了模式的分布。20、基于二次准则函数的H-K算法较之于感知器算法的长处是（ )。可以鉴别问题与否线性可分；其解完全合用于非线性可分的状况；其解的适应

6、性更好;计算量小。2、影响基本C均值算法的重要因素有( ）。样本输入顺序;模式相似性测度;聚类准则;初始类心的选用。、位势函数法的积累势函数K()的作用相称于Bae判决中的( )。先验概率；后验概率；类概率密度;类概率密度与先验概率的乘积。23、在记录模式分类问题中，当先验概率未知时,可以使用( )。最小损失准则;最小最大损失准则;最小误判概率准则;N-判决。24、在( )状况下，用分支定界法做特性选择计算量相对较少。Cnn,(n为原特性个数，d为要选出的特性个数);样本较多;选用的可分性判据J对特性数目单调不减；选用的可分性判据J具有可加性。2、散度JD是根据（）构造的可分性判据。先验概

7、率;后验概率；类概率密度；信息熵；几何距离。26、似然函数的概型已知且为单峰,则可用（ )估计该似然函数。矩估计；最大似然估计；Baye估计；By学习；Pazn窗法。27、Kn近邻元法较之Parzen窗法的长处是（）。所需样本数较少；稳定性较好；辨别率较高;持续性较好。28、从分类的角度讲，用DKLT做特性提取重要运用了DKLT的性质:（）。变换产生的新分量正交或不有关;以部分新的分量表达原矢量均方误差最小；使变换后的矢量能量更趋集中；29、一般，剪辑k-N近来邻措施在( ）的状况下效果较好。样本数较大;样本数较小；样本呈团状分布;样本呈链状分布。3、如果以特性向量的有关系数作为模式相似性

8、测度,则影响聚类算法成果的重要因素有（）。已知类别样本质量；分类准则；特性选用;量纲。二、(5分)简答及证明题（）影响聚类成果的重要因素有那些？（）证明马氏距离是平移不变的、非奇异线性变换不变的。答：(1）分类准则,模式相似性测度，特性量的选择,量纲。(2）证明：（2分) (2分）(1分）三、(8分)阐明线性鉴别函数的正负和数值大小在分类中的意义并证明之。答:（1）(4分)的绝对值正比于到超平面的距离式(-1)的分子为鉴别函数绝对值,上式表白,的值正比于到超平面的距离，一种特性矢量代入鉴别函数后所得值的绝对值越大表白该特性点距鉴别界面越远。（)(4分)鉴别函数值的正负表达出特性点位于

9、哪个半空间中，或者换句话说,表达特性点位于界面的哪一侧。四、(12分，每问4分) 在目的记别中，假定有农田和装甲车两种类型，类型w1和类型w2分别代表农田和装甲车,它们的先验概率分别为0和0.2，损失函数如表所示。目前做了三次实验,获得三个样本的类概率密度如下：：0.,01，06 :0.7，8，.3（1）试用贝叶斯最小误判概率准则判决三个样本各属于哪一种类型;()假定只考虑前两种判决,试用贝叶斯最小风险准则判决三个样本各属于哪一类；(3）把回绝判决考虑在内，重新考核三次实验的成果。表1类型损失判决145111解：由题可知:,，（)(4分)根据贝叶斯最小误判概率准则知:,则可以任判；,则判为

10、;,则判为；（2)(4分）由题可知:则，判为；，判为; ,判为;（）（4分）对于两类问题，对于样本,假设已知，有则对于第一种样本，则拒判;，则拒判;，拒判。五、.监督学习与非监督学习的区别：监督学习措施用来对数据实现分类,分类规则通过训练获得。该训练集由带分类号的数据集构成,因此监督学习措施的训练过程是离线的。非监督学习措施不需要单独的离线训练过程，也没有带分类号（标号）的训练数据集,一般用来对数据集进行分析,如聚类,拟定其分布的主分量等。 (实例：道路图）就道路图像的分割而言，监督学习措施则先在训练用图像中获取道路象素与非道路象素集，进行分类器设计，然后用所设计的分类器对道路图像进行

11、分割。使用非监督学习措施,则根据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以实现道路图像的分割。线性分类器三种最优准则: sher准则:根据两类样本一般类内密集，类间分离的特点，寻找线性分类器最佳的法线向量方向，使两类样本在该方向上的投影满足类内尽量密集,类间尽量分开。该种度量通过类内离散矩阵Sw和类间离散矩阵Sb实现。感知准则函数:准则函数以使错分类样本到分界面距离之和最小为原则。其长处是通过错分类样本提供的信息对分类器函数进行修正,这种准则是人工神经元网络多层感知器的基本。支持向量机:基本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的间隔为最大,它的基本出发点是

12、使盼望泛化风险尽量小。一、试阐明Mlais距离平方的定义,到某点的Malanobis距离平方为常数的轨迹的几何意义，它与欧氏距离的区别与联系。答：Mahanbis距离的平方定义为：其中x，u为两个数据，是一种正定对称矩阵(一般为协方差矩阵)。根据定义,距某一点的Mhalobs距离相等点的轨迹是超椭球，如果是单位矩阵，则hlanobis距离就是一般的欧氏距离。二、试阐明用监督学习与非监督学习两种措施对道路图像中道路区域的划分的基本做法，以阐明这两种学习措施的定义与它们间的区别。答:监督学习措施用来对数据实现分类,分类规则通过训练获得。该训练集由带分类号的数据集构成，因此监督学习措施的训练过

13、程是离线的。非监督学习措施不需要单独的离线训练过程,也没有带分类号(标号）的训练数据集，一般用来对数据集进行分析，如聚类,拟定其分布的主分量等。就道路图像的分割而言，监督学习措施则先在训练用图像中获取道路象素与非道路象素集,进行分类器设计,然后用所设计的分类器对道路图像进行分割。使用非监督学习措施，则根据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以实现道路图像的分割。三、试述动态聚类与分级聚类这两种措施的原理与不同。答:动态聚类是指对目前聚类通过迭代运算改善聚类;分级聚类则是将样本个体,按相似度原则合并,随着相似度规定的减少实现合并。四、试阐明如下问题求解是基于监督学习或是非监督学习： 1 求数据集的主分量2. 中文辨认3. 自组织特性映射. C图像的分割答：1、求数据集的主分量是非监督学习措施； 2、中文辨认看待辨认字符加上相应类别号有监督学习措施；3、自组织特性映射将高维数组按保存近似度向低维映射非监督学习; 4、CT图像分割按数据自然分布聚类非监督学习措施；五、试列举线性分类器中最出名的三种最佳准则以及它们各自的原理。答:线性分类器三种最优准则：isher准则：根据两类样本一般类内密集, 类

展开阅读全文