《Bayes分类器[基础教育]》由会员分享,可在线阅读,更多相关《Bayes分类器[基础教育](6页珍藏版)》请在金锄头文库上搜索。
1、 模式识别实验 题目: Bayes分类器的设计 学 院 计算机科学与技术 专 业 计算机科学与技术 学 号 2012436034 姓 名 顾文远 指导教师 李凯 网络软硬件2015年 10 月14日网络软硬件实验一 Bayes分类器设计一、教学要求理解基于Bayes决策理论的随机模式分类的原理和方法,掌握基于最小错误率的贝叶斯决策和基于最小风险的贝叶斯决策,并能够对贝叶斯规则给出具体的实现。二、知识点提示知识点:错误率、风险、先验概率、概率密度函数、最小错误率贝叶斯决策规则、最小风险贝叶斯决策规则。重点:最小错误率贝叶斯决策规则和最小风险贝叶斯决策规则的实现。难点:最小风险贝叶斯决策规则的实现
2、。三、教学内容Bayes分类器的基本思想是依据类别先验概率和条件概率密度,按照某种准则使分类结果从统计上讲是最佳的。换言之,根据类别先验概率和条件概率密度将模式空间划分成若干个子空间,在此基础上形成模式分类的判决规则。准则函数不同,所导出的判决规则就不同,分类结果也不同;使用哪种准则或方法应根据具体问题来确定。1产生二维正态分布模式,并将产生的样本集随机地分为训练集和测试集;2分别设计最小错误率的Bayes分类器和最小风险Bayes分类器,并对测试集进行分类,观察代价函数的设置对分类结果的影响;3统计错分概率。四、实验原理以Bayes公式为基础,利用测量到的对象特征配合必要的先验信息,求出各种
3、可能决策情况(分类情况)的后验概率,选取后验概率最大的,或者决策风险最小的决策方式(分类方式)作为决策(分类)的结果。也就是说选取最有可能使得对象具有现在所测得特性的那种假设,作为判别的结果。五、实验步骤1、首先产生二维正态分布模式的数据,设定产生均值为2,标准差为0.5的100个随机数据和均值为-2,标准差为2的100个随机数据,其中一个产生的正态密度曲线图如下:2、设计最小错误率的Bayes分类器,将两类数据分别根据先验概率和类条件概率密度计算后验概率,选择后验概率大的为一类,得出测试集正确率和错误率为(其中worng1是将第一类错分到第二类的错误率,worng2是将第二类错分到第一类的错
4、误率):rightRate1 = 0.9800worng1 = 0.0200rightRate2 = 0.9200worng2 = 0.08003、设计最小风险Bayes分类器,根据前面计算的后验概率,利用决策表计算出条件风险R,决策选择风险小的,即对于第一类数据如果算出的R1风险小根据分类器设定选择第一类分类,则分类正确,对于第二类数据如果算出的R2风险小即选择第二类分类,分类正确,否则分类错误,根据这一标准计算分类决策的正确率和错误率。决策表决策12104220这里worng3是最小风险Bayes分类器将第一类错分到第二类的错误率,worng4是将第二类错分到第一类的错误率:rightRa
5、te3 = 0.9500worng3 = 0.0500rightRate4 = 0.9400worng4 =0.0600 当改变代价函数,分类结果也随之改变,这里仅仅将12的值和21的值互换,分类结果就不同了。21增大,即将第一类数据错分到第二类里面的风险就变大了,一些数据因为风险大了所以会分到第一个类别中去,相应的第一类的数据分类错误率减小,当然同时第二类的数据分类错误率增加了。rightRate3 = 1worng3 = 0rightRate4 = 0.8700worng4 = 0.1300六、思考题1.如何获得类条件概率密度?类条件概率是已知的,也就是这里是自己设定的,pw1=pw2=0
6、.5.2.按照最小错误率的贝叶斯决策规则和最小风险的贝叶斯决策规则对测试集中的样本分类,结果一致吗?不一致,最小错误率的贝叶斯决策规则关心的是让出现的错误最小,而最小风险的贝叶斯决策规则关心的是决策结果带来的损失最小。最小风险的贝叶斯决策的决策表是人为给定的,决策表不同导致的结果不同。当决策与状态相同时损失为0,不同时损失为1时最小风险等于最小错误率贝叶斯决策。七、附录cleare1=2;a1=0.5;e2=-2;a2=2;pw1=0.5;pw2=0.5;%最小错误率贝叶斯分类s1=normrnd(e1,a1,1,100);%产生二维正态分布100个数据histfit(s1);s2=normr
7、nd(e2,a2,1,100);%产生二维正态分布100个数据p1=zeros(1,100);p2=zeros(1,100);p3=zeros(1,100);p4=zeros(1,100);right1=0;right2=0;%对第一类进行分类for i=1:100 p1(i)=(pw1*normpdf(s1(i),e1,a1)/(pw1*normpdf(s1(i),e1,a1)+pw2*normpdf(s1(i),e2,a2); p2(i)=(pw2*normpdf(s1(i),e2,a2)/(pw1*normpdf(s1(i),e1,a1)+pw2*normpdf(s1(i),e2,a2)
8、; if p1(i)p2(i) right1=right1+1; endend%对第二类进行分类for i=1:100 p3(i)=(pw1*normpdf(s2(i),e1,a1)/(pw1*normpdf(s2(i),e1,a1)+pw2*normpdf(s2(i),e2,a2); p4(i)=(pw2*normpdf(s2(i),e2,a2)/(pw1*normpdf(s2(i),e1,a1)+pw2*normpdf(s2(i),e2,a2); if p3(i)p4(i) right2=right2+1; endend%对第一类分类的正确率rightRate1=right1/100%对第
9、一类分类的错误率worng1=1-rightRate1%对第二类分类的正确率rightRate2=right2/100%对第二类分类的错误率worng2=1-rightRate2%最小风险贝叶斯分类R1=zeros(1,100);R2=zeros(1,100);right3=0;right4=0;r11=0;r12=4;r21=2;r22=0;for i=1:100 R1(i)=r11*p1(i)+r12*p2(i); R2(i)=r21*p1(i)+r22*p2(i); if R1(i)R2(i) right4=right4+1; endend%对第一类分类的正确率rightRate3=right3/100%对第一类分类的错误率worng3=1-rightRate3%对第二类分类的正确率rightRate4=right4/100%对第二类分类的错误率worng4=1-rightRate4网络软硬件