数据分析5.5实验报告

上传人:橙** 文档编号:333352445 上传时间:2022-09-01 格式:PDF 页数:5 大小:470.47KB
返回 下载 相关 举报
数据分析5.5实验报告_第1页
第1页 / 共5页
数据分析5.5实验报告_第2页
第2页 / 共5页
数据分析5.5实验报告_第3页
第3页 / 共5页
数据分析5.5实验报告_第4页
第4页 / 共5页
数据分析5.5实验报告_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据分析5.5实验报告》由会员分享,可在线阅读,更多相关《数据分析5.5实验报告(5页珍藏版)》请在金锄头文库上搜索。

1、5.5 考察鸢尾属植物中三个不同品种的话的如下四个形状指标:1X:萼片长度;2X 萼片宽度;3X:花瓣长度;4X:花瓣宽度。重这三个品种(记为1,2,3)各选取 50 株,测得上述指标的取值如表5.10 所示。假如三个品种的着、这 4 个指标均服从 4 维正态分布,且先验概率相等,按下列要求进行 Bayes判别分析:表 5.10 鸢尾属植物三个不同品种的话的形状数据编号品种1x2x3x4x编号品种1x2x3x4x11503314276266294613214634143772522739143146361027826034451641513317579250203510515535132802

2、552437106148311628125827391271523414282262294313814936141832593042159144321328426022401010150351668526731471511144301328626323441312147321628725630411313148301438826325491514151381628926128471215148341929026429431316150301629125125301117150321229225728411318143301119326129471419158401229425629361320

3、151381949526931491521149301429625525401322151351429725523401323150341649826630441424146321429926828481425157441541002673050172615036142101364285622271543415410236731562428152421511033632851152915542142104369315123301493115210536530522031154391741063653055183215034152107358275119331442914210836832592

4、33414732132109362345423名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 5 页 -3514631152110377386722361513415211136733572537150351331123763066213814931151113349254517391543715211436730522340154391341153593051184115135143116363255019421483416211736432532343148301411183793864204414523133119367335721451573817312037728672

5、046151381531213632749184715434172122372326018481513715412336130491849152351521243612656145015337152125364285621512652846151263622848185226222451512737730612353259324818128363345624542613046141293582751195526027511613037230581656256253911131371305921572572845131323643155185826333471613336030481859270

6、324714134363295618602643245151353772669236126128401313636022501562255243811137369325723632543045151383742861196425826401213935628492065255264412140373296318662502333101413672558186726731441414236530582268256304515143369315421692582741101443723661257026029451514536532512071257263510146364275319722571

7、94213147368305521732492433101483572550207425627421314935828512475257304212150363336025名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 5 页 -(1)只考虑指标2X 和4X,并假定各总体协方差矩阵不全相等,给出误判率的回代估计和交叉确认估计;(2)只考虑指标2X 和4X,并假定各总体协方差矩阵相等,写出线性判别函数,给出误判率的回代估计和交叉确认估计并于(1)中结果作比较;(3)假定有新样品TToxxx)18,35(),(42,在(1),(2)之下,该样品非别被判归哪个总体?(4)利用全部 4

8、个指标重复(1)和(2)的分析,结果如何?是否所用指标越多,分类效果越好?在尝试其他几个指标组合,情况有如何?解:(1)误判率的回代估计:误判率的交叉确认估计:由以上结果可以看出,当只考虑指标2X 和4X,并假定各总体协方差矩阵不全相等的情况下,无论用回代法还是用交叉分析法,均存在误判,且误判情况相同,共有7 个误判:将第52 号的样品由品种 2 误判为品种 3;第 53 号的样品由品种 2 误判为品种 3;第 55号的样品由品种 2 误判为品种 3;第 100 号的样品由品种 2 误判为品种 3;第 103号的样品由品种3 误判为品种 2;第 124号的样品由品种3 误判为品种 2;第 13

9、0 号的样品由品种 3 误判为品种 2。误判的回代估计*rp和交叉确认估计*cp 为:0467.01507?*crpp(2)当各总体协方差矩阵相等,即123,只需把程序中pool=no 改为pool=yes,运行结果整理如下:线性判别函数为:42106379.238648.363828.56?xxW42276415.179074.141765.37?xxW名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 5 页 -42370086.345182.117687.60?xxW误判率的回代估计:误判率的交叉确认估计:由以上结果可以看出,当只考虑指标2X 和4X,并假定各总体协方差矩阵相等

10、的情况下,求出线性判别函数,并利用函数对样本进行回代估计和交叉确认估计,均误判现象,其中,用回代发法,共有5 个误判现象:将第 53 号样品由品种 2 误判为品种 3;第 103 号样品由品种 3 误判为品种 2;第 124 号样品由品种 3 误判为品种 2;第 130 号样品由品种 3 误判为品种 2;第 136 号样品由品种 3 误判为品种 2;故误判率的回代估计为:0 3 3 3.01 5 05?*rp用交叉确认法,共有6 个误判现象:将第 53 号样品由品种 2 误判为品种 3;第 100 号样品由品种 2 误判为品种 3;第 103 号样品由品种 32 误判为品种 2;第 124 号

11、样品由品种 3 误判为品种 2;第 130 号样品由品种 3 误判为品种 2;第 136 号样品由品种 3 误判为品种 2;故误判率的交叉确认法为:04.01506?*cp很显然,当各总体协方差矩阵相等时,误判率的回代估计和交叉确认估计都比各总体协方差矩阵不全相等时的低。(3)在各总体协方差矩阵不全相等情况下,新样品TToxxx)18,35(),(42被判归品种 2;而在各总体协方差矩阵相等的情况下,新样品TToxxx)18,35(),(42被判归品种 3。(4)首先是假设各总体协方差矩阵不全相等情况,考虑全部指标,结果如下:误判率的回代估计:误判率的交叉确认估计:名师资料总结-精品资料欢迎下

12、载-名师精心整理-第 4 页,共 5 页 -由以上结果可以看出,考虑全部指标1X2X3X4X,并假定各总体协方差矩阵不全相等的情况下,无论用回代法还是用交叉分析法,均存在误判,且误判情况相同,共有3 个误判:将第 53 号的样品由品种 2 误判为品种 3;第 55 号的样品由品种 2 误判为品种 3;第 103号的样品由品种3 误判为品种 2。误判的回代估计*rp和交叉确认估计*cp 为:002.01503?*crpp接着是假设各总体协方差矩阵相等情况,考虑全部指标,可求出其线性判别函数为:4321160979.166392.115311.21066.21184.84?xxxxW4321271

13、657.050419.059094.060676.140277.72?xxxxW4321314831.226711.130428.026525.123783.104?xxxxW误判率的回代估计:误判率的交叉确认法:由以上结果可以看出,考虑全部指标1X2X3X4X,并假定各总体协方差矩阵相等的情况下,无论用回代法还是用交叉分析法,均存在误判,且误判情况相同,共有3 个误判:将第 53 号的样品由品种 2 误判为品种 3;第 55号的样品由品种2 误判为品种 3;第 103 号的样品由品种 3 误判为品种 2。误判的回代估计*rp和交叉确认估计*cp 为:002.01503?*crpp由此可得,在考虑全部 4 个指标下,各总体协方差矩阵不全相等和相等情况下回代估计和交叉确认估计结果一样,而且,分类效果比只考虑2 个指标要好。名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 5 页 -

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 初中教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号