数据分析5.5实验报告

上传人:人*** 文档编号:486302137 上传时间:2023-02-18 格式:DOC 页数:9 大小:346KB
返回 下载 相关 举报
数据分析5.5实验报告_第1页
第1页 / 共9页
数据分析5.5实验报告_第2页
第2页 / 共9页
数据分析5.5实验报告_第3页
第3页 / 共9页
数据分析5.5实验报告_第4页
第4页 / 共9页
数据分析5.5实验报告_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《数据分析5.5实验报告》由会员分享,可在线阅读,更多相关《数据分析5.5实验报告(9页珍藏版)》请在金锄头文库上搜索。

1、. 5.5 考察鸢尾属植物中三个不同品种的话的如下四个形状指标: :萼片长度;萼片宽度;:花瓣长度;:花瓣宽度。重这三个品种(记为1,2,3)各选取50株,测得上述指标的取值如表5.10所示。假如三个品种的着、这4个指标均服从4维正态分布,且先验概率相等,按下列要求进行Bayes判别分析: 表5.10 鸢尾属植物三个不同品种的话的形状数据编号品种编号品种11503314276266294613214634143772522739143146361027826034451641513317579250203510515535132802552437106148311628125827391271

2、5234142822622943138149361418325930421591443213284260224010101503516685267314715111443013286263234413121473216287256304113131483014388263254915141513816289261284712151483419290264294313精品.16150301629125125301117150321229225728411318143301119326129471419158401229425629361320151381949526931491521149301

3、429625525401322151351429725523401323150341649826630441424146321429926828481425157441541002673050172615036142101364285622271543415410236731562428152421511033632851152915542142104369315123301493115210536530522031154391741063653055183215034152107358275119331442914210836832592334147321321093623454233514

4、63115211037738672236151341521113673357253715035133112376306621精品.3814931151113349254517391543715211436730522340154391341153593051184115135143116363255019421483416211736432532343148301411183793864204414523133119367335721451573817312037728672046151381531213632749184715434172122372326018481513715412336

5、130491849152351521243612656145015337152125364285621512652846151263622848185226222451512737730612353259324818128363345624542613046141293582751195526027511613037230581656256253911131371305921572572845131323643155185826333471613336030481859270324714134363295618精品.602643245151353772669236126128401313636

6、022501562255243811137369325723632543045151383742861196425826401213935628492065255264412140373296318662502333101413672558186726731441414236530582268256304515143369315421692582741101443723661257026029451514536532512071257263510146364275319722571942131473683055217324924331014835725502074256274213149358

7、28512475257304212150363336025(1)只考虑指标和,并假定各总体协方差矩阵不全相等,给出误判率的回代估计和交叉确认估计;(2)只考虑指标和,并假定各总体协方差矩阵相等,写出线性判别函数,给出误判率的回代估计和交叉确认估计并于(1)中结果作比较;(3)假定有新样品,在(1),(2)之下,该样品非别被判归哪个总体?精品.(4)利用全部4个指标重复(1)和(2)的分析,结果如何?是否所用指标越多,分类效果越好?在尝试其他几个指标组合,情况有如何? 解:(1)误判率的回代估计: 误判率的交叉确认估计: 由以上结果可以看出,当只考虑指标和,并假定各总体协方差矩阵不全相等的情况下

8、,无论用回代法还是用交叉分析法,均存在误判,且误判情况相同,共有7个误判:将第52号的样品由品种2误判为品种3;第53号的样品由品种2误判为品种3;第55号的样品由品种2误判为品种3;第100号的样品由品种2误判为品种3;第103号的样品由品种3误判为品种2;第124号的样品由品种3误判为品种2;第130号的样品由品种3误判为品种2。误判的回代估计和交叉确认估计为: (2)当各总体协方差矩阵相等,即,只需把程序中pool=no改为pool=yes,运行结果整理如下:线性判别函数为:精品.误判率的回代估计: 误判率的交叉确认估计:由以上结果可以看出,当只考虑指标和,并假定各总体协方差矩阵相等的情

9、况下,求出线性判别函数,并利用函数对样本进行回代估计和交叉确认估计,均误判现象,其中, 用回代发法,共有5个误判现象:将第53号样品由品种2误判为品种3;第103号样品由品种3误判为品种2;第124号样品由品种3误判为品种2;第130号样品由品种3误判为品种2;第136号样品由品种3误判为品种2;故误判率的回代估计为: 用交叉确认法,共有6个误判现象:将第53号样品由品种2误判为品种3;第100号样品由品种2误判为品种3;第103号样品由品种32误判为品种2;第124号样品由品种3误判为品种2;第130号样品由品种3误判为品种2;第136号样品由品种3误判为品种2;故误判率的交叉确认法为: 精品. 很显然,当各总体协方差矩阵相等时,误判率的回代估计和交叉确认估计都比各总体协方差矩阵不全相等时的低。 (3)在各总体协方差矩阵不全相等情况下,新样品被判归品种2;而在各总体协方差矩阵相等的情况下,新样品被判归品种3。(4)首先是假设各总体协方差矩阵不全相等情况,考虑全部指标,结果如下:误判率的回代估计: 误判率的交叉确认估计:由以上结果可以看出,考虑全部指标,并假定各总体协方差矩阵不全相等的情况下,无论用回代法还是用交叉分析法,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号