农业试验中缺失值数据的处理方法

上传人:枫** 文档编号:476888624 上传时间:2023-05-11 格式:DOCX 页数:4 大小:128.03KB
返回 下载 相关 举报
农业试验中缺失值数据的处理方法_第1页
第1页 / 共4页
农业试验中缺失值数据的处理方法_第2页
第2页 / 共4页
农业试验中缺失值数据的处理方法_第3页
第3页 / 共4页
农业试验中缺失值数据的处理方法_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《农业试验中缺失值数据的处理方法》由会员分享,可在线阅读,更多相关《农业试验中缺失值数据的处理方法(4页珍藏版)》请在金锄头文库上搜索。

1、农业实验中对缺失值处理(在GenStat中操作)农业实验中,由于各种因素的影响,很容易造成缺失值,对于缺失值,如果直接删掉,数据就变成了不平衡数据,需要用特殊的模型进行分析,如果定义缺失值,软件会在分析中予以补全分析,在方差分析中基于最小二乘法补全,在REML混合线性模型中,基于REML的方法补全,下面会以例子讲解怎么处理缺失值数据分析,怎么估计缺失数据。常用的估计缺失值的方法:1、均值插补。如果数据是有规律的(递增或递减,定序的),用均数补全,如果数据是随机的,用众数补全。2、最小二乘法补全,这是基于最小二乘法的原理,补全数据,使补全后的数据整体的离差平方和最小,这一般是方差分析中处理缺失值

2、的一般方法。3、基于REML的方法估计,REML混线性模型本身可以处理非平衡数据,它也可以作为估计缺失值的一种,它估计出来的缺失值比最小二乘法要准确,应用比较广泛。处理不平衡数据的方法:1、unbalanceanova,这可以对不平衡数据进行方差分析2、REML的混线性模型,它可以处理不平衡数据,应用比较广泛数据是3个品种在3个区组的品种表现,其中第3个区组的第3个品种观测值缺失,数据如下:01Raw3丄t;varlield11112212ie31337421185223223S373157g3273933D这里的*号定义为缺失值,数据包含在表中,对数据进行方差分析,并估计缺失值,结果如下An

3、alysisofvarianceVariate:yifrldSourceofvariationdf(rfr.v.)-鼻-3.lTk.$.v.r.Fprblockstratum2402.4220-46.21G-S.77block.*Units*-stratumcukivarResidual2G&5.92S3.33S325631,1110700043Tut呂113052&0MissingvaluesVariate:yieldUnitestimate980.0如果将缺失值删除,数据格式变为03再用方差分析会报错,因为这是不平衡数据,在GenStat里面可以用unbalanceanova进行方差分析:

4、04结果如下05AccumulatedanalysisofvarianceChanged.f.s.s.m.s.v.r.Fpr-+block22442.671221.3339.260.007+cultivar2516.00268.008.290.060Residual3SG.3331.11Total13052.00436.00因为这里面将缺失值删掉了,就默认为没有缺失值,数据是不平衡的,也就不存在缺失值的估计了。不平衡数据还可以用REML混合线性模型进行分析,模型如下:06LinearModelsrAvailableD;YVariate:blockcultivar比IdFiwedModel:Ra

5、ndomModel:InitialValues.SplineModel:Interactions:CorrelatedErrorTerms.(FiKedModelOnlyOptions.Predict.FurtherOutput.Defauh结果如下:07EstimatedvariancecomponentsRandonriitprmcomponnt.s.e_blDk664.01678.39ResidualvariancemodelTermModel(order)IdentityParamiBterSignna2Estimate31.19s.e.25.50Testsforfixedeffect

6、sSmqumnLi日llyaddingterrrstofixedmodelFixedtermWaldstatisficndf卜statisticfldt1-Prcultivar16.1328.073.00062用REML的方法估计缺失值要把缺失的数据用*号代替,数据如下08估计的缺失值结果如下:09EstimatesofmissingvaluesindataUnitestimates.e.978.978.345结论:1、如果想要估计缺失值,用REML混线性模型进行估计,这个比方差分析的最小二乘法估计的更加准确。2、如果想要分析不平衡数据,用REML的混线性模型分析,这个比GenStat的unbalanceanova模型更高级,适用范围也更广泛,更重要的是它可以估算BLUE值和BLUP值。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号