分类数据的检验

上传人:M****1 文档编号:551824634 上传时间:2023-10-21 格式:DOC 页数:8 大小:463KB
返回 下载 相关 举报
分类数据的检验_第1页
第1页 / 共8页
分类数据的检验_第2页
第2页 / 共8页
分类数据的检验_第3页
第3页 / 共8页
分类数据的检验_第4页
第4页 / 共8页
分类数据的检验_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《分类数据的检验》由会员分享,可在线阅读,更多相关《分类数据的检验(8页珍藏版)》请在金锄头文库上搜索。

1、第三讲分类数据的检验一、引例十九世纪伟大的英国生物学家孟德尔(Mendel)按颜色与形状把豌豆分为四类:黄而圆的,青而圆的,黄而有角的,青而有角的。按照遗传学理论,孟德尔指出这四类豌豆的个数之比为9:3:3:1,也即豌豆为黄而圆的,青而圆的,黄而有角的,青而有角的概率分别为 9/16,3/16 ,3/16 ,1/16 。他通过观察 n 556个豌豆发现,这四类豌豆的个数分别为 315,108,101,32。如何根据这些观察数据对孟德尔的遗传学理论进行检验?分析:( 1)总体为所有的豌豆,豌豆按颜色和形状分为四类:A1 黄而圆的, A2 青而圆的, A3 黄而有角的, A4 青而有角;( 2)每

2、种豌豆的比率(概率)分别为:p1P(A1) , p2 P( A2 ) ,p3P(A3 ) , p4P(A4 ) ,但未知;( 3)根据理论或经验提出假设:1,23 16, 3, 4;p 9 16pp 3 16p1 16( 4)做试验获得观察数据形状圆的有角的黄色315101颜色青色108321( 5)根据观察数据检验如下假设:H0 : p19 16, p23 16 , p33 16, p4 1 16若接受 H0 ,说明观察数据符合孟德尔的遗传学理论,也即说明孟德尔的遗传学理论正确;若拒绝 H0 ,说明观察数据不符合孟德尔的遗传学理论,也即说明孟德尔的遗传学理论不正确。二、分类数据检验问题的统计

3、模型(一)问题的一般提法1、总体分布设总体根据某项指标分为n 类,记为 A1, A2,L , Ar ,各类所占的比例记为 p1, p2 ,L , pr ,其中 pi0, rpi 1 ,但 pi 未知。也即总体分布i1为:总体类别比例2、假设检验A1A2LArp1p2Lpr根据理论,或从经验出发提出一个原假设:H: pp,i1,2,L ,r(* )0ii 0其中i0 , i1,2,L,r 已知,且 rpi0 1。pi13、研究内容对该总体独立重复观察n 个个体,记 n 个个体中,属于A i的观察2个数为 i , i1,2,L ,r ,其中有 rnin ,基于观察值 i , i1,2,L ,r 对

4、nni1原假设( * )进行检验。(二)检验方法、 2检验1( 1)检验统计量2r (ninpi0 )2i 1npi 0( 2)统计量的渐进分布若 H0 成立,当 n时,2r(ni npi0 )22Fi 1npi 0(r 1)( 3)拒绝域(给定检验水平,一般取0.1,0.05,0.01)W 212(r 1)若 2 W ,则在检验水平 下拒绝 H0 ;若 2 W ,则在检验水平 下接受 H0 ;( 4)检验 p 值(给定检验水平 ,一般取0.1,0.05,0.01)p P2 (r 1)2若若pp,则在检验水平下拒绝 H0 ;,则在检验水平下接受 H0 ;( 5)注:2 检验采用近似分布进行检验

5、,要求样本容量大,一般 n50 , npi05, i1,2,L ,r 。2、似然比检验随机向量 (n1,n2 ,L , nr ) M (n, p1, p2 ,L , pr ) ,即 (n1,n2 ,L ,nr ) 的联合分3布列为:p(n1,n2 ,L , nr ; p1, p2 ,L , pr )样本 (n1,n2 ,L ,nr ) 的似然函数为:L( p1, p2 ,L , pr ; n1,n2 ,L , nr )n!n1 !n2 !L nr !n!n1 !n2 !L nr !nnp11 p2 2 Lnn122L1ppnpr rnpr r检验问题( * )的似然比L( p10 , p20

6、,L , pr 0; n1,n2 ,L ,nr )Sup L( p1, p2 ,L , pr ;n1, n2 ,L , nr )p1 ,p2 ,L ,prn!n1n2Ln rn1 !n2 !Lnr !p10p20pr 0Supn!n1n2nrnr !p1p2L prp1,p2 ,L ,pr n1 !n2 !LnnrLn1020r0pp nn pr12 LSupp12pnrpp1,p2 ,L ,pr注:参数 p1, p2,L , pr 满足 rpi 1 ,似然比可以写为:i1L( p10 , p20,L , pr 0; n1 ,n2 ,L ,nr )SupL(p1, p2,L , pr ;n1,

7、 n2 ,L , nr )p1 , p2 ,L ,prnnr1020 Lnnnppprn1122 Ln112r 1rpr(1)Sup ppppL pp1,p 2 ,L ,pr 1求解SupnnLn(1p1p2Ln:p11p22prr 1 1pr 1 )rp1, p2 ,L , pr 1记Q( p, p, , p) pnpnLpn(1 ppLn1221112p )12Lr 11rrr 1 rln Q( p1, p2 ,Lr1ni ln pinrln(1 p1p2Lpr 1 ), pr 1)i14ln Q0p1令:ln Qp2Mln Qpr 100可得n1nrp1ppL p112r 1n2nrp2

8、1p1p2Lpr 1Mnr 1nrp1 p1 p2 L pr 1r 1r即 n1n2nr 1nrir 1niLnp1p2pr 1prpii 1也即参数 p1, p2,L , pr 的最大似然估计为:pini , i 1,2,L , r?nnnrLrnnpi0ppp0则似然比1020nrn 1 n2 n2nrn1Lnnn( 1)检验统计量rpi 02ln( ) 2ni lnni ni 1( 2)统计量的渐进分布若 H0 成立,当 n时,rpi02ln( ) 2ni lnF2 (r 1)ni ni1( 3)拒绝域(给定检验水平,一般取0.1,0.05,0.01)5W 2 ln( )12 (r1)若

9、若2ln()W ,则在检验水平下拒绝 H0 ;2ln()W ,则在检验水平下接受 H0 ;( 4)检验 p 值(给定检验水平,一般取0.1,0.05,0.01)p P2 (r1) 2ln( )若 p,则在检验水平下拒绝 H0 ;若 p,则在检验水平下接受 H0 ;三、引例分析( 1)记号A1 :黄而圆的, A2 :青而圆的, A3 :黄而有角的,A4 :青而有角;p1P(A1) , p2P( A2 ) , p3P(A3 ) , p4P( A4 ) ;n1 :黄而圆的豌豆个数,n2 :青而圆的豌豆个数,n3 :黄而有角的豌豆个数,n4 :青而有角的豌豆个数;(2)观察数据n1 315, n2 108, n3101, n432, nn1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 活动策划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号