列联表中的相关性测量

上传人:cl****1 文档编号:496524602 上传时间:2023-12-11 格式:DOC 页数:11 大小:367KB
返回 下载 相关 举报
列联表中的相关性测量_第1页
第1页 / 共11页
列联表中的相关性测量_第2页
第2页 / 共11页
列联表中的相关性测量_第3页
第3页 / 共11页
列联表中的相关性测量_第4页
第4页 / 共11页
列联表中的相关性测量_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《列联表中的相关性测量》由会员分享,可在线阅读,更多相关《列联表中的相关性测量(11页珍藏版)》请在金锄头文库上搜索。

1、第八章 列联表中的相关性测量第一节 列联表相关测量的有关问题、交互分类和列联表来自某个总体的样本,同时按两个或两个以上的标准进行分类。分类的资料可以排列成一个行、列交织的表,称为列联表,也叫交互分类表。如:妇女的教育水平与志愿愿望(Y)教育水平(X)合计高低幸福家庭12595220理想工作65105170合计190200390列联表可以清楚反映在 X变化的条件下,Y的次数分布情况。因此,列联表又称为条件次数表。列和:行边缘次数行和:列边缘次数表中的次数:条件次数,表示在自变量的每个条件,因变量各个值的数目。X1X2Xc合计丫1fnf12f1cfg丫2f21f22f2cf2.111Yrfr1fr

2、2f rcf合计f14f*f、条件频率妇女的教育水平与志愿(%教育水平(X)愿望(Y)高低幸福家庭65.7947.50理想工作34.2152.50100.00100.00愿望(Y)教育水平(X)高低幸福家庭56.8243.18100.00理想工作38.2461.76100.00第二节McNmar检验这种检验方法适用于非独立样本的2*2表,即单因素两水平。Cochran检验是该检验方法在多样本条件下的推广。例为了评估一位政党候选人竞选活动的效果,由60个选民组成的随机样本在候选人演说之前和之后,询问的问题是“对该候选人是投赞成还是反对”受试者演说前演说后受试者演说前演说后受试者演说前演说后111

3、210141112112211420031023004311401241144005012500451160026114611711270047018012811480091129004901100130115011110031115100121132005201130133115311141134005400150135115511161036005600170137115700180138015800191139115911200040006000后(-)后(+)前(+)225前(-)20i3McNma检验思路:在竞争演说前后有15个人改变了观点,我们分析的焦点在改变了观点的15个人。H

4、0 :竞争演说无效应H i :竞争演说有效应在原假设为真的条件下,认为n个人改变观点的人是随机的选择“+”或“-”。可以认为,选择“ +”的人数是服从 B (n, 0.5 )分布。 则检验的p值:(n为前后改变了选择的样本点 )。i5P 二 Ci50.5i(0.5)i5-L = 0.000488i 432或 P= C1i50.5i(0.5)15i z0故拒绝原假设,竞争演说有显著的正效应。注:当样本容量(改变观点或发生改变)大于 50时,可以将 2检验用于McNmar检验。后(-)后(+)前(+)aba+b前(-)cdc+dIa+cb+da+b+c+d因为詐2(1)2 2 2 a - npia

5、 - npin -d -n np?= !npin(1 - Pi)nPinP2第三章两相关样本的非参数检验#第三章两相关样本的非参数检验#nPi在原假设为真时,W g二则上式为22(1)等价的公式为22(1)2 2a - npid - np?np2当p(a -d)2a d则拒绝原假设。第三节 列联表中的2检验及相关测量一、四格表资料的X 2检验(两个样本率比较)两因素两水平,两因素是否相互独立。1、两个样本率资料的四格表形式xyaba+bcdc+d1a+cb+da+b+c+d如果X与丫相互没有关系,有a: (a+b)(a+c)/(a+b+c+d)=e11b: (a+b)(b+d)/(a+b+c+

6、d)=e12c: (a+c)(c+d)/(a+b+c+d)=e21d: (b+d)(c+d)/(a+b+c+d)=e22故设计统计量(a -冇)2 2 2(b -$2) (c -). (a -电)enei2e21e222(1)2n(ad be)(a b)(b - c)(c d)(d a)2、x 2检验的基本思想X 2值反映了实际频数和理论频数的吻合程度。X 2值越小,说明实际频数与理论频数越吻合,X 2值越大,说明实际频数与理论频数差异越大。如果 检验假设成立,则实际频数与理论频数之差一般不会很大,即出现大的X值的概率是小的。若在无效假设下,出现了大的X 2值的概率PW a (检验水准),我们

7、就怀疑假设的成立,因此拒绝它。另外x 2值的大小,还与自由度有关。故考虑X 2值大小的意义时要同时考虑自由度。二、 行(r) x列(C)表资料的X 2检验两因素多水平的情形。1、如果x与y相互独立,则有fj /N : (fj/NKfi./N),所以有 J f/N= ejr cQ ;二(fj ej)2 2l(r -1)(c-1)li 4 j 4% 2的相关测量方法:相关系数第三章两相关样本的非参数检验#第三章两相关样本的非参数检验#例如 一-3 二bc).(a b)(b c)(c d)(d a)的绝对值最小的为零,为零时说明X与Y之间无关三、三个因素的多水平的情况设有3个因素,每个因素的水平分别

8、为r,c和I。r c IQ D (加 -)2心 2(r-1)(c-1)(k-1)】fi,=nni 4 j 4 k z4其中eijk例对一些交通事故的保险结果表明出事故率和赔保历史与教育程度等因素有关。有资料如下:赔保历史教育程度小学以下初中咼中大学及以上从未赔过2811305050赔过一次25690105赔过两次以上1073064利用该数据你可以得到什么信息。利用你知道的检验方法进行检验。解1:米用3X 4的 $检验来检验相关性。H 0 :教育程度水平与赔保历史数目不相关H1 :教育程度水平与赔保历史数目相关2811305050511理论频数322.948125.36833.0971529.5

9、868525690105361理论频数228.149288.5672223.3817520.901861073064147理论频数92.9028536.064779.5210998.511286X64425066591019Q281 322.948)2 -(心.511): 58.367322.9488.511P(6) A58.367) 0.005 ,故拒绝原假设,认为教育程度水平与赔保历史数目有关第四节熵和似然比检验一、熵从统计的观点看,一个事件A的发生如果给人们带来了信息,则应该认为它是一个随机事件。显而易见,一件为人们所完全预料的事件(如必然事件),不会给人们带来信息。假定A和B是两个随机

10、事件,有 P( A)大于P( B),人们的常识是概率小的事件带 给人们更多的信息。所以B事件的信息比A事件多。必然事件的信息为0。定义熵:一个离散的随机变量 匚a1a2a3an、lP(印)p( a2)p(a3)P (an )丿n定义 h()= _ p in(pj 为 的熵。i=1Pi是随机变量 =ai的概率,该概率接近 1,它的“确定性”程度越大;pi接近0,它的“确定性”程度就差。当pi = 1,则-l n(pj =0,当pi = 0,则-ln (pj :,n所以我们用h( JRin (pj来反映取值的分散程度,该值越大,不确定的成分越i=1多。两个随机变量 X和Y的联合熵:r ch(X,Y

11、) - 八、Pj ln( pji=1 j =1r c l三个随机变量X, Y和Z的联合熵:h(X,Y,Z)-八7 7 Pijk in(Pijk) im j # km熵反映随机变量的不确定性。当随机变量之间相互独立时,则不确定的因素越多,则联合熵较大。三、似然比检验似然比是列联表中所涉及的变量相互独立时的似然函数的最大值与不相互独立时的似然函数的最大值之比。似然比统计量常常用来检验变量间的独立性。似然比检验的原假设是 H 0 : X和Y是相互独立的。现从设有两个随机变量 X和Y,X取r个值a1,a2 ,ar,Y取c个值b|,b2,bc。r c中抽取一个容量为n的样本。有(X =aY =bj)的频

12、数为fij。二二fij由于当两个随机变量 X和 Y 相互独立时第三章两相关样本的非参数检验#第三章两相关样本的非参数检验#P(x =a,Y =bj)= P(x p)p(丫二bj)第三章两相关样本的非参数检验#第三章两相关样本的非参数检验#则两个随机变量 X和Y相互独立时,p(x二a,Y二bj)的极大似然估计为:.j第三章两相关样本的非参数检验#第三章两相关样本的非参数检验#两个随机变量X和Y不相互独立时,p(X=a ,丫 = 6)的极大似然估计为:pj第三章两相关样本的非参数检验#第三章两相关样本的非参数检验#(?i.?j. fj?jfjr c则似然比为:上=:一i j A第三章两相关样本的非参数检验#第三章两相关样本的非参数检验#r c似然比统计量为-2l nt二i二 jAfij l?.jr c:?j=2瓦瓦fij ln c

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号