卡方检验详述

上传人:hs****ma 文档编号:507555810 上传时间:2023-06-19 格式:DOC 页数:2 大小:25KB
返回 下载 相关 举报
卡方检验详述_第1页
第1页 / 共2页
卡方检验详述_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《卡方检验详述》由会员分享,可在线阅读,更多相关《卡方检验详述(2页珍藏版)》请在金锄头文库上搜索。

1、卡方检验什么是卡方检验卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。卡方检验的基本原理卡方检验是以x2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。该检验的基本思想是:首先假设H0成立,基于此前提计算出x2值,它表示观察值与理论值之间的偏离程度。根据分布及自由度可以确定在H

2、0假设成立的情况下获得当前统计量及更极端情况的概率P。如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。卡方值的计算与意义X2值表示观察值与理论值之问的偏离程度。计算这种偏离程度的基本思路如下。设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差称为残差。显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。因为残差有正有负,相加后会彼此抵消,总和仍然为0,为此可以将残差平方后求和。另一

3、方面,残差大小是一个相对的概念,相对于期望频数为10时,期望频数为20的残差非常大,但相对于期望频数为1000时20的残差就很小了。考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。进行上述操作之后,就得到了常用的x2统计量,由于它最初是由英国统计学家KarlPearson在1900年首次提出的,因此也称之为Pearsonx其计算公式为:2P(A_EF占(A-E子宀(A-nPifE行耳七riPi其中,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。i水平的期望频数Ti等于总频数nx水平的期望概率pi,k为单元格数。当n比较大时

4、,x2统计量近似服从k-1(计算Ei时用到的参数个数)个自由度的卡方分布。由卡方的计算公式可知,当观察频数与期望频数完全一致时,x2值为0;观察频数与期望频数越接近,两者之间的差异越小,x2值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,x2直越大。换言之,大的x2直表明观察频数远离期望频数,即表明远离假设。小的x2直表明观察频数接近期望频数,接近假设。因此,x2是观察频数与期望频数之间距离的一种度量指标,也是假设成立与否的度量指标。如果x2值小”,研究者就倾向于不拒绝H0;如果x2值大,就倾向于拒绝H0。至于x2在每个具体研究中究竟要大到什么程度才能拒绝H0,则要借助于卡方分布

5、求出所对应的P值来确定。卡方检验的样本量要求卡方分布本身是连续型分布,但是在分类资料的统计分析中,显然频数只能以整数形式出现,因此计算出的统计量是非连续的。只有当样本量比较充足时,才可以忽略两者问的差异,否则将可能导致较大的偏差具体而言,一般认为对于卡方检验中的每一个单元格,要求其最小期望频数均大于1,且至少有45的单元格期望频数大于5,此时使用卡方分布计算出的概率值才是准确的。如果数据不符合要求,可以采用确切概率法进行概率的计算。卡方检验的用途卡方检验最常见的用途就是考察某无序分类变量各水平在两组或多组间的分布是否一致实际上,除了这个用途之外膏方检验还有更广泛的应用。具体而言,其用途主要包括

6、以下几个方面:(1) 检验某个连续变量的分布是否与某种理论分布相一致。如是否符合正态分布、是否服从均匀分布、是否服从Poisson分布等。检验某个分类变量各类的出现概率是否等于指定概率。如在36选7的彩票抽奖中,每个数字出现的概率是否各为136;掷硬币时,正反两面出现的概率是否均为05。(2) 检验某两个分类变量是否相互独立。如吸烟(二分类变量:是、否)是否与呼吸道疾病(二分类变量:是、否)有关;产品原料种类(多分类变量)是否与产品合格(二分类变量)有关。(3) 检验控制某种或某几种分类因素的作用以后,另两个分类变量是否相互独立。如在上例中,控制性别、年龄因素影响以后,吸烟是否和呼吸道疾病有关

7、;控制产品加工工艺的影响后,产品原料类别是否与产品合格有关。(4) 检验某两种方法的结果是否一致。如采用两种诊断方法对同一批人进行诊断,其诊断结果是否一致;采用两种方法对客户进行价值类别预测,预测结果是否一致。卡方检验的应用条件1、适用于四格表应用条件:【1】随机样本数据。两个独立样本比较可以分以下3种情况:(1) 所有的理论数T5并且总样本量n40用Pearson卡方进行检验。(2) 如果理论数Tv5但T1并且140用连续性校正的卡方进行检验。(3) 如果有理论数Tv1或nv40,则用Fisher检验。【2】卡方检验的理论频数不能太小。2、RXC表卡方检验应用条件:(1) RXC表中理论数小于5的格子不能超过1/5;(2) 不能有小于1的理论数。如果实验中有不符合RXC表的卡方检验,可以通过增加样本数、列合并来实现。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 活动策划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号