第十四章卡方检验.doc

上传人:hs****ma 文档编号:553642465 上传时间:2022-08-15 格式:DOC 页数:6 大小:107.01KB
返回 下载 相关 举报
第十四章卡方检验.doc_第1页
第1页 / 共6页
第十四章卡方检验.doc_第2页
第2页 / 共6页
第十四章卡方检验.doc_第3页
第3页 / 共6页
第十四章卡方检验.doc_第4页
第4页 / 共6页
第十四章卡方检验.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《第十四章卡方检验.doc》由会员分享,可在线阅读,更多相关《第十四章卡方检验.doc(6页珍藏版)》请在金锄头文库上搜索。

1、第十四章 卡方检验本章主要讲解Crosstabs菜单功能,该菜单项专门处理分类资料(包含有序分类和无序分类资料),类似的菜单还有Logistic,Log linear菜单也是专门针对分类资料。引例:1、 请分析性别与所喜爱的颜色是否有关?喜爱颜色性别红蓝绿男301010女2010202、 请比较两种治疗方法是否有显著差别,哪种治疗方案更好?状态处理治愈未治愈13614222283、 杀人犯的种族是否会影响判处死刑?对1976年-1977年美国弗罗里达州20个地区杀人案件中的326个被告进行调查,考虑的种族有白人和黑人。用“是”或“否”表示是否判死刑,调查数据如下:种族判刑白黑是1917否141

2、149析:在调查问卷中,常常涉及到上述类型的数据,该种类型的表格称为列联表,也称为交叉表,具有两个或多个分类型变量。其一般格式表现为,即行变R个水平,而列变量C个水平,最特殊的表为,即行变量和列变量均只有两个水平,如引例2和3。对该种类型数据的分析,常涉及到下列几个问题:产生汇总分类数据列联表,即计算行/列百分数、行/列汇总数等序列描述统计量检验行变量与列变量是否独立(即有无相关性)完成上述两项任务,可通过SPSS-Descriptive-Crosstabs过程实现,下面是有关Crosstabs过程的详细内容。一、 CROSSTABS要求的数据格式CROSSTABS专门处理分类资料,有其特定的

3、要求格式行变量列变量频数.如:针对引例1,SPSS对该数据进行分析需要的数据格式为:性别颜色频数113012101310212022102320在完成上述数据转换过程之后,进一步指定频数变量,即DATA-WEIGHT CASES-频数,该过程指定频数变量。二、CROSSTABS如何解决上述问题解决上述列联表中行变量与列变量是否相关,一个通常的方法是卡方检验,它用于检验分类型变量有无相关性,其统计假设为:行变量与列变量无关联性(不相关):行变量与列变量有关联性(相关)卡方检验统计量计算公式略,有兴趣可参考其他教材,本处只讲解涉及到的统计假设,以及如何在SPSS中检验并如何分析SPSS输出结果。注

4、:此方法一般要求样本容量不小于50,每一组频数都不小于5,如果出现小于5的情况,一般应选择合并。否则运用卡方检验分析出的结果是不可靠的。例1:见书260。无序分类变量的相关性检验 分析:该数据满足卡方检验的要求,各组频数不小于,样本容量也超过50。按照下述过程操作:Descriptive-crosstab-row-column-statisitcs-chi-square-ok.下面给出SPSS最关键的一张输出表:Chi-Square Tests ValuedfAsymp. Sig. (2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Pearson

5、 Chi-Square6.133(b)1.013 Continuity Correction(a)5.1181.024 Likelihood Ratio6.3041.012 Fishers Exact Test .018.011Linear-by-Linear Association6.0841.014 N of Valid Cases126 a Computed only for a 2x2 tableb 0 cells (.0%) have expected count less than 5. The minimum expected count is 13.78.在上述诸多的结果中应当

6、看哪一项分析结果呢?标准如下:当样本容量超过40,且每一组频数超过5,直接看卡方检验即可。若值和显著性水平较为接近,则使用确切概率法。当样本容量超过40,但有频数小于5,直接看校正卡方检验即可。当样本容量小于40,且有频数小于5,则不适用卡方检验,而使用确切概率法。Crosstabs 对话框中最重要的两个对话框、 EXACT该对话框主要决定计算概率的方法,包含两种类型:近似概率法,确切概率法。默认状态下均选择第一项,即近似概率法,特殊情况下,如存在频数小于5的情况,应该使用确切概率法。、 Statistics (1)、Chi-square: 用于检验行变量与列变量是否相关。对于特殊的还会给出校

7、正卡方检验和确切概率的检验结果。(2)、Nominal:专门反映分类变量的相关性。实际上更适合于无序分类变量。(3)、Ordinal : 专门反映分类变量的一致性。只适合于有序分类变量。所谓一致性,指的是行变量水平越高,列表量水平也越高,反之亦然。否则,认为行变量与列变量不具有一致性。(4)Kappa: 内部一致性系数(5)McNemanr:配对卡方检验。只适合于方形表格。即行变量和列变量水平数相同。(6)Cochrans and Mantel-Haenszel statistics :分层卡方检验。适合于两个二分类变量进行相关性检验以及方差齐性检验。例2:请根据引例2提供的数据分析两种方案的

8、疗效是否有显著差别。主要分析结果:Chi-Square Tests ValuedfAsymp. Sig. (2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Pearson Chi-Square8.046(b)1.005 Continuity Correction(a)6.9381.008 Likelihood Ratio8.1701.004 Fishers Exact Test .008.004Linear-by-Linear Association7.9661.005 N of Valid Cases100 a Computed only fo

9、r a 2x2 tableb 0 cells (.0%) have expected count less than 5. The minimum expected count is 21.00.由于此题目中各单元的频数符合卡方检验的要求,因此,看第二行校正卡方检验结果即可。从表中可知,P值小于0.05,拒绝原假设,认为两种治疗方案有显著差异,从所提供的数据看,显然第一种治疗方案更有效。例3:请分析判死刑与种族是否有关?主要分析结果: 从上表中看出,判刑与种族无关联性。为对上述结果加以佐证,可以计算出列联相关系数如下:从上表中可知,反映行变量与列变量相关系数的三个指标取值都很小(这里的行变量与

10、列变量都是无序分类变量,因此先用上述三指标分析行变量与列变量的相关性),取值越低,相关性越弱,从结果看,印证了卡方检验的结果。总结:实际上,三个引例均属同一种类型,即数据均满足卡方检验的要求,每个单元的频数都不小于5,但实际处理问题的过程中,往往不会都是这样理想的数据。当出现部分单元的频数小于5时,应该在EXACT中使用确切概率法。例4:为比较两种工艺对产品的质量是否有影响,对其产品进行抽样检查,结果如下:合格不合格工艺134工艺264合计98 注 :进行卡方检验的同时,计算出列联相关系数以便辅助说明结果。例5:见书266。有序分类变量之间的相关性检验主要分析结果:见书P267。此处由于有多个

11、单元的期望频数小于5,故应该使用确切概率法。补充说明:本例中所提到的“血压控制情况”和“肥胖程度”两项指标均属于有序分类变量,对于此种类型的变量,通常涉及两个问题:(1)两个变量之间是否有关系. (2)两个变量之间,是否存在随着一个变量的等级增加,另一个变量的等级也增加。对前一问题的回答,通过卡方检验即可完成,但对后一问题的回答需要计算列联相关系数完成。通过ORDINAL复选框完成。上例中相关系数如下: 从 从上述4项指标看,列联相关系数的取值很小,也印证了卡方检验分析的结论。例6:一位动物流行病学家检验奶牛是否患有某种细菌性疾病,通过分析获得如下数据:请分析:(1)奶牛疾病与牛群大小是否有关?(2)随着牛群的增大,奶牛患病程度是否有增加或减小的趋势?没有患病低程度患病高程度患病小959中18419大1188136例7:见书P267 。配对卡方检验。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号