《第四章 卡方检验》由会员分享,可在线阅读,更多相关《第四章 卡方检验(82页珍藏版)》请在金锄头文库上搜索。
1、第四章第四章 卡方检验卡方检验 卡方(2)检验主要有三种类型:第一是适合性检验,比较观测值与理论值是否符合;第二是独立性检验,比较两个或两个以上的因子相互之间是独立还是相互有影响。4.1 适合度检验适合度检验例4.1 有一鲤鱼遗传试验,以红色和青灰色杂交,其F2代获得不同分离尾数,问观测值是否符合孟德尔3:1遗传定律?4.1 适合度检验适合度检验 Minitab 输入数据,点击菜单统计表格卡方拟合优度检验(单变量):4.1 适合度检验适合度检验 Minitab弹出对话框,将实际实际选择到观测计观测计数数后面,颜颜色色选择到类别类别名称(可名称(可选选)后面。检验检验下面选择按按历历史史计计数制
2、定的比率数制定的比率,下拉条选择输输入列入列,将理论选择到按按历历史史计计数制数制定的比率定的比率后面: 4.1 适合度检验适合度检验 Minitab点击确定,即可得到结果:卡方值为302.629,p=0.0000.01,表明实际比率与理论比有非常显著的差异。4.1 适合度检验适合度检验 6SQ统计插件 输入数据,第一列为分类,这里为颜色,即青灰色与红色;第二列为实际的观测值;第三列为理论比率,要小数形式,这里为0.75与0.25。选择数据,点击菜单6SQ统计表格卡方拟合优度检验(单变量):4.1 适合度检验适合度检验 6SQ统计插件弹出对话框,无需修改设置:4.1 适合度检验适合度检验 6S
3、Q统计插件点击确定,即可得到结果:卡方值为302.629,p=0.0000.05,表明实际分离比与理论比无显著的差异。4.1 适合度检验适合度检验 6SQ统计插件 输入数据,第一列为分类,这里为豌豆性状;第二列为实际的观测值;第三列为理论比率,要小数形式。选择数据,点击菜单6SQ统计表格卡方拟合优度检验(单变量):4.1 适合度检验适合度检验弹出对话框,无需修改设置:4.1 适合度检验适合度检验点击确定,即可得到结果:卡方值为0.4700,p=0.9250.05,表明观测值的分离比与理论比无显著的差异。4.1 适合度检验适合度检验 DPS(1)输入数据与选择数据,点击菜单分类数据统计模型拟合优
4、度检验:4.1 适合度检验适合度检验 DPS立刻得到结果:结果中卡方值为0.4700(即Pearson卡方值,对应的p值为0.9254,大于0.05,说明实际观测值与孟德尔理论分离比9:3:3:1无显著差异。4.1 适合度检验适合度检验 SPSS 定义变量,输入数据,点击菜单数据加权个案,弹出对话框,选择加权个案,将数量选择到频率变量下面,点击确定。再点击菜单分析非参数检验旧对话框卡方,弹出对话框,将数量选择到检验变量列表中,在期望值下面选择值,按比例从小到大分别添加1,3,3,9:4.1 适合度检验适合度检验 SPSS点击确定,即可得到结果:4.1 适合度检验适合度检验例 4.3 某批苹果进
5、行保存实验,共60箱,每箱10个,实验结束后检查每箱苹果的变质情况,结果如下表,试检验苹果的变质数是否服从二项分布?4.1 适合度检验适合度检验设每个苹果变质的平均概率为p,变质数x服从二项分布,即xB(10,p)。p根据实际观测值的平均数 估计: 4.1 适合度检验适合度检验利用Excel函数BINOMDIST(i,n,p,0)计算二项分布的理论概率:4.1 适合度检验适合度检验 将理论概率乘以苹果总箱数(N=60),得到理论次数:4.1 适合度检验适合度检验将理论次数小于5的组与邻近组合并,直到次数大于5;同时合并实际观测次数与理论概率:计算并合并了理论概率与理论次数后,就可以用Minit
6、ab、6SQ统计插件、DPS解题,p=0.94310.05,因此苹果变质数是服从二项分布的。4.2 独立性检验独立性检验又叫列联表(contigency table)2检验,它是研究两个或两个以上因子彼此之间是独立还是相互影响的一类统计方法。4.2.1 22列列联联表(四格表表(四格表资资料)的独立性料)的独立性检验检验4.2.1.1 需要校正的四格表资料的需要校正的四格表资料的2检验检验例例4.4 现随机抽取吸烟人群与不吸烟人群,检查现随机抽取吸烟人群与不吸烟人群,检查是否患有气管炎,结果如下表所示:是否患有气管炎,结果如下表所示:试检验两种人群患病比例有无显著差异?试检验两种人群患病比例有
7、无显著差异?4.2.1.1 需要校正的四格表需要校正的四格表资资料的料的2检验检验本例资料经整理成四格表形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有 四个基本数据,故称四格表资料。4.2.1.1 需要校正的四格表需要校正的四格表资资料的料的2检验检验 DPS 输入数据与选择数据,点击菜单分类数据统计四格表四格表(22表)分析:4.2.1.1 需要校正的四格表需要校正的四格表资资料的料的2检验检验立刻得到结果:结果中给出了理论值,以及一般卡方值、校正卡方值、似然比卡方值与Williams校正G值。关于列联表2检验时,何种情况下需要校正要参考理论值(T)、自由度(df
8、)和四格表的总例数(n)。4.2.1.1 需要校正的四格表需要校正的四格表资资料的料的2检验检验 当n40且所有T5时,用一般卡方检验。若所得P,改用确切概率法(Fishers Exact Test); df=1或当n40但有1T5时,用校正卡方; 当 n0.05,尚不能认为两种药物治疗脑血管疾病的有效率不等。4.2.1.1 需要校正的四格表需要校正的四格表资资料的料的2检验检验 SPSS 定义变量,输入数据,点击菜单数据加权个案,弹出对话框:4.2.1.1 需要校正的四格表需要校正的四格表资资料的料的2检验检验 SPSS点击菜单分析描述统计交叉表:4.2.1.1 需要校正的四格表需要校正的四
9、格表资资料的料的2检验检验 SPSS弹出对话框,将组别选择到行,将效果选择到列:4.2.1.1 需要校正的四格表需要校正的四格表资资料的料的2检验检验 SPSS点击统计量,弹出对话框,勾选卡方:4.2.1.1 需要校正的四格表需要校正的四格表资资料的料的2检验检验 SPSS点击继续,返回上级对话框,点击确定,得到结果:由于理论值小于5,因此要看校正的卡方值3.145,对应的p为0.0760.05,尚不能认为两种药物治疗脑血管疾病的有效率不等。4.2.1.2 配配对对四格表四格表资资料的料的2检验检验例 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果
10、见表。问两种方法的检测结果有无差别?4.2.1.2 配配对对四格表四格表资资料的料的2检验检验 DPS 在DPS中输入数据,选择数据,点击菜单分类数据统计四格表四格表(22表)分析:4.2.1.2 配配对对四格表四格表资资料的料的2检验检验 DPS立刻得到结果:配对设计卡方=5.7857,p=0.01620.05,可以认为两种方法的检测结果是有显著差异的,免疫荧光法的阳性检测率高。4.2.1.2 配配对对四格表四格表资资料的料的2检验检验 SPSS 定义变量乳胶凝集、免疫荧光、数量,输入数据:4.2.1.2 配配对对四格表四格表资资料的料的2检验检验 SPSS点击菜单数据加权个案,弹出对话框:
11、4.2.1.2 配配对对四格表四格表资资料的料的2检验检验 SPSS将数量选择到频数变量中,点击确定。点击菜单分析描述统计交叉表:4.2.1.2 配配对对四格表四格表资资料的料的2检验检验 SPSS弹出对话框,将乳胶凝集选择到行,将免疫荧光选择到列:4.2.1.2 配配对对四格表四格表资资料的料的2检验检验 SPSS点击统计量,弹出对话框,勾选卡方与McNemar:4.2.1.2 配配对对四格表四格表资资料的料的2检验检验 SPSS点击继续,返回上级对话框,点击确定,得到结果:根据NcNemar检验,对应的p为0.0130.05,认为两种方法的检测结果是有显著差异的。4.2.1.3 四格表四格
12、表资资料的料的Fisher确切概率法确切概率法 适用条件为n40或T1或p。例 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表。问两组新生儿的HBV总体感染率有无差别?4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 DPS 在DPS中输入数据,选择数据,点击菜单分类数据统计四格表四格表(22表)分析:4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 DPS立刻得到结果:4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 SPSS 定义变量,输入数据,
13、点击菜单数据加权个案,弹出对话框,选择加权个案,将数量选择到频率变量下面,点击确定。点击菜单分析描述统计交叉表:4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 SPSS弹出对话框,将组别选择到行,将效果选择到列:4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 SPSS点击统计量,弹出对话框,勾选卡方:4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 SPSS点击继续,返回上级对话框,点击确定,得到结果:n=330.05,认为两组新生儿HBV感染率的无显著差异。4.2.2 2C列列联联表的独立性表的独立性检验检验例4.4
14、 检验甲、乙、丙三种农药对蚜虫的毒杀效果,结果如表4-2,试分析三种农药对蚜虫毒杀效果是否一致?4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 DPS输入数据与选择数据,点击菜单分类数据统计RC列联表卡方检验:4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 DPS立刻得到结果:结果中看卡方值Chi=7.69194,对应的p值为0.021370.05,表明三种农药对蚜虫的毒杀效果有显著的差异。4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 SPSS 定义变量,输入数据,点击菜单数据加权个案,弹出对话框,选择加权个案,将
15、数量选择到频率变量下面,点击确定。点击菜单分析描述统计交叉表:4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 SPSS弹出对话框,将农药选择到行,将效果选择到列:4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 SPSS点击统计量,弹出对话框,勾选卡方:4.2.1.3 四格表四格表资资料的料的Fisher确切概率法确切概率法 SPSS点击继续,返回上级对话框,点击确定,得到结果:结果中看卡方值Chi=7.692,对应的p值为0.0210.05,表明三种农药对蚜虫的毒杀效果有显著的差异。4.2.3 RC列列联联表的独立性表的独立性检验检验4.2.
16、3.1 多个多个样样本率的比本率的比较较 例 某医院用碘剂治疗地方性甲状腺肿,不同年龄的治疗效果列于表4-3,试检验不同年龄的治疗效果是否有差异?年年龄龄(岁岁)治愈治愈显显效效好好转转无效无效11306791053150322320450岁岁以上以上10112354.2.3.1 多个样本率的比较多个样本率的比较4.2.3.1 多个多个样样本率的比本率的比较较 DPS 输入数据与选择数据,点击菜单分类数据统计RC列联表卡方检验:4.2.3.1 多个样本率的比较多个样本率的比较4.2.3.1 多个多个样样本率的比本率的比较较 DPS立刻得到结果:4.2.3.1 多个样本率的比较多个样本率的比较4
17、.2.3.1 多个多个样样本率的比本率的比较较 DPS结果:结结果果中中看看卡卡方方值值Chi=46.98805,对对应应的的p值值为为0.00000.01,表表明明不不同同年年龄龄治治疗疗效果是有非常效果是有非常显显著的差异。著的差异。4.2.3.3 双向无序分类资料的关联性检验双向无序分类资料的关联性检验测测得得某某地地5801人人的的ABO血血型型和和MN血血型型结结果果如如表表 ,问问两两种血型系种血型系统统之之间间是否有关是否有关联联?ABO血型MN血型MNMNO431490902A388410800B495587950AB137179324.2.3.3 双向无序分类资料的关联性检验
18、双向无序分类资料的关联性检验在在DPS中中输输入入数数据据与与选选择择数数据据,点点击击菜菜单单分分类类数数据据统统计计RC列联表卡方检验:列联表卡方检验: 4.2.3.3 双向无序分类资料的关联性检验双向无序分类资料的关联性检验即可得到结果:即可得到结果:结结果果中中,卡卡方方值值Chi=213.16159,对对应应的的p=0.0000.01,可可认认为为两两种种血血型型之之间间的的关关联联非非常常显显著著。根根据据Pearson列列联联系系数数=0.1883,数数值值较较小小,故故认认为为两两种种血血型型系系统统间间虽虽然然有有关关联联性性,但但关关系系不不太太密密切切。列列联联系系数数为为0表表示示完完全全独独立立;为为1表表示示完完全全相相关关;列列联联系系数数愈愈接接近近于于0,关系愈不密切;列联系数愈接近于关系愈不密切;列联系数愈接近于1,关系愈密切。,关系愈密切。4.2.3.3 双向无序分类资料的关联性检验双向无序分类资料的关联性检验在在DPS中中输输入入数数据据与与选选择择数数据据,点点击击菜菜单单分分类类数数据据统统计计RC列联表卡方检验:列联表卡方检验: