《第七章卡方检验》由会员分享,可在线阅读,更多相关《第七章卡方检验(52页珍藏版)》请在金锄头文库上搜索。
1、第七章 2检验检验 2检验用途单个频数分布的拟合优度检验 完全随机设计两组频数分布2检验多组频数分布的2检验配对设计下两组频数分布2检验 *四格表的确切概率法四格表的确切概率法 2分布和拟合优度检验分布和拟合优度检验 2分布分布 2分布是一种连续型随机变量的概率分分布是一种连续型随机变量的概率分布。如果布。如果Z服从标准正态分布,那么服从标准正态分布,那么Z2服从服从自由度为自由度为1的的 2分布分布, 其概率密度在(其概率密度在(0,)区间上表现)区间上表现为为L型型,如图,如图7-1对应于自对应于自由度由度=1的曲线,取较小值的可能性较大,的曲线,取较小值的可能性较大,取较大值的可能性较小
2、。取较大值的可能性较小。 v=1v=4v=6v=9 2分布和拟合优度检验分布和拟合优度检验图图7-1, 2分布的形状依赖于自由度分布的形状依赖于自由度的大小,的大小,当自由度当自由度2时,随着时,随着的增加,曲线逐渐的增加,曲线逐渐趋于对称,当自由度趋于对称,当自由度趋于趋于时,时, 2分布逼分布逼近正态分布。各种自由度的近正态分布。各种自由度的 2分布右侧尾分布右侧尾部面积为部面积为时的临界值记为时的临界值记为 列于附表列于附表8。 2分布和拟合优度检验分布和拟合优度检验拟合优度检验拟合优度检验拟合优度检验是根据样本的频率分布检验其拟合优度检验是根据样本的频率分布检验其总体分布是否等于某给定
3、的理论分布。总体分布是否等于某给定的理论分布。拟合优度检验步骤:拟合优度检验步骤:1建立检验假设建立检验假设H0:总体分布等于给定的理论分布总体分布等于给定的理论分布H1:总体分布不等于给定的理论分布总体分布不等于给定的理论分布 2分布和拟合优度检验分布和拟合优度检验2计算检验统计量计算检验统计量 实际观察到的频数用实际观察到的频数用A表示,根据表示,根据H0确确定的理论频数用定的理论频数用T表示,则大样本时统计量,表示,则大样本时统计量,自由度自由度=K-1-(利用的参数个数)利用的参数个数) 2分布和拟合优度检验分布和拟合优度检验 以上两个公式以上两个公式 2检验的基本公式,所检验的基本公
4、式,所有其它形式的有其它形式的 2检验公式都来源于此。检验公式都来源于此。 2值反映了样本实际频数分布与理论总体分值反映了样本实际频数分布与理论总体分布的符合程度。如果原假设成立,布的符合程度。如果原假设成立, 2值不值不会太大;反之,会太大;反之,A若与若与T差距大,差距大, 2值也大;值也大;当当 2值超出一定范围时,就有理由认为原值超出一定范围时,就有理由认为原假设不成立。假设不成立。 3确定相应的概率确定相应的概率P,作出推断结论作出推断结论 2分布和拟合优度检验分布和拟合优度检验例例7-1 对表对表7-1所示数据作正态分布拟合优度所示数据作正态分布拟合优度检验。检验。136例体模骨密
5、度测量值的均数例体模骨密度测量值的均数=1.260;标准差标准差=0.010检验的假设检验的假设:H0:总体分布等于均数为总体分布等于均数为1.260,标准差为,标准差为0.010的正态分布的正态分布H1:总体分布不等于该正态分布总体分布不等于该正态分布 表表7-1 136例体模骨密度例体模骨密度测测量量值频值频数分布表及数分布表及拟拟合合优优度度检验统计检验统计量的量的计计算算组组段段(1)实际频实际频数数A(2)(X1 1)(3)(X2 2)(4)P(X)(5)T=nP(X)(6)(AT)2/T(7)1.22820.000690.004660.00397 0.54053.941431.23
6、420.004660.022750.01809 2.46010.086051.24070.022750.080760.05801 7.88890.100161.246170.080760.211860.1311017.82940.038591.252250.211860.420740.2088828.40830.408921.258370.420740.655420.2346831.91670.809611.264250.655420.841340.1859225.28550.003221.270160.841340.945200.1038614.12440.249061.27640.9452
7、00.986100.04090 5.56180.438581.28210.986100.997440.01135 1.54340.19130合合计计6.26692 2分布和拟合优度检验分布和拟合优度检验 表表7-1 中第中第3列、第列、第4列正态分布函数列正态分布函数值可通过对作标准正态变换后查正态分值可通过对作标准正态变换后查正态分布表或利用相应的布表或利用相应的SAS程序得到,第程序得到,第5列为第列为第4列与第列与第3列的差值,第列的差值,第6列理论列理论频数频数T等于总例数等于总例数136与各组段概率的乘与各组段概率的乘积,第列各数之和即检验统计量积,第列各数之和即检验统计量 2值。值
8、。 2分布和拟合优度检验分布和拟合优度检验计算统计量计算统计量:推断结论推断结论:自由度自由度=10-1-2=7,查附表查附表8,得到得到P0.50,可以认为该样本服从正态分布。可以认为该样本服从正态分布。 计算T I 时的参数有2个(均数和标准差)完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验二分类情形二分类情形22列联表表 例例7-2 某医师研究用兰芩口服液与银黄口服某医师研究用兰芩口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相液治疗慢性咽炎疗效有无差别,将病情相似的似的80名患者随机分成两组,分别用两种名患者随机分成两组,分别用两种药物治疗,结果见表药物治疗,结果见表
9、7-2。 表7-2慢性咽炎两种药物疗效资料药药物物疗疗效效合合计计有效有效无效无效兰兰芩口服液芩口服液41 (36.56) 4 (8.44)45(固定(固定值值)银银黄口服液黄口服液24 (28.44)11 (6.56)35(固定(固定值值)合合计计 65 1580完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验问题:这两个频数分布的总体分布是否相问题:这两个频数分布的总体分布是否相等?或者这两份样本是否来自同一个总体。等?或者这两份样本是否来自同一个总体。因为这里是二分类变量,问两个总体分布因为这里是二分类变量,问两个总体分布是否相等就相当于问两个有效概率是否相是否相等就相当于问
10、两个有效概率是否相等。等。 完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验(1)建立检验假设)建立检验假设H0:1= 2 两药的有效概率相同两药的有效概率相同H1: 12 两药有效概率不同两药有效概率不同 检验水准检验水准 =0.05 (2)计算检验统计量)计算检验统计量完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验自由度自由度 =(2-1)(2-1)=1(3)确定)确定p值值查附表查附表8, =1对应的临界值对应的临界值 , P0.025。(4)结论结论:拒绝拒绝H0,两样本频率的差别具有统计学两样本频率的差别具有统计学意义。可以认为,兰芩口服液和银黄口服液的总意
11、义。可以认为,兰芩口服液和银黄口服液的总体有效概率不同,前者(体有效概率不同,前者(91.1%)高于后者)高于后者(68.6%)。)。 完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验对于四格表资料,四格表专用公式对于四格表资料,四格表专用公式 完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验当当n40时,如果有某个格子出现时,如果有某个格子出现1T0.1,高于检验水准高于检验水准 ,不能拒,不能拒绝绝H0,差别无统计学意义,尚不能认为两差别无统计学意义,尚不能认为两种治疗方案的总体缓解概率不同。种治疗方案的总体缓解概率不同。 完全随机设计两组频数分布完全随机设计两组频
12、数分布 2检验检验特别注意特别注意: 当四格表出现当四格表出现T1或或n40时,校正时,校正 2值也值也不恰当,这时必须用四格表的确切概率计不恰当,这时必须用四格表的确切概率计算法(见本章第算法(见本章第6节)。节)。 完全随机设计两组频数分布2检验多分类的情形多分类的情形2C列联表列联表 定性变量具有多分类时定性变量具有多分类时, 两个频数分布两个频数分布的数据可表示为一个的数据可表示为一个2C列联表。列联表。 例例7-4 北京市北京市1986年城市和农村年城市和农村20至至40岁已婚妇女避孕方法情况如表岁已婚妇女避孕方法情况如表7-5所示(据所示(据王绍贤等调查资料),试分析北京城市和王绍
13、贤等调查资料),试分析北京城市和农村采用不同避孕方法的总体分布是否有农村采用不同避孕方法的总体分布是否有差别。差别。 表7-5 北京城市和农村已婚妇女避孕方法情况 地区地区避孕方法避孕方法合合计计节节育器育器服避孕服避孕药药避孕套避孕套节节育器育器其他其他城市城市1533316515340431农农村村320754332018518合合计计47310820847358949完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验(1)建立检验假设)建立检验假设H0:北京城市和农村已婚妇女避孕方法的总北京城市和农村已婚妇女避孕方法的总体概率分布相同体概率分布相同H1:北京城市和农村已婚妇女避
14、孕方法的总北京城市和农村已婚妇女避孕方法的总体概率分布不同体概率分布不同检验水准检验水准 =0.05。完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验(2)计算检验统计量)计算检验统计量H0成立时,两组概率分布相同,均近似地等成立时,两组概率分布相同,均近似地等于合并计算的频率分布。于合并计算的频率分布。完全随机设计两组频数分布完全随机设计两组频数分布 2检验检验 =(2-1)(4-1)=3,查附表查附表8P0.001,按按 =0.05水准拒绝水准拒绝H0。可以认为可以认为, 北京北京城市和农村已婚妇女避孕方法的总体概率分布不城市和农村已婚妇女避孕方法的总体概率分布不同。据调查数据
15、,城市使用男用避孕套的频率高同。据调查数据,城市使用男用避孕套的频率高于农村;宫内节育器是城市和农村的主要避孕方于农村;宫内节育器是城市和农村的主要避孕方式,但农村使用宫内节育器的频率比城市高。式,但农村使用宫内节育器的频率比城市高。 完全随机设计多组频数分布完全随机设计多组频数分布 2检验检验 设有一个定性变量,具有设有一个定性变量,具有个可能的个可能的“取值取值”;现有;现有R组独立样本的频数分布,其数据组独立样本的频数分布,其数据以表以表7-7的形式表示。这样的数据形式称为的形式表示。这样的数据形式称为RC列联表。列联表。完全随机设计多组频数分布完全随机设计多组频数分布 2检验检验 例例
16、7-5 为研究某镇痛药的不同剂量镇为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的痛效果是否有差别,研究人员在自愿的原则下,将条件相似的原则下,将条件相似的53名产妇随机分名产妇随机分成三组成三组, 分别按三种不同剂量服用该药,分别按三种不同剂量服用该药,镇痛效果如表镇痛效果如表7-8。表7-8某药不同剂量的镇痛效果剂剂量量镇镇痛效果痛效果合合计计有效有效率率(%)有效有效无效无效1.0mg 3 (7.36) 12 ( 7.64)15(固(固定定值值)20.002.5mg11 (9.81) 9 (10.19)20(固(固定定值值)55.005.0mg12 (8.83) 6 ( 9.
17、17)18(固(固定定值值)66.67合合计计26275349.06完全随机设计多组频数分布完全随机设计多组频数分布 2检验检验(1)建立检验假设)建立检验假设H0:三种剂量镇痛有效的概率相同。三种剂量镇痛有效的概率相同。H1:不同剂量镇痛有效的概率不全相同。不同剂量镇痛有效的概率不全相同。检验水准取为检验水准取为 =0.05按公式按公式(7-13)计算计算 2统计量统计量完全随机设计多组频数分布完全随机设计多组频数分布 2检验检验自由度自由度 =(3-1)(2-1)=2,查附表查附表8, P0.025,按,按0.05水准,拒绝水准,拒绝H0,差别有统计学意义。可以认差别有统计学意义。可以认为
18、三种剂量镇痛有效的总体概率有差别。对于比为三种剂量镇痛有效的总体概率有差别。对于比较多组独立样本的较多组独立样本的 2检验检验, 拒绝拒绝H0只能说各组总只能说各组总体概率不全相同,即多组中至少有两组的有效概体概率不全相同,即多组中至少有两组的有效概率是不同的,但并不是多组有效概率彼此之间均率是不同的,但并不是多组有效概率彼此之间均不相同。若要明确哪两组间不同,还需进一步作不相同。若要明确哪两组间不同,还需进一步作多组间的两两比较多组间的两两比较 完全随机设计多组频数分布完全随机设计多组频数分布 2检验检验不同剂量有效概率间的两两比较结果见表不同剂量有效概率间的两两比较结果见表7-9 对对比比
19、组组四格表四格表 2值值P值值检验检验水准修正水准修正值值检验结检验结果果1.0mg vs. 2.5mg4.380.0360.00831.0mg vs. 5.0mg7.190.0070.0083*2.5mg vs. 5.0mg0.540.4630.0083配对设计下两组频数分布的配对设计下两组频数分布的 2检验检验 二分类情形二分类情形22列联表表 例例7-6 设有设有28份咽喉涂抹标本,把每份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种份标本一分为二,依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白于甲、乙两种白喉杆菌培养基上,观察白喉杆菌的生长情况,结果如表喉杆菌的生长情
20、况,结果如表7-10,问两,问两种培养基上白喉杆菌的生长概率有无差别种培养基上白喉杆菌的生长概率有无差别? 采用采用McNemar 检验检验表7-10 两种培养基白喉杆菌生长情况甲培养基甲培养基乙培养基乙培养基阳性阳性阴性阴性合合计计阳性阳性221840阴性阴性21416合合计计2432 56(固定(固定值值)注:“阳性”表示生长,“阴性”表示不生长 配对设计下两组频数分布的配对设计下两组频数分布的 2检验检验H0:两种培养基上白喉杆菌生长的阳性概率两种培养基上白喉杆菌生长的阳性概率相等相等H1:两种培养基上白喉杆菌生长的阳性概率两种培养基上白喉杆菌生长的阳性概率不相等不相等检验水准检验水准
21、=0.05。若若H0成立,白喉杆菌生长状况不一致的两个成立,白喉杆菌生长状况不一致的两个格子理论频数都应该是格子理论频数都应该是(b+c)。 配对设计下两组频数分布的配对设计下两组频数分布的 2检验检验由由 2检验基本公式(检验基本公式(7-1)有)有化简后不难得到化简后不难得到, 2统计量的计算公式为统计量的计算公式为配对设计下两组频数分布的配对设计下两组频数分布的 2检验检验因因b+c0.05 故尚不能认为甲法测定结果的概故尚不能认为甲法测定结果的概率分布与乙法测定结果的概率分布不同。率分布与乙法测定结果的概率分布不同。 2检验要注意的问题检验要注意的问题 关于关于 2检验的条件检验的条件
22、 使用使用 2检验在任何情况下都要注意理论检验在任何情况下都要注意理论频数频数 T不能太小。一般要求各格的理论频数不能太小。一般要求各格的理论频数均应大于均应大于1,且,且T5的格子数不宜多于格子的格子数不宜多于格子总数总数RC的的1/5 2. 关于似然比关于似然比 2统计量统计量 作作 2检验,既可以计算检验,既可以计算Pearson 2统统计量,也可以计算似然比计量,也可以计算似然比 2(Likelihood ratio chi-square)统计量,统计量, 四格表的确切概率法四格表的确切概率法 基本思想是:基本思想是: 在四格表边缘合计固定不变的条件下,在四格表边缘合计固定不变的条件下
23、,利用公式(利用公式(7-18)直接计算表内四个格子)直接计算表内四个格子数据的各种组合的概率,然后计算单侧或数据的各种组合的概率,然后计算单侧或双侧累计概率,并与检验水准双侧累计概率,并与检验水准 比较,作出比较,作出是否拒绝是否拒绝H0的结论。的结论。应用条件:应用条件:理论数小于理论数小于1或或n 40或作或作 2检验检验后所得概率后所得概率P 接近检验水准接近检验水准 , 四格表的确切概率法四格表的确切概率法a、b、c、d为四格表中的四个频数,为四格表中的四个频数,n为总为总例数。例数。例例7-8 将将23名精神抑郁症患者随机分到两组,名精神抑郁症患者随机分到两组,分别用两种药物治疗,
24、结果见表分别用两种药物治疗,结果见表7-14,问,问两种药物的治疗效果是否不同。两种药物的治疗效果是否不同。表7-14 两种药物治疗精神抑郁症的效果 分分组组治治疗疗效果效果合合计计有效率有效率%有效有效无效无效甲甲药药7(a)5(b)1258.3乙乙药药3(c) 8(d)1128.6合合计计 10 132343.5四格表的确切概率法四格表的确切概率法本例本例n 40,只能选用四格表的确切概率法。只能选用四格表的确切概率法。其假设检验的步骤如下:其假设检验的步骤如下:建立检验假设建立检验假设H0 : 1 = 2 两种药物治疗效果相等,两种药物治疗效果相等,H1 : 1 2 两种药物治疗效果不等
25、两种药物治疗效果不等 = 0.05 四格表的确切概率法四格表的确切概率法2、计算概率,见表、计算概率,见表7-153、确定、确定P值和作出推断值和作出推断 双侧检验的双侧检验的P值是指表值是指表7-15 中中 p1 p2 0.310的各种组合的四格表确切概率相加所得到的各种组合的四格表确切概率相加所得到的累计概率的累计概率 本例的研究目的是甲乙两种药物的治疗效果本例的研究目的是甲乙两种药物的治疗效果何者为优,所以用双侧检验。将表何者为优,所以用双侧检验。将表7-15 中中 p1 p2 0.310的的8个四格表的个四格表的P值相加,得累计概值相加,得累计概率率P = 0.214 。按按 = 0.
26、05水准不能拒绝原假设,水准不能拒绝原假设,两组药物疗效的差别无统计学意义,尚不能认两组药物疗效的差别无统计学意义,尚不能认为两药治疗精神抑郁症的效果不同。为两药治疗精神抑郁症的效果不同。 四格表序号四格表序号有效有效无效无效p1p2p1 p2P173580.5830.2730.3100.114224282940.6670.1820.4850.0237973913100.7500.0910.6590.00211541002110.8330.0000.8330.000058564670.5000.3640.136-655760.4170.455-0.038-746850.3330.545-0.212-837940.2500.676-0.4260.0634589281030.1670.727-0.5600.00951910191120.0830.818-0.7350.000577110101210.0000.909-0.9090.000001