第 四节 χ2检验,【教学内容】,【教学目的和要求】,①了解四格表的概念及四格表中4个基本数据的含义;了解配对四格表的概念以及配对四格表与一般四格表在设计上的不同 ②掌握四格表资料χ2检验的基本公式及各公式的适用条件;配对四格表检验的基本公式及各公式的适用条件χ2检验是现代统计学创始人之一 K.Pearson于1900年提出的一种具有广泛用途的统计方法,主要用于两个或多个率(或构成比)差异性比较,分类变量的关联性分析等3.84,7.81,12.59,,,,,,,,P=0.05的临界值,属连续型分布; 具有可加性; 唯一参数,自由度,单峰; 偏态分布,【例6-10】 某医院收治了120例乙型肝炎患者,随机分成两组,分别用不同的方法治疗,比较两种方法的治愈率有无差异Fourfold table,资料类型:四格表资料(定性资料) 设计类型:两独立样本,目的是推断两样本所来自的总体率是否相等,即π1= π2 1.两个样本率不相同的原因有两种可能:一种是抽样误差所致;另一种是总体率确有所不同 2.通过假设检验对两种原因进行判断:为了判别这两种情况,先作出“无效假设”,即假设这两个率相同,差别仅是抽样误差所致。
χ2 检验的基本思想:,,3.实际频数(actual frequency, A): 实际资料中的数据 4.无效假设下频数的重新分配—— --理论频数(Theoretical frequency, T),,式中TRC表示R 行(row)C 列(column)的理论频数,nR为相应行的合计,nC为相应列的合计,n为总例数理论频数(T):,,,理论治愈率,,A方法理论上应治愈的人数,,,,,如实际频数与理论频数相差过大,即值大于所规定的检验水准的界值时,就可拒绝这一假设,否则没有理由拒绝这一假设5. χ2检验的基本思想:如果两个率不同只是抽样误差所致,那末实际频数与理论频数之差就不会很大,即χ2值不会太大:,,理论频数,实际频数,,,6、 χ2值的特点: ⑴若各实际频数与理论频数完全相同,则值必为零 ⑵永远是正值,且实际频数与理论频数的相对差异越大时值也越大 ⑶格子越多,即自由度越大,值也会越大 7、自由度计算:ν =(行数-1)×(列数-1),,,,,H0: π1=π2 H1: π1≠π2 α=0.05 n>40,最小理论值为T11>5,因此直接计算χ2,,,,,,【例6-11】 某医师用甲、乙两疗法治疗淋巴系肿瘤,结果如表6-20。
比较两种疗法总体缓解率有无差异?,四格表资料的χ2检验的基本步骤,2.计算检验统计量,n≥40且所有T≥5 n≥40但有1T5 n40或有T1,A=0,配对四格表(2×2列联表)资料:和定量资料一样,定性资料也可作配对设计,只是资料类型不同而已配对设计实施的主要形式有: ①将条件相似两个受试对象配成对子,后按随机分配的原则分别接受A、B两种不同处理,每种处理结果都按二项分类计数给出 ②同一受试对象分别接受A、B两不同处理,每种处理结果都按二项分类 上述研究目的都是推断两处理效果有无差别配对设计意义:,是为控制随机误差,增加两组的可比性而采用的一种实验设计方法,当总样本量一定时,采用配对设计往往会获得较高的检验效能例如,两个医生分别检查n个病人,检验的结果如下:,问题:两个医生的检验结果一致吗?,假设总体上B=C:如果假设成立,则上述两个样本率所对应的总体率相等;否则不等 根据假设有:T=(b+c)/2代入检验的基本公式有,McNemar 检验,【例6-13】 对80名钩端螺旋体病患者同时用间接免疫抗体试验和显微镜凝集试验进行血清学诊断,结果如表6-23试分析两种方法的诊断阳性率有无差异,两种方法的诊断结果有无联系。
比较两种方法检测结果有无差别,练习题 用两种方法检查已确诊的乳腺癌患者120名甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致的检出率为35%试将上述资料整理成四格表,并比较两种方法何者为优?,比较两种方法检测结果有无联系,,【例6-14】为比较优降糖、胰岛素和中药糖复康治疗糖尿病患者的有效率,研究者收集了如下资料(表6-25)试分析不同药物治疗糖尿病患者的有效率有无差异? 表6-25 3种药物治疗糖尿病患者的有效率,,,R×C表χ2检验的应用注意事项 1. 对R×C表,不易有1/5以上格子的理论频数小于5,或有一个格子的理论频数小于1 出现某些格子中理论频数过小时怎么办? (1)增大样本含量(最好!) (2)删去该格所在的行或列(丢失信息!) (3)根据专业知识将该格所在行或列与别的行或列合并丢失信息!甚至出假象),删除丙组,乙丙合并,,,,2.多组比较时,若效应有强弱的等级,如+,++,+++,最好采用后面的非参数检验方法χ2检验只能反映其构成比有无差异,不能比较效应的平均水平表6-28城市和农村地区居民对卫生服务的满意程度,例6-14的两两比较,小结,在选用χ2检验时,一定要考虑其对总例数和理论频数的要求。
多个独立样本的χ2检验,结论为拒绝检验假设时,只认为总体率或构成比之间总的来说有差别,若要了解差别的具体情况,要进一步做卡方分割一般四格表的χ2检验,n≥40且所有T≥5 n≥40但有1T5 n40或有T1,A=0,P是指在H0成立的条件下,得到现有 样本四格表乃至更极端四格表的累计概率,对于配对分类数据的 2×2 表 b+c≥40 b+c40,,,,比较两种方法检测结果有无差别,比较两种方法检测结果有无联系,n ≥40且T ≥ 5 n ≥40但有1T5,行列表资料的χ2检验,,,[案例1] 在论文《果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效观察》中,为了研究果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效,将患者随机分为观察组和对照组,观察组用果糖二磷酸钠,对照组用胞磷胆碱治疗效果分为无效、有效和显效三种结果案例2,理论频数太小,应采用确切概率法!,THANK YOU!,。