07章 卡方检验 2016

上传人:n**** 文档编号:50600994 上传时间:2018-08-09 格式:PPT 页数:104 大小:1.84MB
返回 下载 相关 举报
07章 卡方检验 2016_第1页
第1页 / 共104页
07章 卡方检验 2016_第2页
第2页 / 共104页
07章 卡方检验 2016_第3页
第3页 / 共104页
07章 卡方检验 2016_第4页
第4页 / 共104页
07章 卡方检验 2016_第5页
第5页 / 共104页
点击查看更多>>
资源描述

《07章 卡方检验 2016》由会员分享,可在线阅读,更多相关《07章 卡方检验 2016(104页珍藏版)》请在金锄头文库上搜索。

1、591 计量资料 计数资料检验检验第七章例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?表7-1 两组降低颅内压有效率的比较 目的:推断两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别多个样本率的多重比较两个分类变量之间有无关联性频数分布拟合优度的检验。检验统计量:应用:计数资料目的:推断两个总体率(构成比)是 否有差别(和u检验等价)要求:两样本的两分类个体数排列成四格表资料第一节 四格表资料的 检验1 分布 ()是一种连续型随机变量的概率函数,

2、如果随机变量 X1、X2、Xn相互独立且服从标准正态分布,则随机变量 服从 分布,记为 。分布的形状依赖于自由度的大小,当取自由度=1,2,3,可得到一簇分布曲线(图7-1)。图7-1 不同自由度的 分布曲线 图(2) 分布的一个基本性质是可加性: 如果两个独立的随机变量 X1 和 X2 分别服从自由度1和2的分布,即 ,那么它们的和( X1+X2 )服从自由度( 1+2 )的 分布,即 。 2 检验的基本思想例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?表

3、7-1 两组降低颅内压有效率的比较 本例资料经整理成图7-2形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有 四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。图7-2 四格表资料的基本形式 基本思想:可通过 检验的基本公式来理解。式中,A为实际频数(actual frequency),T为理论频数(theoretical frequency)。表7-1 两组降低颅内压有效率的比较 理论频数由下式求得:式中,TRC 为第R 行C 列的理论频数nR 为相应的行合计nC 为相应的列合计理论频数 是根据检验设 ,且用合并率来估计 而定的。如上例,无效假设是试验

4、组与对照组降低颅内压的 总体有效率相等,均等于合计的有效率87%。那 么理论上,试验组的104例颅内压增高症患者中有 效者应为104(174/200)=90.48,无效者为 104(26/200)=13.52;同理,对照组的96例颅内压增高症患者中有效者为: 96(174/200)=83.52,无效者为: 96(26/200)=12.48。检验统计量 值反映了实际频数与理论频数的吻合程度。若检验假设H0:1=2成立,四个格子的 实际频数A 与理论频数T 相差不应该很大,即统计量 不应该很大。如果 值很大, 即相对应的P 值很小,若 ,则反过来 推断A与T相差太大,超出了抽样误差允许的 范围,从

5、而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即12 。检验的自由度( )取决于可以自由取值的基本数据的格子数目,而不是样本含量n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。 由公式(7-1):值的大小还取决于 个数的多少(严格地说是自由度的大小)。由于各 皆是正值,故自由度愈大, 值 也会愈大;所以只有考虑了自由度的影响, 值才能正确地反映实际频数A和理论频数T 的吻合程度。(1) 建立检验假设,确定检验水平。H0:1=2 即试验组与对照组降低颅内压的总体有效率相等H1:12 即试验组与对照组降低颅内压的总体有效率不相等=0.05

6、。3. 假设检验步骤(2)求检验统计量值(3)结论二、四格表资料检验的专用公式三、四格表资料检验的校正公式 分布是一连续型分布,而四格表资料属离散型分布,由此计算得的统计量 的抽样分布亦呈离散性质。为改善统计量 分布的连续性,则需行连续性校正。四格表资料 检验公式选择条件: ,专用公式;,校正公式;,直接计算概率。连续性校正仅用于 的四格表资料,当时, 一般不作校正。 例7-2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?表7-2 两种药物治疗脑血管疾病有效率的比较本例 ,故用四格表 资料

7、检验的校正公式,查 界值表得 。按 检验水准不拒绝 ,尚不能认为两种药物治疗脑血管疾病的有效率不等。 本资料若不校正时,结论与之相反。第二节第二节配对四格表资料的配对四格表资料的 检验检验与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。例7-3 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别?例7-3 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3

8、。问两种方法的检测结果有无差别?表7-3 两种方法的检测结果 原始数据的记录表? 上述配对设计实验中,就每个对子而言, 两种处理的结果不外乎有四种可能:两种检测方法皆为阳性数(a); 两种检测方法皆为阴性数(d); 免疫荧光法为阳性,乳胶凝集法为阴性数(b); 乳胶凝集法为阳性,免疫荧光法为阴性数(c)。表7-3 两种方法的检测结果 其中,a, d 为两法观察结果一致的两种情况,b, c为两法观察结果不一致的两种情况。表7-3 两种方法的检测结果 检验统计量为:(40)注意:本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b, c),而未考虑样本含量n 和两法结果一致

9、的两种情况(a, d)。所以,当n 很大且a 与d 的数值很大(即两法的一致率较高),b 与c 的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。检验步骤检验假设、检验水准:计算检验统计量、结论:第三节 四格表资料的Fisher确切概率法 条件:理论依据:此时实际频数各组合的概率Pi呈超几何分布,不是 检验的范畴。 例7-4 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表7-4。问两组新生儿的HBV总体感染率有无差别?(双侧) 表7-4 两组新生儿HBV感染率的比较 一、基本思想在四格表周边合计数固定不

10、变的条件下,计算表内4个实际频数变动时的各种组合之概率 ;再按检验假设用单侧或双侧的累计概率 ,依据所取的检验水准 做出推断。 1各组合概率Pi的计算:在四格表周边合计数不变 的条件下,表内4个实际频数 a,b,c,d 变动的组合数共 有“周边合计中最小数+1”个。如例7-4,表内4个实际 频数变动的组合数共有9+1=10个,依次为:各组合的概率Pi 服从超几何分布,其和为1 。计算公式为!为阶乘符号 2累计概率P 的计算 ( 单、双侧检验不同)P值:是”出现目前状况和更极端状况的概率之和 ”(有单、双侧之分)。表7-5 例7-4的 Fisher确切概率法计算表 二、检验步骤( ,双侧)表7-

11、5 例7-4的 Fisher确切概率法计算表 例7-5 某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表7-6。问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别?表7-6 胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较 本例 a+b+c+d=10,由表7-7可看出,四格表内 各种组合以i=4和i=5的组合为中心呈对称分布。 表7-7 例7-5的Fisher确切概率法计算表 *为现有样本(1)计算现有样本的D*和P*及各组合下四格表的Di。本例D*=50,P*=0.02708978。(2)计算满足Di 50条件的各组合下四

12、格表的概率Pi。(3)计算同时满足Di50和PiP*条件的四格表的累计概率。本例为P7和P8,(4)计算双侧累计概率P。P0.05,按=0.05检验水准不拒绝H0,尚不能 认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等。注意:第四节行列表资料的 检验 行列表资料 多个样本率比较时,有R行2列,称为R 2表; 两个样本的构成比比较时,有2行C 列,称2C 表; 多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为R C 表。检验统计量例7-6 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见 表7-8。问三种疗法的有效率有无差别?一、多个样本率的

13、比较表7-8 三种疗法有效率的比较检验步骤:二、样本构成比的比较二、样本构成比的比较例7-7 某医师在研究血管紧张素I转化酶(ACE)基 因I/D多态(3种基因型)与2型糖尿病肾病(DN)的关 系时,将249例2型糖尿病患者按有无糖尿病肾病分 为两组,资料见表7-9。问两组2型糖尿病患者的 ACE基因型总体分布有无差别?表7-9 DN组与无DN组2型糖尿病患者ACE基因型分布的比较 检验步骤表7-9 DN组与无DN组2型糖尿病患者ACE基因型分布的比较 检验步骤三、双向无序分类资料的关联性检验三、双向无序分类资料的关联性检验表中两个分类变量皆为无序分类变量的行 列表资料,又称为双向无序 表资料

14、。注意: 双向无序分类资料为两个或多个样本,做差别检验;若为单样本,做关联性检验。例 7-8 测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联?表7-10 某地5801人的血型 (四个血型组之间的三个基因的构成比的比较)表7-10资料,可用行列表资料 检验 来推断两个分类变量之间有无关系(或关联) ;若有关系,可计算Pearson列联系数C 进一 步分析关系的密切程度:列联系数C取值范围在01之间。0表示完 全独立;1表示完全相关;愈接近于0,关系愈不 密切;愈接近于1,关系愈密切。 检验步骤由于列联系数C=0.1883,数值较小,故认为两种血型系统间虽然

15、有关联性,但 关系不太密切。 四、行四、行 列表资料列表资料 检验的检验的 注意事项注意事项1行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种: 增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。注意:不同年龄组可以合并,但不同血型就不能合并。 改用双向无序RC表的Fisher确切概率法(可用SAS软件实现)。第五节第五节多个样本率间的多重比较多个样本率间的多重比较一、基本思想因分析目的不同,k个样本率两两比较 的次数不同,故重新规定的检验水准的估 计方法亦不同。通

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号