卫生统计卡方检验1

上传人:f****u 文档编号:115955132 上传时间:2019-11-15 格式:PDF 页数:10 大小:12.05MB
返回 下载 相关 举报
卫生统计卡方检验1_第1页
第1页 / 共10页
卫生统计卡方检验1_第2页
第2页 / 共10页
卫生统计卡方检验1_第3页
第3页 / 共10页
卫生统计卡方检验1_第4页
第4页 / 共10页
卫生统计卡方检验1_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《卫生统计卡方检验1》由会员分享,可在线阅读,更多相关《卫生统计卡方检验1(10页珍藏版)》请在金锄头文库上搜索。

1、一一、率率的的抽样误差与标准误抽样误差与标准误一一、率率一一、率率的的的的抽样误差与标准误抽样误差与标准误抽样误差与标准误抽样误差与标准误 率的抽样误差:由于随机抽样所产生的样本率与总体率之间的差异,用率的标准误来衡量。 例例1 观察某医院产妇106人,其中行剖腹产者62人,剖腹产率为58.5%,试估计该医院的剖腹产率的95%可信区间。 解:已知n=106,p=0.585,由公式求得标准误为 95% CI:p1.96 Sp,即(0.491,0.679)总体率总体率的的可信区间可信区间总体率总体率总体率总体率的的的的可信区间可信区间可信区间可信区间 例例2 2、 某地区随机抽取传染科工作人员15

2、0名作关于乙型肝炎的血清学检查,其中阳性35名。已知当地一般人群中的阳性率为17%。问当地传染科工作人员的阳性率是否高于一般人群? 二二、样本率与总体率的比较样本率与总体率的比较总体率总体率:一般为理论值、标准值或经大量观察所得的稳定值等。目的目的:推断该样本是否来自于已知总体,即推断样本率与总体率的差异是否仅由抽样所致,并无显著性意义。方法方法:根据资料的分布特征,可选用近似正态分布法。 近似近似正态分布法正态分布法近似近似正态分布法正态分布法 当n足够大,且p 和1-p均不太小时,如np 和n(1- p)均大于5时,p的抽样分布逼近正态分布。因此,可对p作正态变化,根据正态分布的特性进行假

3、设检验。 1、建立假设建立假设1、建立假设建立假设 H0:当地传染科工作人员的阳性率与 一 般 人 群 无 差 异 , 即 = 0=0.17; H1:0.17; 单侧=0.05。 2、按下式求检验统计量按下式求检验统计量Z 本例,p=35/150, 0=0.17,n=150,代入公式得u=2.06 查u界值表得单侧P=0.02,按=0.05水准拒绝H0,即据此资料,可以认为当地传染科工作人员的阳性率高于一般人群。 两个样本率比较的两个样本率比较的 2 2检验检验2分布是一种连续型分布分布是一种连续型分布:按分布的密度函数可给按分布的密度函数可给出不同自由度的一簇分布曲线出不同自由度的一簇分布曲

4、线。 2 分分 布布0510150.00.10.20.30.40.5=1=6=10 附表8给出了自由度取不同值时, 2分布单侧尾部面积的界值2,它满足条件 当自由度=1时,2=u2,故2(1)分布的界值为标准正态分布界值的平方。22 2检验检验(chi-square test)2 2检验检验(chi-square test)2检验(chi-square test)是现代统计学的创始人Karl Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验,等等。本章仅限于介绍两个和多个率或构成比比较的2检验。 例

5、例1 为研究肿瘤标志物癌胚抗原为研究肿瘤标志物癌胚抗原(CEA)对肺癌的诊断价值对肺癌的诊断价值,随机随机抽取抽取72例确诊为肺癌的患者为肺癌例确诊为肺癌的患者为肺癌组组,114例接受健康体检的非肺癌患例接受健康体检的非肺癌患者为对照组者为对照组。用用CEA对其进行检测对其进行检测,结果呈阳性反应者病例组中结果呈阳性反应者病例组中33例例,对照组中对照组中10例例。问两组人群的问两组人群的CEA阳性率有无差异阳性率有无差异? 表表1 CEA1 CEA对两组人群的诊断结果对两组人群的诊断结果* * 表表1 CEA1 CEA对两组人群的诊断结果对两组人群的诊断结果* * 诊断结果阳性率(%) 合计

6、阴性阳性分组23.118614343合 计 8.8 114104(d)10 (c)对照组 45.8 7239(b)33(a)肺癌组表表2 2两个独立样本率比较的四格表基本形式两个独立样本率比较的四格表基本形式表表2 2两个独立样本率比较的四格表基本形式两个独立样本率比较的四格表基本形式dc乙ba甲-+基本步骤 基本步骤 建立假设和确定检验水准建立假设和确定检验水准 求检验统计量求检验统计量 确定确定P值值、下结论下结论(一一)、)、建立假设和确定检验水准建立假设和确定检验水准(一一)、)、建立假设和确定检验水准建立假设和确定检验水准 H0:两组人群的总体阳性率相同 (1=2) H1:两组人群的

7、总体阳性率不相同 (12) =0.05( (二二) )、求检验统计量求检验统计量( (二二) )、求检验统计量求检验统计量列四格表 格子内为实际频数(actual frequency),是绝对数而非相对数。 求理论频数求理论频数T(theoretical frequency) T由H0确定:肺癌组阳性数为 可概括成下述公式:表表3 CEA3 CEA对两组人群的诊断结果对两组人群的诊断结果 表表3 CEA3 CEA对两组人群的诊断结果对两组人群的诊断结果 * *括弧内为理论频数括弧内为理论频数 * *括弧内为理论频数括弧内为理论频数 诊断结果阳性率(%) 合计阴性阳性分组23.118614343

8、合 计 8.8 114104(87.6)10 (26.4)对照组 45.8 7239(55.4)33(16.6)肺癌组 求求 2值值 基本计算公式如下: A为实际频数,即四个基本数据;T为求得的理论频数。 四格表的专用2值计算公式:为简化运算,四格表的2值计算可用下面公式: 本例: 基本公式计算结果为: 四格表专用公式计算结果为: 二者结果完全一致。 2值反映实际频数A与理论频数T的吻合程度。如果H0成立,则A与T之差一般不会太大,出现大的2值的可能性很小。所以: 2值小A与T相差小接受H0 2值大A与T相差太大拒绝H0,接受H1 。 确定自由度2值大小不仅取决于A与T的差值,还随着格子数的增

9、加而增大,所以由2值确定P值时要考虑格子数的多少(自由度的大小)。 确定自由度2值大小不仅取决于A与T的差值,还随着格子数的增加而增大,所以由2值确定P值时要考虑格子数的多少(自由度的大小)。 基本公式:=(行数-1)(列数-1) 四格表:=(2-1)(2-1)=1 3、确定确定P值值、下结论下结论3、确定确定P值值、下结论下结论 查2界值表,由检验统计量2值确定P值,自由度相同时,2值越大则P值越小。若P则拒绝H0,接受H1;P便接受H0 。 由2界值表,查得20.005,1 =7.88,小于本例所得2值,所以P0.005,按=0.05水准拒绝H0,接受H1,肺癌患者癌胚抗原的阳性率显著高于

10、健康人,提示癌胚抗原可能具有临床诊断价值。四格表四格表连续性校正问题连续性校正问题 (correction for continuity)四格表四格表连续性校正问题连续性校正问题 (correction for continuity) 又称Yates校正2统计量,是Pearson2统计量的一个校正量。分类资料是不连续的,由此计算得的由此计算得的2统计量的抽样分统计量的抽样分布亦呈离散性质布亦呈离散性质,而理论上的2分布则是连续型分布,故有人提出需要作连续性校正以改善统计量分布的连续性。亦有人认为不需要校正。对于什么情况下应校正意见也不一致。 根据本书观点: 根据本书观点: N40且T5时,宜用

11、非校正2检验(Pearson Chi-Square) N40或T1时,宜用确切概率法 (Fishers exact test) N40且1T5时,宜用校正2检验或确切概率法 连续性校正的基本公式为 连续性校正的四格表专用计算公式为 )155()5 . 0(22TTAc因连续性校正公式中的分子部分较非连续性校正公式减去了一个常量,故所得2值必然较后者小,即必然有22c。这一差别有时会导致相互矛盾的统计推断结果,见后述。 例例2 将将116例癫痫患者随机分为两组例癫痫患者随机分为两组,一组一组70例接受常规加高压氧治疗例接受常规加高压氧治疗(高压氧组高压氧组),),另一组另一组46例接受常规治疗例

12、接受常规治疗(常规组常规组),),治治疗结果见表疗结果见表4。问两种疗法的有效率有无问两种疗法的有效率有无差别差别?表4 两种疗法治疗癫痫的效果表4 两种疗法治疗癫痫的效果疗效89.711612104合计82.646 8(4.8) 38(41.2)常规组94.3704(7.2) 66(62.8)高压氧组有效率(%)合计无效有效疗法 H0: 两种方法治疗癫痫的效果相同 (1=2) H1:两种方法治疗癫痫的效果相同 (12) =0.05T22=4.85,故应对2值进行校正 查2界值表得P0.05,按=0.05水准不拒绝H0,尚不能认为两种方法的治疗效果存在差异。 如果不校正 查2界值表得P0.05

13、,结论为两种方法的治疗效果存在差异,高压氧治疗的有效率显著高于对照组。得出的结论与未校正相反。 两个相关样本率比较的两个相关样本率比较的 2 2检验检验 资料类型资料类型: 配对计数资料又称两个相关样本率资料,顾名思义,是采用配对设计(见配对t检验一节),且结果是“二分类”或“多分类”的计数资料。这里介绍结果为二分类时的情况,采用McNemar法进行分析 。例例3 3 某抗癌新药的毒理研究中某抗癌新药的毒理研究中,将将7878只大鼠按性别只大鼠按性别、窝别窝别、体重体重、年龄年龄等因素配成等因素配成3939对对,每个对子的两只每个对子的两只大鼠经随机分配大鼠经随机分配,分别接受甲剂量分别接受甲

14、剂量和乙剂量注射和乙剂量注射,试验结果见表试验结果见表5 5。试试分析该新药两种不同剂量的毒性有分析该新药两种不同剂量的毒性有无差异无差异。 例例3 3 某抗癌新药的毒理研究中某抗癌新药的毒理研究中,将将7878只大鼠按性别只大鼠按性别、窝别窝别、体重体重、年龄年龄等因素配成等因素配成3939对对,每个对子的两只每个对子的两只大鼠经随机分配大鼠经随机分配,分别接受甲剂量分别接受甲剂量和乙剂量注射和乙剂量注射,试验结果见表试验结果见表5 5。试试分析该新药两种不同剂量的毒性有分析该新药两种不同剂量的毒性有无差异无差异。 甲剂量甲剂量乙乙 剂剂 量量39 30 9合计21 18(d) 3(c)生存

15、(-)18 12(b) 6(a)死亡(+)合计生存(-)死亡(+)表表5 5 某抗癌新药两种剂量的毒理实验结果某抗癌新药两种剂量的毒理实验结果 表表6 6 两个相关样本率资料的四格表形式两个相关样本率资料的四格表形式表表6 6 两个相关样本率资料的四格表形式两个相关样本率资料的四格表形式dc-ba+甲处理-+ 乙处理Mcnemar 检验统计量的计算公式:Mcnemar 检验统计量的计算公式:b+c40时,需作连续性校正: H0:两总体b=c(两种剂量的毒性无差异)H1:两总体bc(两种剂量的毒性有差异)=0.05已知b=12,c=3,因b+c=15,故将其代入校正公式,有查2界值表(附表8),

16、得0.025P0.05,按=0.05水准拒绝H0,接受H1,可以认为两种剂量的毒性有显著性差异,甲剂量组的死亡率较高(因bc)。 行行列表资料的列表资料的 2 2检验检验主要用于以下几方面: 两个率的比较 多个率的比较 两个构成比的比较 多个构成比的比较=(行数-1)(列数-1)检验统计量及自由度的计算公式: 一一、多个样本率的比较多个样本率的比较 一一、多个样本率的比较多个样本率的比较 例4 用A、B、C三种不同方法分别处理新生儿脐带,发生感染的情况见表7,试比较3种不同方法的脐带感染率有无差异。 表表7 7 三种脐带处理方法的脐带感染情况三种脐带处理方法的脐带感染情况表表7 7 三种脐带处

17、理方法的脐带感染情况三种脐带处理方法的脐带感染情况脐带感染情况1.456407631493合计0.267647622C0.622424240915B2.363219314376A感染率(%)合计未感染感染处理组 H0:1=2=3 即三种处理方法的脐带感染率相等 H1: 三种处理方法的脐带感染率不相等 =0.05 查2界值表=2一行,得P0.005,按=0.05水准拒绝H0,即三种处理方法的脐带感染率有差异,以C处理的感染率最低,其次为B处理,A处理的感染率最高。 二二、两个构成比的比较两个构成比的比较 二二、两个构成比的比较两个构成比的比较 例5为研究某种新药对尿路疼痛的止痛效果,将有尿路疼痛

18、的患者144例随机分为两组,每组72例,一组服该新药(治疗组),另一组服安慰剂(对照组)。两组患者尿路疼痛的原因见表8,问两组患者尿路疼痛原因的分布有无差异? 表表8 8 两组患者尿路疼痛原因的分布两组患者尿路疼痛原因的分布 表表8 8 两组患者尿路疼痛原因的分布两组患者尿路疼痛原因的分布尿路疼痛原因1789其它1446463合计723529对照组722934治疗组合计器械损伤尿路感染分组H0:两个组的尿路疼痛原因总体构成相同; H1: 两个组的尿路疼痛原因总体构成不相同; =0.05求P值,下结论。 查2界值表(附表8)=2一行,因2=1.020.5,以=0.05水准不拒绝H0,即尚不能以为

19、两组患者尿路疼痛原因的分布存在差异。 三、 多个构成比的比较例例6 在某项疼痛测量研究中,给160例手术后疼痛的患者提供四种疼痛测量量表,即直观模拟量表(VAS),数字评估量表(NRS),词语描述量表(VDS),面部表情疼痛量表(FPS),患者采用的量表以及患者的文化程度见表9,问患者采用疼痛量表与文化程度是否有关?三、 多个构成比的比较例例6 在某项疼痛测量研究中,给160例手术后疼痛的患者提供四种疼痛测量量表,即直观模拟量表(VAS),数字评估量表(NRS),词语描述量表(VDS),面部表情疼痛量表(FPS),患者采用的量表以及患者的文化程度见表9,问患者采用疼痛量表与文化程度是否有关?表

20、9 不同文化程度患者首选疼痛量表的类型 表9 不同文化程度患者首选疼痛量表的类型 3912918NRS16077377合计4215114高中以上3718100高中8144163高中以下合计FPSVDSVAS首选疼痛量表文化程度H0:不同文化程度首选疼痛量表的总体构成 相同;H1:不同文化程度首选疼痛量表的总体构成 不全相同; =0.05。查2界值表=6一行,因2=7.510.25,按=0.05水准不拒绝H0,尚不能以为不同文化程度首选疼痛量表的总体构成存在差异,即不能认为术后疼痛患者首选测痛量表类型与文化程度有关。R RC C表表2 2检验的注意事项检验的注意事项 R RC C表表2 2检验的

21、注意事项检验的注意事项 RC表2检验的条件是理论频数不宜太小。Cochran(1954)将理论频数太小界定为:有1/5以上格子的理论频数小于5,或至少有1个格子的理论频数小于1。 理论频数太小时,有以下三种处理方法: 增大样本容量N,属首选方法 。 删去T太小的格子所对应的行或列。 合并T太小的格子所相邻的行或列 用Fisher 确切概率检验单向有序列联表资料宜用秩和检验分析。表10 不同文化程度患者首选疼痛量表的类型 表10 不同文化程度患者首选疼痛量表的类型 3912(10.2)9(9.0)18(19.7)NRS16077377合计4215(20.2)11(9.7)4(1.8)高中以上37

22、18(17.8)10(8.6)0(1.6)高中8144(39.0)16(18.7)3(3.5)高中以下合计FPSVDSVAS首选疼痛量表文化程度Fishers exact P=0.298135841437合计24144671523571061503021851951350合计良性恶性 功能性 病变类型,例数(%) 年龄组(岁) 表11 不同年龄妇女绝经后出血的病变类型 将 50岁组与5160岁组合并表12 三种疗法治疗慢性喉炎的结果表12 三种疗法治疗慢性喉炎的结果7820221422清音丸9220162432电子治疗仪308242672186综合治疗合计无效好转显效治愈例 数治疗方法单项有序列联表:秩和检验表13 不同年龄患者慢性喉炎的疗效表13 不同年龄患者慢性喉炎的疗效7820221422清音丸9220162432电子治疗仪308242672186综合治疗合计无效好转显效治愈例 数治疗方法双项有序列联表:秩和检验,Spearman 相关

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号