预防医学课件:第十六章 分类变量的统计分析

上传人:pu****.1 文档编号:568894941 上传时间:2024-07-27 格式:PPT 页数:104 大小:2.25MB
返回 下载 相关 举报
预防医学课件:第十六章 分类变量的统计分析_第1页
第1页 / 共104页
预防医学课件:第十六章 分类变量的统计分析_第2页
第2页 / 共104页
预防医学课件:第十六章 分类变量的统计分析_第3页
第3页 / 共104页
预防医学课件:第十六章 分类变量的统计分析_第4页
第4页 / 共104页
预防医学课件:第十六章 分类变量的统计分析_第5页
第5页 / 共104页
点击查看更多>>
资源描述

《预防医学课件:第十六章 分类变量的统计分析》由会员分享,可在线阅读,更多相关《预防医学课件:第十六章 分类变量的统计分析(104页珍藏版)》请在金锄头文库上搜索。

1、统计分析统计分析数值变量数值变量分类变量分类变量变量类型变量类型第十六章第十六章 分类变量的统计分析分类变量的统计分析1目的与要求目的与要求n掌握常用相对数的概念、计算及应用注意事项。掌握常用相对数的概念、计算及应用注意事项。n掌握掌握2 2检验的应用条件、计算方法及注意事项。检验的应用条件、计算方法及注意事项。n熟悉率的抽样误差的概念、总体率的估计方法及率的熟悉率的抽样误差的概念、总体率的估计方法及率的u u检验方法。检验方法。2分类变量的统计描述分类变量的统计描述3常用相对数常用相对数应用相对数的注意事项应用相对数的注意事项率的标准化法率的标准化法绝对数与相对数的概念绝对数与相对数的概念绝

2、对数绝对数(absolute number): 分类变量资料整理后所得到的原始数据,分类变量资料整理后所得到的原始数据,通常不具有可比性。通常不具有可比性。相对数相对数(relative number): 指两个有联系的指标之比,是分类变量指两个有联系的指标之比,是分类变量统计描述指标的统称。统计描述指标的统称。4相相 对对 数数率率率率构成比构成比构成比构成比相对比相对比相对比相对比第一节第一节 常用相对数常用相对数5概概 念念计计 算算又称频率指标,说明某现象又称频率指标,说明某现象发生的频率或强度。发生的频率或强度。一、率一、率(rate) 67比例基数比例基数K的取法:的取法: 可取百

3、分率可取百分率(%) 、千分率、千分率() 、万分率、万分率(1/万万) 、十万分率十万分率(1/10万万) 等,主要根据等,主要根据习惯用法和使用法和使结果保果保留一、二位整数。留一、二位整数。医学上常用的率:医学上常用的率: 发病率、患病率、死亡率、病死率、治愈率、病率、患病率、死亡率、病死率、治愈率、 生存率等。生存率等。 某年某市三个区的某年某市三个区的肠道道传染病染病发病率病率 8市区市区 人口数人口数 发病人数发病人数 发病率发病率() 甲甲 98740 503 5.09 乙乙 75135 264 3.51 丙丙 118730 466 3.92合计合计 292605 1233 4.

4、21概概 念念计计 算算又称构成指标,表示又称构成指标,表示事物内部某组成部分事物内部某组成部分占其全部的比重或分布,常以百分率占其全部的比重或分布,常以百分率(%)作为比例基数。作为比例基数。二、二、构成比构成比(proportion) 9病情严重程度病情严重程度 住院人数住院人数 病死数病死数 死亡构成死亡构成(%) 病死率病死率(%) 轻轻 300 12 26.7 4.0 中中 350 18 40.0 5.1 重重 150 15 33.3 10.0 合计合计 800 45 100.0 5.6102000年某医院某病的住院人数和死亡人数年某医院某病的住院人数和死亡人数白细胞分类白细胞分类

5、分类计数分类计数 构成比构成比(%) 中性粒细胞中性粒细胞 140 70.0 淋巴细胞淋巴细胞 50 25.0 单核细胞单核细胞 5 2.5嗜酸粒细胞嗜酸粒细胞 4 2.0嗜碱粒细胞嗜碱粒细胞 1 0.5 合计合计 200 100.011某正常人的白某正常人的白细胞分胞分类计数构成比数构成比构成比的特点构成比的特点12各组成部分的构成比之和各组成部分的构成比之和为为100%。事物内部某一部分构成比发生事物内部某一部分构成比发生变化,其它部分的构成比也相变化,其它部分的构成比也相应地发生变化。应地发生变化。特特特特点点点点概概 念念计计 算算又称对比指标,指两个相关指标数值又称对比指标,指两个相

6、关指标数值大小的比值,说明两者的对比水平大小的比值,说明两者的对比水平,常以倍数或百分率常以倍数或百分率(%)表示表示。三、三、相对相对比比(relative ratio) 13例例1 2000 年我国第五次人口普查结果,男性年我国第五次人口普查结果,男性 65355万人,女性万人,女性 61228 万人,试计算人口万人,试计算人口男女性别比。男女性别比。6535561228性别比性别比 = = = 1.067例例1 我国我国2010年第六次人口普查总人数中,男性为年第六次人口普查总人数中,男性为686852572人,女性为人,女性为652872280人,试计算人口人,试计算人口男女性别比例。

7、男女性别比例。结结果果说说明明,我我国国男男性性人人数数为为女女性性人人数数的的1.052倍倍,或或者者表表达达成成男男:女女为为 105.20:100。(2000年年第第五五次普查结果为次普查结果为 106.74:100) 686852572652872280男女性别比例男女性别比例 = 1.052016例例2 某市乙型脑炎的发病率某市乙型脑炎的发病率1990年为年为 4.48/10万,万,2000年为年为0.88/10万,则这两年相万,则这两年相对比为:对比为:17例例3 某某医医院院2005年年医医护护人人员员为为875人人,同同年年平平均均开开病病床床1436张张,则则该该医医院院20

8、05年年病病床床数数与医护人员的相对比为:与医护人员的相对比为:18 2005 2005年某研究组对武汉市江汉区中学生的吸烟情年某研究组对武汉市江汉区中学生的吸烟情况、吸烟原因进行了调查。共调查况、吸烟原因进行了调查。共调查17221722人,男生人,男生839839人人中中172172人吸烟;女生人吸烟;女生883883人中人中1717人吸烟,抽烟的主要原人吸烟,抽烟的主要原因见表。试计算因见表。试计算: : (1 1)男女生吸烟率。)男女生吸烟率。 (2 2)男女生吸烟率之比。)男女生吸烟率之比。 (3 3)计算各种吸烟原因所占的百分构成比,并找)计算各种吸烟原因所占的百分构成比,并找出前

9、三位的吸烟原因。出前三位的吸烟原因。常用相对数求法举例常用相对数求法举例性别性别 人数人数 吸烟人数吸烟人数 吸烟率吸烟率(%) 男男 839 172 20.50 女女 883 17 1.93合计合计 1722 189 10.98192005年某地区中学男、女生吸烟率比较年某地区中学男、女生吸烟率比较男、女生吸烟率相对比男、女生吸烟率相对比=20.50/1.93=10.62吸烟原因吸烟原因 人数人数 构成比构成比(%) 位次位次解除烦恼解除烦恼 64 33.86 1显示气派显示气派 45 23.81 2 帮助社交帮助社交 43 22.75 3帮助思考帮助思考 16 8.47 4 显示富有显示富

10、有 12 6.35 5 其其 它它 9 4.76 6 合合 计计 189 100.0 20189名吸烟者的吸烟原因构成比名吸烟者的吸烟原因构成比第二节第二节 应用相对数的注意事项应用相对数的注意事项1.1.计算相对数时,分母不宜过小计算相对数时,分母不宜过小2.2.正确区分构成比和率正确区分构成比和率3.3.比较相对数时比较相对数时, ,应注意资料的可比性:应注意资料的可比性:率的标准化率的标准化4.4.分母不同的率不能简单相加求平均率分母不同的率不能简单相加求平均率5.5.样本率或构成比的比较应进行假设检验样本率或构成比的比较应进行假设检验WARNING21 1980年年 1990年年 病例

11、数病例数 构成比构成比(%) 病例数病例数 构成比构成比(%) 痢疾痢疾 3604 49.39 2032 37.92肝炎肝炎 1203 16.49 1143 21.33流脑流脑 698 9.56 542 10.11麻疹麻疹 890 12.20 767 14.31其他其他 902 12.36 875 16.33合计合计 7297 100.00 5359 100.0022某市某市1980年与年与1990年传染病的构成年传染病的构成疾病疾病性别性别 人数人数 吸烟人数吸烟人数 吸烟率吸烟率(%) 男男 839 172 20.50 女女 883 17 1.93合计合计 1722 189 ?232005

12、年某地区中学男、女生吸烟率比较年某地区中学男、女生吸烟率比较 为了消除相比较组间因内部构成不同对所比为了消除相比较组间因内部构成不同对所比较指标的影响,采用统一的标准构成对总率进行较指标的影响,采用统一的标准构成对总率进行调整,使算得的标准化率具有可比性,得出科学调整,使算得的标准化率具有可比性,得出科学的结论。的结论。24率的标准化的概念与基本思想:率的标准化的概念与基本思想:第三节第三节 率的标准化法率的标准化法 住院人数住院人数 治愈人数治愈人数 治愈率治愈率(%) 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 1500 500 975 3

13、15 65.0 63.0 外科外科 500 1500 470 1365 94.0 91.0 传染病科染病科 500 500 475 460 95.0 92.0 合合计 2500 2500 1920 2140 76.8 85.6 25 科别科别甲、乙两医院的治愈率甲、乙两医院的治愈率标准化率的计算标准化率的计算1.选定定标准准 选择有代表性、有代表性、较稳定、数量定、数量较大的人群,大的人群,如全国、全省的如全国、全省的历年累年累计数据;数据;也可将比也可将比较组的人口合并;的人口合并;任任选其中一其中一组作作为标准。准。2.计算算标化率化率 直接法直接法 间接法接法3.比比较得出得出结论 26

14、27直接法直接法 已知各科的真已知各科的真实治愈率。治愈率。 原治愈率原治愈率 Pi (%) 预期治愈人数预期治愈人数 Ni Pi 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 2000 65.0 63.0 1300 1260 外科外科 2000 94.0 91.0 1880 1820传染病科染病科 1000 95.0 92.0 950 920 合合计 5000 76.8 85.6 4130 4000 28科别科别标准人口标准人口Ni甲、乙两医院的甲、乙两医院的标准化治愈率准化治愈率(直接法直接法)甲医院标准化后的治愈率:甲医院标准化后的治愈率:乙医院标准化后的治愈率:乙医

15、院标准化后的治愈率:294130500040005000= 80%= 82.6%100%100% 原治愈率原治愈率 Pi (%) 预期治愈率预期治愈率 Ni/NPi (%) 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 0.4 65.0 63.0 26.0 25.2 外科外科 0.4 94.0 91.0 37.6 36.4传染病科染病科 0.2 95.0 92.0 19.0 18.4 合合计 1.0 76.8 85.6 82.6 80.0 30科别科别标准人口标准人口构成比构成比Ni / N甲、乙两医院的甲、乙两医院的标准化治愈率准化治愈率(直接法直接法) 住院人数住院人数

16、 治愈人数治愈人数 治愈率治愈率(%) 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 1500 500 975 315 65.0 63.0 外科外科 500 1500 470 1365 94.0 91.0 传染病科染病科 500 500 475 460 95.0 92.0 合合计 2500 2500 1920 2140 76.8 85.6 31 科别科别甲、乙两医院的治愈率甲、乙两医院的治愈率 间接法接法 未知:各科真未知:各科真实治愈率治愈率 已知:医院已知:医院总治愈人数和各科住院人数治愈人数和各科住院人数 各科各科标准治愈率和准治愈率和总的

17、的标准治愈率(文献准治愈率(文献获得)得) 住院人数住院人数 Ni 预期治愈人数预期治愈人数 Ni Pi 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 61.0 1500 500 915 305 外科外科 92.0 500 1500 460 1380传染病科染病科 94.0 500 500 470 470 合合计 87.5 2500 2500 1845 2155 32科别科别标准标准 治愈率治愈率Pi (%)甲、乙两医院的甲、乙两医院的标准化治愈率(准化治愈率(间接法)接法)P甲甲P乙乙87.5%1920/1845 = 87.5%1.04 = 91%87.5%2140/21

18、55 = 87.5%0.99 = 86.6%33 当当Pi代表死亡率代表死亡率时,r/(niPi)是被是被标化化组的的实际死亡人数与死亡人数与预期死亡人数的比期死亡人数的比值,称,称为标准准化死亡比化死亡比(standard mortality ratio , SMR) 。 34n当各比较组当各比较组内部构成不同内部构成不同,而且对总率有影响时,而且对总率有影响时, 应对率进行标准化,且应对率进行标准化,且应应采用同一标准人口,采用同一标准人口,然后然后 再比较。再比较。n标准化率只反映各被标化组的标准化率只反映各被标化组的相对水平,不代表其相对水平,不代表其 实际水平。实际水平。n各年龄组的

19、率出现明显交叉时,不宜用标准化法。各年龄组的率出现明显交叉时,不宜用标准化法。如低年龄组死亡率,甲人群高于乙人群,而高年龄组死亡率则乙人群高于甲如低年龄组死亡率,甲人群高于乙人群,而高年龄组死亡率则乙人群高于甲人群,此时宜比较年龄组死亡率,而不用标准化法。人群,此时宜比较年龄组死亡率,而不用标准化法。n若是抽样研究,样本标化率的比较应作若是抽样研究,样本标化率的比较应作假设检验假设检验。率的标准化应注意的问题率的标准化应注意的问题WARNING统计分析统计分析统计描述统计描述统计推断统计推断统计分析统计分析3536第四节率的抽样误差和总体率的估计第四节率的抽样误差和总体率的估计一、率的抽样误差

20、一、率的抽样误差 由抽样造成的样本率与总体率之间的差异以及由抽样造成的样本率与总体率之间的差异以及在同一总体中抽取的各样本率间的差别。在同一总体中抽取的各样本率间的差别。 反映率反映率抽样误差大小的指标是抽样误差大小的指标是率的标准误率的标准误。率的标准误的计算:率的标准误的计算:理论值:理论值:估计值:估计值:37 例例 欲了解某种新药对慢性乙型肝炎的疗效,欲了解某种新药对慢性乙型肝炎的疗效,对对100名患者进行治疗,其中名患者进行治疗,其中90人有效,试计算其人有效,试计算其标准误。标准误。 本例本例n=100 p = 90100 = 0.9,标准误为:,标准误为:380.03二、总体率的

21、可信区间估计二、总体率的可信区间估计39 根据已知条件,总体率可信区间的估计有根据已知条件,总体率可信区间的估计有2种方法:种方法:n正态近似法正态近似法n查表法查表法例例11-5 已知已知=0.3,n=5; =0.3,n=10; =0.3,n=15; =0.5,n=10。求各阳性事件的。求各阳性事件的概率并作概率分布概率并作概率分布图。41P(X)XXXa. n=5b. n=10c. n=30图图1 =30%的的二项分布示意图二项分布示意图P(X)P(X)42pN(, p)P ( p)p图图2 n=30、=30%时时样本率近似服从的正态分布样本率近似服从的正态分布当当nP和和n(1P)都大于

22、都大于5时,二项分布近似时,二项分布近似于正态分布。于正态分布。43 1. 正态近似法正态近似法 当当n足足够大大(n50),且,且np和和n(1p) 5总体率体率95%可信区可信区间:总体率体率99%可信区可信区间:总体率可信区间估计的方法总体率可信区间估计的方法按按u分布原理(分布原理(95%): 上例中某地治疗上例中某地治疗100名患者,名患者,90人有效,得出人有效,得出 有效率有效率90%,试估计该新药有效率,试估计该新药有效率95%置信区间。置信区间。 n=100,p = 0.9,np=90 5,n (1-p) =10 5 前已算得前已算得 ,则其,则其95%CI为:为:45 =

23、0.9 1.960.03 =(0.8412,0.9588) 即该即该新药有效率新药有效率95%置置信区间为信区间为84.12%95.88%。0.032.查表法表法 如果如果n、p不不满足上述条件足上述条件(n50),可根据二,可根据二项分布的原理估分布的原理估计总体率的置信区体率的置信区间。 即根据即根据样本含量本含量n和和阳性数阳性数X查表得到表得到总体率体率的置信区的置信区间。当当xn/2时,直接查表可得;时,直接查表可得;当当xn/2时,应以时,应以n-x查表,然后用查表,然后用100减去查减去查得的数字,即为所求的区间。得的数字,即为所求的区间。46 例例 某社区抽取某社区抽取40岁以

24、上居民岁以上居民30人测量血压,人测量血压,查出高血压查出高血压10名,试估计该社区名,试估计该社区40岁以上居民高岁以上居民高血压患病率的血压患病率的95%置信区间置信区间。 n=30,阳性患者数,阳性患者数 x x=10。查百分率的置信区间表查百分率的置信区间表(P331)得:得:47即该社区即该社区40岁以上居民高血压患病率的岁以上居民高血压患病率的95%CI为为17%53%1753上例若上例若 n=30,阳性患者数阳性患者数 x=20,求总体率求总体率95%CI。 第一步:第一步:n-x=30-20=10 查表(查表(n=30, x=10)得:得:17%53% 第二步:第二步:100%

25、17%83% 100%53%47%得得总体率总体率95%可信区间可信区间为为 47%83%一、样本率与总体率的比较一、样本率与总体率的比较 目目的的是是推推断断样样本本所所代代表表的的未未知知总总体体率率与与已已知知的的总总体率体率0 0是否相同。是否相同。 已已知知的的总总体体率率0 0一一般般为为理理论论值值、标标准准值值或或经经过过大大量调查所获得的稳定值。量调查所获得的稳定值。 应用条件:应用条件:n足够大足够大(n50),np和和n(1p) 5第五第五节 率的率的 u 检验49例例 某某地地区区一一般般人人群群乙乙肝肝的的阳阳性性率率约约为为15%,今今对对该该地地区区150名名流流

26、浪浪者者进进行行检检查查,其其中中阳阳性性30人人,问问当地流浪者乙肝的阳性率是否高于一般人群当地流浪者乙肝的阳性率是否高于一般人群?50本例本例: n=150,p=30/150=20%,np和和n(1-p) 5, 满足足u检验条件,条件, 0= 15% 511. 建立假建立假设,确定,确定检验水准水准 H0:=0 H1:0 =0.05 2. 选定定检验方法,方法,计算算统计量量 1.715523. 确定确定P值,作出推断,作出推断结论查查t界值最后一行,单侧界值最后一行,单侧u0.05=1.645,双侧,双侧u0.05=1.96本例本例 u=1.715单侧单侧u0.05,所以,所以P0.05

27、。按按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,差异有统计学意,差异有统计学意义,可认为当地流浪者乙肝阳性率高于一般人群。义,可认为当地流浪者乙肝阳性率高于一般人群。 二、两个大样本率的比较二、两个大样本率的比较 应用条件:用条件: n1足足够大大(n50) ,n1p1和和n1(1p1)5 n2足足够大大(n50) ,n2p2和和n2(1p2)553 例例 欲了解从事工农业生产的欲了解从事工农业生产的50岁以上人群患岁以上人群患高血压的情况。调查了首钢工人高血压的情况。调查了首钢工人1281人,高血压人,高血压患者患者386人,患病率为人,患病率为30.13%;石景山区农民;石景山区

28、农民387人,高血压患者人,高血压患者65人,患病率为人,患病率为16.80%,试问这,试问这两类人群高血压患病率有无差别?两类人群高血压患病率有无差别?5455本例本例: n1=1281,X1=386;n2=387,X2=65,满足足u检验条件。条件。P1=0.3013, P2=0.1680 1. 建立假建立假设,确定,确定检验水准水准 H0: 1=2 H1: 12 =0.05 2. 选定定检验方法,方法,计算算统计量量 56386+651281+387= 0.27040.30130.168= 5.17573. 确定确定P值,作出推断,作出推断结论双侧双侧u0.05=1.96 ,u0.01=

29、2.58,本例,本例 u=5.172.58,所,所以以P0.01。按按= 0.05水准,拒绝水准,拒绝H0,接受,接受H1,差异有统计学,差异有统计学意义,可认为这两类人群高血压患病率有差别。意义,可认为这两类人群高血压患病率有差别。第六节第六节 2检验(检验(Chi-square test)t 是是现现代代统统计计学学的的创创始始人人之之一一,英英国国统统计计学学家家K.Pearson于于1900年年提提出出的的一一种种具具有有广广泛泛用用途途的的假假设设检检验验方方法法。常用于计数资料的统计推断。常用于计数资料的统计推断。 检验(检验(Chi-square test )主要用于计数资料的统

30、主要用于计数资料的统计分析,研究的变量是分类变量,而观察值以频数计分析,研究的变量是分类变量,而观察值以频数表示。表示。该方法可用于推断两个及多个总体率(或构成比)该方法可用于推断两个及多个总体率(或构成比)之间有无差别、分类资料的关联度分析等。之间有无差别、分类资料的关联度分析等。 例例 某医生欲比较某医生欲比较A、B两种药物治疗老年抑郁症的两种药物治疗老年抑郁症的效果,将病情相近的效果,将病情相近的60名患者随机分为两组,分别用名患者随机分为两组,分别用两种药物治疗,结果见下表两种药物治疗,结果见下表:60A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有效有效 无效无效 合计合计

31、有效率有效率(%) A药药 19 11 30 63.33 B药药 15 15 30 50.00 合计合计 34 26 60 56.67 一、一、2检验的基本思想检验的基本思想 阳性数阳性数 阴性数阴性数 合合 计 阳性率阳性率(%) A组 a b a+b a/(a+b) B组 c d c+d c/(c+d)合合计 a+c b+d n (a+c)/n 61四格表四格表2检验的基本的基本结构构62A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有效有效 无效无效 合计合计 有效率有效率(%) A药药 19(a) 11(b) 30(a+b) 63.33 B药药 15(c) 15(d) 30(c

32、+d) 50.00 合计合计 34(a+c) 26(b+d) 60(n) 56.6763n如果无效假如果无效假设成立,四个格子的成立,四个格子的实际数数A与理与理论频数数T应比比较接近;如果假接近;如果假设不成立,不成立,则A与与T相差相差较大。大。卡方卡方检验就是看就是看A与与T之之间吻合的程度。吻合的程度。n统计学家学家Pearson提出,在无效假提出,在无效假设H0成立成立时统计量量 2值的分布的分布规律,称律,称为2分布分布。理论频数理论频数计算公式计算公式为:为:R行行(row)C列列(column)65假设假设H0 :1=2=56.67%=(a+c)/n成立,则四个格子的成立,则四

33、个格子的理论数用理论数用 T 表示:表示:T11 = 3034/60 = 17 T12 = 3026/60 = 13T21 = 3034/60 = 17 T22 = 3026/60 = 13A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有效有效 无效无效 合计合计 有效率有效率(%) A药药 19(a) 11(b) 30(a+b) 63.33 B药药 15(c) 15(d) 30(c+d) 50.00 合计合计 34(a+c) 26(b+d) 60(n) 56.6766A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有效有效 无效无效 合计合计 有效率有效率(%) A药药 19(

34、17) 11(13) 30(a+b) 63.33 B药药 15(17) 15(13) 30(c+d) 50.00 合计合计 34(a+c) 26(b+d) 60(n) 56.67 (1917)2 17=+ (1113)2 13 (1517)2 17 (1513)2 13+= 1.09 不同自由度的不同自由度的 分布曲线图分布曲线图 值的大小除了取决于值的大小除了取决于A- -T的差值外,还与格子数有关,的差值外,还与格子数有关,因为每个格子的(因为每个格子的(A- -T)2/T都是正值,所以会随着格子都是正值,所以会随着格子数的增加而变大。严格地说,分布与自由度有关。数的增加而变大。严格地说,

35、分布与自由度有关。 2 2检验的自由度检验的自由度 指可以自由取值的基本格子数指可以自由取值的基本格子数 自由度一定时,其自由度一定时,其 2值的概率分布也就确定。根据自值的概率分布也就确定。根据自由度由度 和检验水准和检验水准 查查 2界值表,可得界值表,可得 2界值,若界值,若 2值值 20.05( ),),则则P0.05,可按,可按 =0.05检验水准拒绝检验水准拒绝H0;若若 2值值 20.05( ),),则则P0.05, 不能拒绝不能拒绝H0。69(p336)70 二、四格表的二、四格表的2检验检验 四格表专用公式:四格表专用公式:四格表四格表四格表四格表2 2 公式的公式的公式的公

36、式的使用原则:使用原则:使用原则:使用原则: 当当n40,所有所有T 5时,用普通时,用普通 2 检验检验 当当n40,任一格子任一格子1 T5时,用校正时,用校正 2 检验检验 当当n40或或任一格子任一格子T 1时,用时,用Fisher确切概率法确切概率法 71校正公式:校正公式:72 2检验步骤:检验步骤:1. 建立假建立假设,确定,确定检验水准水准 H0: 1 2,两种,两种药物有效率相同物有效率相同 H1: 1 2,两种药物有效率不同,两种药物有效率不同 = 0.05 2. 计算算统计量量2值73T11 = 3034/60 = 17 T12 = 3026/60 = 13T21 = 3

37、034/60 = 17 T22 = 3026/60 = 13n = 60,且所有的,且所有的T5故用普通故用普通 2 检验,检验,不用校正不用校正74= (19151115)260 30303426= 1.09A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有效有效 无效无效 合计合计 有效率有效率(%) A药药 19(a) 11(b) 30(a+b) 63.33 B药药 15(c) 15(d) 30(c+d) 50.00 合计合计 34(a+c) 26(b+d) 60(n) 56.67=75 2f(2) =1自由度自由度 =1的的2分布分布值示意图值示意图3.84 =0.051.093

38、. 确定确定P值,作出,作出结论76 =(21) (21)=1,按,按=1查查 2界值表,界值表, 20.05(1)=3.84, 本例本例2 =1.093.84,所以,所以P0.05。 按按=0.05水准,不拒绝水准,不拒绝H0,差异无统计学意义,差异无统计学意义, 不能认为两种药物的有效率不同。不能认为两种药物的有效率不同。77 方法方法 有损伤有损伤 无损伤无损伤 合计合计 损伤率损伤率(%) 手术手术 22 6 28 78.57 放疗放疗 7 8 15 46.67 合计合计 29 14 43 67.44例例 两种方法治疗脑胶质瘤患者后脑功能损伤率比较两种方法治疗脑胶质瘤患者后脑功能损伤率

39、比较78 2检验步骤:检验步骤:1. 建立假建立假设,确定,确定检验水准水准 H0: 1 2,两种方法,两种方法脑功能功能损伤率相同率相同 H1: 1 2,两种方法脑功能损伤率不同,两种方法脑功能损伤率不同 = 0.05 2. 计算算统计量量2值79T11 = 2829/43 = 18.88 T12 = 2814/43 = 9.12T21 = 1529/43 = 10.12 T22 = 1514/43 = 4.88n = 43,且,且T22 5故应用校正故应用校正 2检验检验 方法方法 有损伤有损伤 无损伤无损伤 合计合计 损伤率损伤率(%) 手术手术 22 6 28 78.57 放疗放疗 7

40、 8 15 46.67 合计合计 29 14 43 67.4480 ( 22867 43/2)243 28152914= 3.19= 方法方法 有损伤有损伤 无损伤无损伤 合计合计 损伤率损伤率(%) 手术手术 22 6 28 78.57 放疗放疗 7 8 15 46.67 合计合计 29 14 43 67.44813. 确定确定 P 值,作出,作出结论 =(21) (21)=1,按,按=1查查 2界值表,界值表, 20.05(1)=3.84, 本例本例2 = 3.193.84,故,故P0.05。 按按=0.05水准,不拒绝水准,不拒绝H0,差异无统计学意义,差异无统计学意义, 不能认为不能认

41、为两种治疗方法脑功能损伤发生率不同两种治疗方法脑功能损伤发生率不同。如果不校正:如果不校正: ( 22867 )243 28152914= 4.528 3.84 = 20.05(1)故故P0.05,可认为,可认为两种治疗方法的两种治疗方法的脑功能损伤发生率不同。脑功能损伤发生率不同。疗法疗法 治愈未治愈合计治愈率治愈未治愈合计治愈率%新疗法新疗法 72 977.78保守疗法保守疗法 2 6 825.00合计合计 9 8 17 52.94本例本例n=1740,宜用,宜用四格表确切概率法。四格表确切概率法。 两种疗法对腰椎间盘脱出症的疗效两种疗法对腰椎间盘脱出症的疗效 三、配对四格表的三、配对四格

42、表的2检验(检验(McNemar检验)检验)样样 品品甲甲乙乙 n份份abcd配对四格表资料的基本结构配对四格表资料的基本结构甲甲 法法 乙乙 法法 a b a+b c d c+d合合 计 a+ c b+ d n合合 计计配对四格表配对四格表 2值的计算值的计算b+c40 时:时:b+c40 时需校正时需校正:例例 有有50份痰液标本,每份分别接种在甲、乙两种份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌生长情况,结果见下表,培养基中,观察结核杆菌生长情况,结果见下表,试比较两种培养基的效果。试比较两种培养基的效果。 乙乙培养基培养基 27 12 39 3 8 11合合 计计 30

43、 20 5087两种培养基培养效果比较两种培养基培养效果比较甲培养基甲培养基合合 计计88 2检验步骤:检验步骤:1. 建立假建立假设,确定,确定检验水准水准 H0:B = C,两种培养基的阳性率相同两种培养基的阳性率相同 H1:BC,两种培养基的阳性率不同两种培养基的阳性率不同 = 0.05 2. 计算算统计量量2值 本例本例 b+c=12+3=1540,故使用校正公式:,故使用校正公式:893. 确定确定P值,作出,作出结论 本例本例=(21) (21)=1,按,按=1查查2界值表,界值表, 20.05(1)=3.84,算得,算得2 =4.273.84,故,故P0.05。 按按=0.05水

44、准,拒绝水准,拒绝H0,接受,接受H1,差异有统计学,差异有统计学意义,可以认为甲、乙两种培养基意义,可以认为甲、乙两种培养基的阳性的阳性率不同率不同。 ( 123 1 )2 12+3= 4.27 当四格表的行数或列数大于当四格表的行数或列数大于2时,称为时,称为行行列表列表或或RC表表,用于多个,用于多个样本率样本率或或构成比构成比的比较。的比较。应用条件:应用条件:样本含量较大,理论频数样本含量较大,理论频数1 T5的格子的格子不超过总格子的不超过总格子的1/5,且不能有任意一个格子的,且不能有任意一个格子的T1。行行行行 列表专用公式:列表专用公式:列表专用公式:列表专用公式:90 四、

45、四、RC表资料的表资料的2检验检验 家庭关系家庭关系 满意度满意度 合计合计 满意率(满意率(%) 满意满意 不满意不满意 和和 睦睦 174 60 234 74.36 一一 般般 36 57 93 38.71 差差 6 10 16 37.50 合合 计计 216 127 343 62.97343例离退休老人的家庭关系与生活满意度例离退休老人的家庭关系与生活满意度 (一)多个率的比较(一)多个率的比较 T33 = 16127/343 = 5.92Tmin =92 2检验步骤:检验步骤:1. 建立假建立假设,确定,确定检验水准水准 H0: 1=2=3 H1: 1、2、3不等或不全等不等或不全等

46、= 0.05 2. 计算算统计量量2值93=343(1742/234216+602/234127+102/161271 )= 40.94 家庭关系家庭关系 满意度满意度 合计合计 满意率(满意率(%) 满意满意 不满意不满意 和和 睦睦 174 60 234 74.36 一一 般般 36 57 93 38.71 差差 6 10 16 37.50 合合 计计 216 127 343 62.973. 确定确定P值,作出,作出结论 本例本例=(31) (21)=2,按,按=2查表,查表,20.05(2)=5.99, 20.01(2)=9.21,算得,算得2 =40.949.21,所以,所以P0.01

47、。 按按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,差异有,差异有统计学意义,可以认为三种不同家庭关系的老统计学意义,可以认为三种不同家庭关系的老人生活满意度不同或不全同,家庭和睦的老人人生活满意度不同或不全同,家庭和睦的老人生活满意率最高。生活满意率最高。 民族民族 职业职业 合计合计 干部干部 工人工人 农民农民 其他其他 汉族汉族 20 56 62 7 145 回族回族 14 40 32 11 97 满族满族 18 28 45 8 99 合合 计计 52 124 139 26 341三个民族居民的职业分布三个民族居民的职业分布 (二)多个构成比的比较(二)多个构成比的比较 T24

48、 = 9726/341 = 7.4Tmin =96 2检验步骤:检验步骤:1. 建立假建立假设,确定,确定检验水准水准 H0:三个民族:三个民族职业构成比分布相同构成比分布相同 H1:三个民族职业构成比分布不同或不全同三个民族职业构成比分布不同或不全同 = 0.05 2. 计算算统计量量2值97= 341(202/14552+562/145124+ 82/99261 )= 8.802 民族民族 职业职业 合计合计 干部干部 工人工人 农民农民 其他其他 汉族汉族 20 56 62 7 145 回族回族 14 40 32 11 97 满族满族 18 28 45 8 99 合合 计计 52 124

49、 139 26 3413. 确定确定P值,作出,作出结论 本例本例=(31) (41)=6,按,按=6查表,查表,20.05(6)=12.59,前算得,前算得2 =8.80212.59 ,故,故 P0.05。 按按=0.05水准,不拒绝水准,不拒绝H0,差异无统计学意,差异无统计学意义,不能认为义,不能认为三个民族居民的职业总体构成比三个民族居民的职业总体构成比不同不同。行行列表列表X2检验注意事项检验注意事项1无无校校正正公公式式。不不能能有有1/5以以上上的的格格子子理理论论数数小小于于5,或或者者不不能能有有一一个个格格子子的的理理论论数小于数小于1。 如如有有1/51/5以以上上格格子

50、子的的理理论论数数小小于于5 5,或有小于或有小于1 1的理论数时,应进行以下处理:的理论数时,应进行以下处理: 尽可能增加样本含量,以增加理论数;尽可能增加样本含量,以增加理论数;将将较较小小理理论论数数所所在在的的行行或或列列的的实实际际数数与与邻邻近近的的行行或或列列中中的的实实际际数数合合并并,但但要要注注意意合合并并的的合合理理性性,即即性性质质相近符合专业上的要求;相近符合专业上的要求;删去理论数太小的格子所对应的行或列;删去理论数太小的格子所对应的行或列;计算精确概率计算精确概率( (详见有关统计学专著详见有关统计学专著) )。 表表1 两种儿童发生意外伤害的种类两种儿童发生意外

51、伤害的种类组组 别别 跌伤跌伤 碰撞伤碰撞伤 割刺伤烧烫伤割刺伤烧烫伤 其他其他 合计合计有行为问题有行为问题 75 35 35 2(1.07) 34 181无行为问题无行为问题 296 128 89 3(3.93) 146 662合合 计计 371 163 124 5 180 843 表表2 两种儿童发生意外伤害的种类两种儿童发生意外伤害的种类组组 别别 跌伤跌伤 碰撞伤碰撞伤 割刺伤割刺伤 其他其他 合计合计有行为问题有行为问题 75 35 35 36 181无行为问题无行为问题 296 128 89 149 662合合 计计 371 163 124 185 843行行列表列表X2检验注意

52、事项检验注意事项2多多个个样样本本率率做做比比较较,若若所所得得统统计计推推断断为为拒拒绝绝H0,接接受受H1时时,只只能能认认为为各各总总体体率率之之间间总总的的来来说说有有差差别别,不不能能说说明明任任两两个个总总体体率率之之间间均均有有差差别别。若若要要进进一一步步分分析析彼彼此此间间是是否否有有差差别别,可可采用采用X2分割法。分割法。3双向有序行双向有序行列表资料不宜用列表资料不宜用X2检验。检验。 甲乙两医生独立检查甲乙两医生独立检查100例可疑例可疑视网膜病病例结果比较视网膜病病例结果比较甲医生甲医生 乙乙 医医 生生无轻度中度重度合计无轻度中度重度合计无无245 20 31轻度

53、轻度 4 18 21 25中度中度 13182 24重度重度 12 5 12 20合计合计30 2827 15100双向有序资料双向有序资料104 检验检验U检验检验定性数据定性数据的统计分析的统计分析第十六章第十六章统计推断统计推断 第第4-64-6节节参数估计参数估计假设检验:假设检验:频数分布频数分布集中趋势指标集中趋势指标离散趋势指标离散趋势指标医学参考值范围估计医学参考值范围估计定量数据定量数据的统计分析的统计分析第十五章第十五章统计描述统计描述第第1 1、2 2节节统计推断统计推断第第3-63-6节节U检验检验t 检验检验方差分析方差分析统计描述统计描述 相对数相对数第第1-31-3节节参数估计参数估计假设检验假设检验

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号