预防医学:分类变量的统计分析

上传人:窝*** 文档编号:201018239 上传时间:2021-10-08 格式:PPT 页数:101 大小:2.23MB
返回 下载 相关 举报
预防医学:分类变量的统计分析_第1页
第1页 / 共101页
预防医学:分类变量的统计分析_第2页
第2页 / 共101页
预防医学:分类变量的统计分析_第3页
第3页 / 共101页
预防医学:分类变量的统计分析_第4页
第4页 / 共101页
预防医学:分类变量的统计分析_第5页
第5页 / 共101页
点击查看更多>>
资源描述

《预防医学:分类变量的统计分析》由会员分享,可在线阅读,更多相关《预防医学:分类变量的统计分析(101页珍藏版)》请在金锄头文库上搜索。

1、1,统计分析,第十六章 分类变量的统计分析,2,分类变量的统计描述,常用相对数,应用相对数的注意事项,率的标准化法,3,绝对数与相对数的概念,绝对数(absolute number): 分类变量资料整理后所得到的原始数据,通常不具有可比性。 相对数(relative number): 指两个有联系的指标之比,是分类变量 统计描述指标的统称。,3,4,相 对 数,第一节 常用相对数,5,概 念,计 算,一、率(rate),5,6,6,比例基数K的取法: 可取百分率(%) 、千分率() 、万分率(1/万) 、十万分率(1/10万) 等,主要根据习惯用法和使结果保留一、二位整数。 医学上常用的率:

2、发病率、患病率、死亡率、病死率、治愈率、 生存率等。,7,某年某市三个区的肠道传染病发病率,7,市区 人口数 发病人数 发病率() 甲 98740 503 5.09 乙 75135 264 3.51 丙 118730 466 3.92 合计 292605 1233 4.21,8,概 念,计 算,二、构成比(proportion),8,9,病情严重程度 住院人数 病死数 死亡构成(%) 病死率(%) 轻 300 12 26.7 4.0 中 350 18 40.0 5.1 重 150 15 33.3 10.0 合计 800 45 100.0 5.6,9,2000年某医院某病的住院人数和死亡人数,1

3、0,白细胞分类 分类计数 构成比(%) 中性粒细胞 140 70.0 淋巴细胞 50 25.0 单核细胞 5 2.5 嗜酸粒细胞 4 2.0 嗜碱粒细胞 1 0.5 合计 200 100.0,10,某正常人的白细胞分类计数构成比,11,构成比的特点,11,各组成部分的构成比之和 为100%。,事物内部某一部分构成比发生 变化,其它部分的构成比也相 应地发生变化。,特 点,12,概 念,计 算,三、相对比(relative ratio),12,13,例1 我国2010年第六次人口普查总人数中,男性为686852572人,女性为652872280人,试计算人口男女性别比例。,结果说明,我国男性人数

4、为女性人数的1.052倍,或者表达成男:女为 105.20:100。(2000年第五次普查结果为 106.74:100),686852572,652872280,男女性别比例 =,= 1.0520,14,14,例2 某市乙型脑炎的发病率1990年为 4.48/10万,2000年为0.88/10万,则这两年相对比为:,15,15,例3 某医院2005年医护人员为875人,同年平均开病床1436张,则该医院2005年病床数与医护人员的相对比为:,16,16,例4 变异系数(coefficient of variation , CV),17,17,2005年某研究组对武汉市江汉区中学生的吸烟情况、吸

5、烟原因进行了调查。共调查1722人,男生839人中172人吸烟;女生883人中17人吸烟,抽烟的主要原因见表。试计算: (1)男女生吸烟率。 (2)男女生吸烟率之比。 (3)计算各种吸烟原因所占的百分构成比,并找出前三位的吸烟原因。,常用相对数求法举例,18,性别 人数 吸烟人数 吸烟率(%) 男 839 172 20.50 女 883 17 1.93 合计 1722 189 10.98,18,2005年某地区中学男、女生吸烟率比较,男、女生吸烟率相对比=20.50/1.93=10.62,19,吸烟原因 人数 构成比(%) 位次 解除烦恼 64 33.86 1 显示气派 45 23.81 2

6、帮助社交 43 22.75 3 帮助思考 16 8.47 4 显示富有 12 6.35 5 其 它 9 4.76 6 合 计 189 100.0 ,19,189名吸烟者的吸烟原因构成比,20,第二节 应用相对数的注意事项,1.计算相对数时,分母不宜过小 2.正确区分构成比和率 3.比较相对数时,应注意资料的可比性:率的标准化 4.分母不同的率不能简单相加求平均率 5.样本率或构成比的比较应进行假设检验,WARNING,20,21,为了消除相比较组间因内部构成不同对所比较指标的影响,采用统一的标准构成对总率进行调整,使算得的标准化率具有可比性,得出科学的结论。,21,率的标准化的概念与基本思想:

7、,第三节 率的标准化法,22,住院人数 治愈人数 治愈率(%) 甲医院 乙医院 甲医院 乙医院 甲医院 乙医院 内科 1500 500 975 315 65.0 63.0 外科 500 1500 470 1365 94.0 91.0 传染病科 500 500 475 460 95.0 92.0 合计 2500 2500 1920 2140 76.8 85.6,22,科别,甲、乙两医院的治愈率,23,标准化率的计算,1.选定标准 选择有代表性、较稳定、数量较大的人群,如全国、全省的历年累计数据;也可将比较组的人口合并;任选其中一组作为标准。 2.计算标化率 直接法 间接法 3.比较得出结论,23

8、,24,24,直接法 已知各科的真实治愈率。,25,原治愈率 Pi (%) 预期治愈人数 Ni Pi 甲医院 乙医院 甲医院 乙医院 内科 2000 65.0 63.0 1300 1260 外科 2000 94.0 91.0 1880 1820 传染病科 1000 95.0 92.0 950 920 合计 5000 76.8 85.6 4130 4000,25,科别,标准人口 Ni,甲、乙两医院的标准化治愈率(直接法),26,甲医院标准化后的治愈率: 乙医院标准化后的治愈率:,26,4130,5000,4000,5000,= 80%,= 82.6%,100%,100%,27,原治愈率 Pi (

9、%) 预期治愈率 Ni/NPi (%) 甲医院 乙医院 甲医院 乙医院 内科 0.4 65.0 63.0 26.0 25.2 外科 0.4 94.0 91.0 37.6 36.4 传染病科 0.2 95.0 92.0 19.0 18.4 合计 1.0 76.8 85.6 82.6 80.0,27,科别,标准人口构成比 Ni / N,甲、乙两医院的标准化治愈率(直接法),28,住院人数 治愈人数 治愈率(%) 甲医院 乙医院 甲医院 乙医院 甲医院 乙医院 内科 1500 500 975 315 65.0 63.0 外科 500 1500 470 1365 94.0 91.0 传染病科 500

10、500 475 460 95.0 92.0 合计 2500 2500 1920 2140 76.8 85.6,28,科别,甲、乙两医院的治愈率,间接法 未知:各科真实治愈率 已知:医院总治愈人数和各科住院人数 各科标准治愈率和总的标准治愈率(文献获得),29,住院人数 Ni 预期治愈人数 Ni Pi 甲医院 乙医院 甲医院 乙医院 内科 61.0 1500 500 915 305 外科 92.0 500 1500 460 1380 传染病科 94.0 500 500 470 470 合计 87.5 2500 2500 1845 2155,29,科别,标准 治愈率 Pi (%),甲、乙两医院的标

11、准化治愈率(间接法),P甲,P乙,87.5%1920/1845,= 87.5%1.04 = 91%,87.5%2140/2155,= 87.5%0.99 = 86.6%,30,30,当Pi代表死亡率时,r/(niPi)是被标化组的实际死亡人数与预期死亡人数的比值,称为标准化死亡比(standard mortality ratio , SMR) 。,31,31,当各比较组内部构成不同,而且对总率有影响时,应对率进行标准化,然后再比较。 选用的标准不同,计算出的标准化率也不同。标准化率只反映各被标化组的相对水平,不代表其实际水平。 各年龄组的率出现明显交叉时,不宜用标准化法。 若是抽样研究,样本标

12、化率的比较应作假设检验。,率的标准化应注意的问题,WARNING,32,统计分析,32,33,参数估计 parameter estimate,假设检验 hypothesis test,统计推断 statistical inference,34,一、率的抽样误差 由抽样造成的样本率与总体率之间的差异以及在同一总体中抽取的各样本率间的差别。 反映率抽样误差大小的指标是率的标准误。,第四节率的抽样误差和总体率的估计,35,率的标准误的计算:,理论值: 估计值:,35,36,例 欲了解某种新药对慢性乙型肝炎的疗效,对100名患者进行治疗,其中90人有效,试计算其标准误。 本例n=100 p = 901

13、00 = 0.9,标准误为:,36,0.03,37,二、总体率的可信区间估计,37,根据已知条件,总体率可信区间的估计有2种方法:,正态近似法 查表法,38,38,二项分布,从某个二项分类总体中随机抽取含量一定的样本,发生阳性结果的次数x的概率分布服从二项分布(binomial distribution),即样本中阳性数概率等于二项式展开后各项。若总体阳性率为、样本含量为n,阳性数为X,则样本中出现X个阳性事件的概率可由下式求得。,39,39,已知:=0.3,n =5;=0.3,n =10;=0.3, n=15;=0.5,n=10。根据上述公式求各阳性数事件的概率并作概率分布图。,率的抽样分布

14、图,40,40,P(X),X,X,X,a. n=5,b. n=10,c. n=30,=30%的二项分布示意图,P(X),P(X),41,41,率的抽样分布特征,1. 为离散型分布; 2. 当=0.5 时,呈对称分布; 3. 当 n 增大时,只要不太接近0或1,二项分布 逐渐逼近正态分布。 一般认为,当n和n(1-)5时, 可近似看作 正态分布。,42,42,1. 正态近似法 当n足够大(n50),且np和n(1p) 5,总体率95%可信区间:,总体率99%可信区间:,总体率可信区间估计的方法,43,上例中某地治疗100名患者,90人有效,得出 有效率90%,试估计该新药有效率95%置信区间。

15、n=100,p = 0.9,np=90 5,n (1-p) =10 5 前已算得 ,则其95%CI为:,43,= 0.9 1.960.03 =(0.8412,0.9588) 即该新药有效率95%置信区间为84.12%95.88%。,0.03,44,2.查表法 如果n、p不满足上述条件(n50),可根据二项分布的原理估计总体率的置信区间。 即根据样本含量n和阳性数X查表得到总体率的置信区间。 当xn/2时,直接查表可得; 当xn/2时,应以n-x查表,然后用100减去查得的数字,即为所求的区间。,44,45,例 某社区抽取40岁以上居民30人测量血压,查出高血压10名,试估计该社区40岁以上居民

16、高血压患病率的95%置信区间。 n=30,阳性患者数 x=10。 查百分率的置信区间表(P331)得:,45,即该社区40岁以上居民高血压患病率的95%CI为17%53%,1753,46,上例若 n=30,阳性患者数 x=23,求总体率95%CI。 第一步:n-x=30-23=7 查表(n=30, x=7)得:10%42% 第二步:100%10%90% 100%42%58% 得总体率95%可信区间为 58%90%,47,一、样本率与总体率的比较 目的是推断样本所代表的未知总体率与已知的总体率0是否相同。 已知的总体率0一般为理论值、标准值或经过大量调查所获得的稳定值。 应用条件:n足够大(n50),np和n(1p) 5,第五节 率的 u 检验,48,例 某地区一般人群乙肝的阳性率约为15%,今对该地区150名流浪者进行检查,其中阳性30人,问当地流浪者乙肝的阳性率是否高于一般人群?,本例: n=150,p=30/150=20%,np和n(1-p) 5, 满足u检验条件, 0= 15%,49,1. 建立假设,确定检验水准 H0:=0 H1:0 =0.05 2. 选定检验方法,计算统计量,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 医学试题/课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号