医学统计学 定性资料的统计描述

上传人:wt****50 文档编号:49588658 上传时间:2018-07-31 格式:PPT 页数:52 大小:2.94MB
返回 下载 相关 举报
医学统计学 定性资料的统计描述_第1页
第1页 / 共52页
医学统计学 定性资料的统计描述_第2页
第2页 / 共52页
医学统计学 定性资料的统计描述_第3页
第3页 / 共52页
医学统计学 定性资料的统计描述_第4页
第4页 / 共52页
医学统计学 定性资料的统计描述_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《医学统计学 定性资料的统计描述》由会员分享,可在线阅读,更多相关《医学统计学 定性资料的统计描述(52页珍藏版)》请在金锄头文库上搜索。

1、第三章: 定性资料的统计描述引 子:定性 变量定时 变量研 究 方 法统计描述统计推断变 量医学统计学统计学两分类多分类【举例】 某年甲乙两地发生麻疹流行,甲地发病人数为人,乙地发病人数为人,甲地发病人数比乙地多人,能否据 此认为甲地麻疹发病比乙地严重呢? .目的:比较甲、乙两地麻疹的发病情况。问题1.甲地麻疹发病比乙地严重吗?问题2.该怎样表示两地麻疹发病强度?绝对数相对数分类资料的统计描述常用相对数往往先统计具有某种属性的个体数,进而 用相对数来描述和比较这类变量。相对数(Relative number)的概念:是两个具有内在联系的指标之比。包括频率 ( Frequency or Prop

2、ortion)强度 ( Intensity )相对比 ( Relative ratio )第一节 三种相对数定性资料频率分布表/图特点:能描述一个全面的分布特征,即把 所有各种可能性的机会都给描述出来。相对数指标特点:从某个侧面来描述定性变量,尽管不 一定能全面的描写某分布,但有助于统计描述和推断。相对数指标频率分布表/图分布特征频率型指标强度型指标相对比指标一、频率与频率分布表3-1 某课题组为研究白细胞减少症与工作环境的关 系,用随机抽样的方法对某市企业的四个工种共1114 名工人进行了调查。依白细胞减少症的诊断标准判断 调查对象是否为患者。(1)按工种描述调查对象和患者的频率分布情况:3

3、4.9%13.8%27.9%23.4%45.3%14.1%20.3%20.3%调查对象所作工种 的频率分布图白细胞减少症患者所 作工种的频率分布图各百分比相当于各工种频数出现的频率,这些频 率加起来是100%;多种工种的情形就有多种频率,这 些频率就构成了一个频率分布,描述两个不同人群各 种工种的分布或说构成情况。 .(2)按“是否患白细胞减少症”描述频率分布情况 : 患白细胞减少症的频率占:64/1114=5.7% 不患此病的频率占:1-5.7%=94.3%所以对这样一个二项分类来说,用一个5.7%就 能描述整个资料的频率分布。(3)按“某工种调查对象中是否患白细胞减少症”这一特征来描述频率

4、分布情况: 二分类资料,对苯作业389个工人中,白细胞减少 症的患病的频率占7.5%,不患的占92.5%。一、频率(Frequency):指某现象发生的频率,或表示事物内部某个 组成成发所占的比重或分布。频率的特征:分子是分母的一部分; 无量纲,在01之间取值。计算公式:麻疹患者 300人甲地 30000人二、强度(intensity):强度是流行病学、统计学术语,指单位时间内某现 象发生的频率。 分母含有时间,指单位时间内的频率; 其统计学本质为频率强度,即概率强度的近似值。计算公式:特点:“人时”:人观察时间(年、月)举例:10个人观察1年单位“人年”10人年1个人观察10年有3个人,第1

5、个人观察10年第2个人观察 5年第3个人观察 1年16人年相当于16个人观察了1年 观察人时的总和=单位时间折合的观察人数1个人观察1年1人年 单位时间内新发病例的概率式中的K为比例基数,可以为100%、1000、10 000/万、100 000/10万等。例3-2 某企业2003年有2839名职工,该企业每年都 对职工进行体检,这一年新发生高血压病人5例, 试求2003年的高血压发病率:答:即:2003年的高血压发病率为1.76人/1000人年。据此推测2003年观察人群发生高血压的概率是1.76 。【举例】:在某医院院内感染调查中,5031个病人共 观察了127859人日(人均25.4日,

6、也相当于127859人 各观察1日),其中有596人在医院发生感染,试求其 院内感染率? 100%127859人1日596人=院内感染率K 观察人数总和新发病例数=0.47人/100人日=答:即每天医院内发生院内感染的频率是0.47人/100人 日,据此推测平均每天100人中有0.47个患者将在医院内发生感染。三、相对比 (relative ratio):是两个有关联的指标 A与 B,实际应用中简称比( ratio),说明二者的对比水平。计算公式:意义:表示相对于B 的一个单位,A 有多少个单位, 或A为B的若干倍或百分之几。1. A和B是绝对数,也可是相对数、平均数。2. A和B可是同性质的

7、指标,也可是不同性质的指标 ,即其量纲可以相同,也可以不同。3. 但 A 和 B应互不包含。 人中调查中使用的男女性别比例比。 某病年龄组发病率之比。 甲乙两地亩产量之比 医院管理中“医护人员与病床数”之比注意:【举例】【举例】 某市19771979年肺癌死亡率城区为19.39/10万,郊区为9.99/10万,比较二者的严重程度。答:即城区肺癌死亡率为郊区的1.94倍。 R= 19.39/9.99=1.94应用相对数时应注意的问题:(一)防止概念混淆 不少指标命名混乱,某某率满天飞!有的某某率实际上只是相对比! 更多的指标笼统的称为“率”,但分不清究竟是频率,还是强度。故实践中遇到相对比的指标

8、,应认真思考 其定义,辩别其性质,切不可顾名思义。(二) 频率型指标的解释要紧扣总体和属性工种 (1)调查对象患者例数频率( %)例数频率(% ) (2)(3)(4)(5)苯作业38934.92945.3 塑料作业31127.91320.3 化学药物26023.41320.3 放射作业15413.8 914.1 合计1114100.064100.0表3-1 不同工种调查对象和白细胞减少症患者的频率分布(三) 计算相对数的分母应有足够量。例一:甲医院治疗100例患者,其中40例有效。甲医院有效率是40%例二:乙医院治疗5例患者,其中2例有效。乙医院有效是2/5,其疗效有待于进步观察故资料总例数过

9、少,则计算所得相对数的偏差会 比较大,这种情况下直接报告原始数据更为可取。(四) 正确的合并估计举例:甲医院治疗患者100例,40例有效。乙医院治 疗同类患者90例,30例有效,计算两院的总有效率。答:分别计算甲、乙两院的有效率,相加后除2:就分别将分子(分母)相加作为合并估计的分子(分母)有效率=21 10040 9030( + )正确合并:100+9040+30有效率= =36.8%(五) 相对数间的比较要具有可比性观察对象、研究方法(检验手段、抽样方法) 、观察时间等; 观察对象的内部构成; 非同期资料对比时应注意客观条件的变化注意以下几个方面:(六) 对相对数的统计推断:统计学研究特点

10、:n 抽样研究:研究的是样本,目的对总体作出推断n 得到的是频率,要对概率作出推断。从样本估计总体相对数,需进行参数估计和假设检验对频率分布进行统计推断比较成熟对强度指标进行统计推断不容易对相对比进行统计推断非常困难理论和技术第四节 粗率的标准化法【分析】:病型甲疗法乙疗法 病例治愈 数治愈率( %)病 例治愈 数治愈率( %)普通型30018060.01006565.0重型1003535.030012541.7合计40021553.840019047.5例3-3: 比较甲、乙两个疗法的治愈率 该病的严重情况对治愈率有直接的影响,但在两组的 分布明显不同。比较两疗法的治愈率,从合计率看甲法优于

11、乙法。因为两组该病轻重病型构成不同,所以粗治愈率不 能直接拿来比较。【分析】:【例2 】 : 比较某地有一个钢铁厂,一个棉纺 厂,两厂人数、规模近似,体检时发现,棉纺 厂的胆囊炎患者明显地高于钢铁厂,这能否说 明棉纺厂的胆囊炎患病情况比钢铁厂严重? 不能 性别构成是影响胆囊炎患病的因素,女性易患 胆囊炎。 两厂性别构成不同,棉纺厂女性所占比例明显 高于钢铁厂,所以不能得出该结论。“率的标准化”的意义和基本思想如需比较,须采用统一标准构成消除该因素的内部构 成不同对粗率的影响后,用标准化后的统一标准化率 再进行比较。当年龄、性别、工龄、病情等因素在两组的内部 构成不同并有可能影响到粗率的情况时,

12、则粗死 亡率、发病率、粗治愈率不能直接进行比较。率的标准化一、基本概念:率的标准化法(standardization) :产用一定技术手段,消除待比较两组率的在人口构成上的差异,从 而推算出统一人口构成的合计率,这一过程,叫率 的标准化法。标准化率(standardized rate)或调整率(adjustment rate):消除了内部构成差异后计算得出的合计率称为标准化率。常需标化的指标:人口死亡率、病死率、发病率等常见的混杂因素:年龄、性别、病情等二、标准化率的计算:直接法和间接法(一)直接法 适用条件 :已知各组粗率,即实际年龄别死亡率 P甲380/800100% 47.5%P乙 42

13、7/800100% 53.4% 具体步骤:原则:一般地,有一个重要的分类变量,它在两组个体 (j =1,2)中的分布不同,且已知第 j 组每个类别中发 生某事件的频率Pij ,i =1,2,。1. 选定“标准人口”,每个类别的个体数记为Ni,i=1,2,u 选定两组之一作人口构成。u 两组合并作人口构成。u 在两组之外另选一个群体,如采用全国、全省或全地区的对象,将其作为标准。选择方法:要求:就选择有代表性的、较稳定的、数量较大的人群计算各标化组预期死亡数:各组预期治愈数标准构成人口数各组粗死亡率 2. 分别计算“标准人口”下的预期治愈人数之和计算预期治愈总数:De=Ni Pij标准构成别 组

14、人口数相应组粗 治愈率各组预期死 亡率 Ni Pij ,j= 1,2,N i为标准构成 的人口数NPNpii=P i为被标化组粗 治愈率N 为标准组的总人口数3.分别计算两比较组的标准化治愈率(二)间接法 适用条件 :各组粗率未知,仅知两比较组患 病/死亡总人数,各组调查人口的构成情况。 年龄组别标准 患病率具体步骤:原则:一般地,有一个重要的分类变量,它在两 组个体(j =1,2)的分布不同,且已知第 j 组每 个类别的个体数nij,i=1,2 ,和实际发生某事件 的总人数rj,j =1,2,。1. 选定“标准发生率”,每个类别发生率记为Pi, i=1,2,合计发生率为P。计算各标化组预期死

15、亡数:各组预期治愈数调查各组人口数各组标准发生率2. 分别计算“标准发生率”下预期发生人数之和计算预期治愈总数:De=nij Pi各调查组人 口数相应标准 发生率各组预期死 亡率 nij Pi ,j= 1,2,预期发生总数实际发生总数总的标准 死亡率标化死亡比3.分别计算两比较组的标准化治愈率计算各组的间接标化率 P。标化死亡比 (standard mortality ratio, SMR): 实际死亡总数和期望死亡总数的相对比,其 意义是被标化人群和标准组人群死亡率的比较。p=SMR 标准死亡总率SMR1 说明被标化人群的死亡率大于标准组SMR1 说明被标化人群的死亡率小于标准组小结:标化死

16、亡率的直接法和间接法三、应用标准化法时的注意事项1. 标准化法的应用范围很广 “一个重要的分类变量”:病情、年龄、性别、职业等 “某事件的发生率”:治愈率、患病率、发病率、死亡率等3. 由于选择的标准不同,算出的标准化率也不同,比较 的结果也未必相同,因而报告结果时必须说明所选用 的“标准”及理由。2. 标化后的标准化率已不再反映当地的实际水平,它只 是表示相互比较的资料间的相对水平。4. 两样本的标准化率是样本值,存在抽样误差。要比较 时,当样本含量较小时,还应作假设检验。小 结定性资料的变量形式有多分类和两分类。可通过频率表描 述全面的分布特征,用相对数从所侧重的方面描述某属性的 特征,通常描述某一类别的频数在总频数中占

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 文化创意

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号