《卫生管理统计学课件:第五章 定性资料的统计描述》由会员分享,可在线阅读,更多相关《卫生管理统计学课件:第五章 定性资料的统计描述(38页珍藏版)》请在金锄头文库上搜索。
1、第五章第五章 定性资料的统计描述定性资料的统计描述 本章要求:本章要求:掌握掌握 三个常用相对数及其应用注意事项熟悉熟悉 动态数列分析中的统计描述过程;能用SPSS软件计算资料的相对数了解了解 调查率的标准误方法及其应用率率 率(率(rate)是指某种现象在一定条件下,实是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察际发生的观察单位数与可能发生该现象的总观察单位数之比,用于说明某种现象发生的频率大小单位数之比,用于说明某种现象发生的频率大小或强度,故又称频率指标。一般常用的率有生存或强度,故又称频率指标。一般常用的率有生存率、死亡率、治愈率、接受治疗率等等。率、死亡率、
2、治愈率、接受治疗率等等。 率不受其他指标的影响,各个率之间是相互独立的,其和不为1(如是则为巧合)。第一节第一节 常用相对数常用相对数例例5-1 由章前案例中的数据可知该两所医院由章前案例中的数据可知该两所医院2007-2010年年肺炎住院患者的第一诊断情况如下:甲医院共收治肺炎患肺炎住院患者的第一诊断情况如下:甲医院共收治肺炎患者者1151例,第一诊断为肺炎者例,第一诊断为肺炎者902例;乙医院共收治肺炎例;乙医院共收治肺炎患者患者1280例,第一诊断为肺炎者例,第一诊断为肺炎者790例;试分别计算两医例;试分别计算两医院肺炎患者第一诊断为肺炎率和总的第一诊断为肺炎率。院肺炎患者第一诊断为肺
3、炎率和总的第一诊断为肺炎率。构成比构成比 构成比(构成比(constituent ratio)也称为构成指标,也称为构成指标,是指一事物内部某一组成部分的观察单位数与该事物是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,用以说明某一事物各组成部分的观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布,常用百分数表示。内部各组成部分所占的比重或分布,常用百分数表示。一般所说的某地人口性别构成、血型构成等均为构成一般所说的某地人口性别构成、血型构成等均为构成比。计算公式为:比。计算公式为:例例5-25-2 为了解城乡居民卫生服务需要及主要健康问题,调为了解城
4、乡居民卫生服务需要及主要健康问题,调查了某地区居民参加社会医疗保险的情况,结果如表查了某地区居民参加社会医疗保险的情况,结果如表5-5-1 1所示,试对其进行分析。所示,试对其进行分析。 表表5-1 5-1 某年某地区城乡居民参加社会医疗保险情况构成某年某地区城乡居民参加社会医疗保险情况构成医疗保险类别医疗保险类别参加人数参加人数构成比(构成比(%)城镇职工医保城镇职工医保377953.23公费医疗公费医疗2563.61城镇居民医保城镇居民医保9203.96新农合新农合112715.87其他社会医疗保险其他社会医疗保险5828.19没参加没参加4366.14合计合计7100100.00 由表由
5、表5-1可以看出该地区居民的医疗保险类别以城镇可以看出该地区居民的医疗保险类别以城镇职工医保为主,占总体的职工医保为主,占总体的53.23%,其次为新农合,占,其次为新农合,占15.87%,其他社会医疗保险、城镇居民医保和公费医疗,其他社会医疗保险、城镇居民医保和公费医疗分别占分别占8.19%、3.96%和和3.61%,没参加任何医疗保险的,没参加任何医疗保险的也占了也占了6.14%。 由上面结果可以看出构成比具有以下两个特点:由上面结果可以看出构成比具有以下两个特点: 1.各构成部分的数值在各构成部分的数值在01之间波动,各组成部分的构成之间波动,各组成部分的构成比之和为比之和为100%。
6、2.事物内部各组成部分之间具有此消彼长的特点,即某一事物内部各组成部分之间具有此消彼长的特点,即某一部分所占比重增大,其他部分会相应地减少。部分所占比重增大,其他部分会相应地减少。相对比相对比 相对比(相对比(relative ratiorelative ratio)是指两个有关联是指两个有关联的指标之比,用以描述两者的对比水平,是对比的的指标之比,用以描述两者的对比水平,是对比的最简单形式。常以百分数或倍数表示,说明一个指最简单形式。常以百分数或倍数表示,说明一个指标是另一个指标的百分之几或几倍。计算公式为:标是另一个指标的百分之几或几倍。计算公式为:甲乙两指标可以是性质相同的,也可以是性质
7、不同的,同时,可甲乙两指标可以是性质相同的,也可以是性质不同的,同时,可以是绝对数,也可以是相对数。以是绝对数,也可以是相对数。第二节第二节 应用相对数时应注意问题应用相对数时应注意问题1.计算相对数的分母不宜过小2.分析时不能以构成比代替率(见表)3.不能用构成比的动态分析代替率的动态分析(见表)4.对观察单位不等的几个率,不能直接相加求其总率5.在比较相对数时应注意可比性6.对样本率的比较需做假设检验7.使用相对数时,应参照绝对数,使其更有意义8某化工厂慢性气管炎患病与工龄的关系工龄(年)检查人数患者数构成比患病率%13401711.565.0052543020.4111.81104327
8、349.6616.90151362718.3719.85合计1162147100.0012.65返回某市2000年和2005年5种传染病发病情况疾病2000年2005年病例数构成比%病例数构成比%痢疾360449.39203237.92肝炎120316.49114321.33流脑6989.5654210.11麻疹89012.2076714.31腮腺炎90212.3687516.33合计7279100.005359100.00返回第三节第三节 率的标准化法率的标准化法 一、标准化法的意义一、标准化法的意义 在医学研究中,我们常常需要比较不同地区、不同在医学研究中,我们常常需要比较不同地区、不同人
9、群的发病率、患病率、死亡率、治愈率等,如果所比较的人群的发病率、患病率、死亡率、治愈率等,如果所比较的两个总率的某些影响因素如年龄、性别等在构成上存在差异两个总率的某些影响因素如年龄、性别等在构成上存在差异时,直接比较两个总率是不合理的。为消除这些因素构成不时,直接比较两个总率是不合理的。为消除这些因素构成不同的影响,统计学上常采用同的影响,统计学上常采用率的标准化法(率的标准化法(standardization method of rate)。标准化法就是采用统一的标准构成,以消。标准化法就是采用统一的标准构成,以消除年龄、性别、工龄、病情等因素构成不同对病死率、死亡除年龄、性别、工龄、病情
10、等因素构成不同对病死率、死亡率、治愈率等的影响,使算得的标准化率具有可比性。率、治愈率等的影响,使算得的标准化率具有可比性。引例 欲研究一种新药治疗痢疾的效果,选择800名患者作试验。其中400名(男300名,女100名)服用新药,另外400名(男100名,女300名服用传统药。试验结果见下表:表1 800名患者的结果有效无效合计有效率%新药20020040050传统药24016040060表2 男性患者的结果有效无效合计有效率%新药12018030040传统药307010030表3 女性患者的结果有效无效合计有效率%新药802010080传统药2109030070拆拆分分Simpson Si
11、mpson 现象现象 虽然表虽然表2及表及表3之和等于表之和等于表1的数字,然而从表的数字,然而从表2和表和表3的结果看,其结论恰恰的结果看,其结论恰恰与表与表1的结论相反,无论是男性或女性患者服用新药的疗效高于传统药组。这就的结论相反,无论是男性或女性患者服用新药的疗效高于传统药组。这就是是Simpson现象现象。 当然当然Simpson矛盾现象并不是真正的矛盾,那么如何解释这一现象呢?如果矛盾现象并不是真正的矛盾,那么如何解释这一现象呢?如果我们仔细地观察就会发现,在上述试验中,男性患者试用新药的人数比例为我们仔细地观察就会发现,在上述试验中,男性患者试用新药的人数比例为3/4,大大高于女
12、性。另一方面女性患者二种药物的有效率均高于男性。由于试验中服大大高于女性。另一方面女性患者二种药物的有效率均高于男性。由于试验中服用不同药物的男女人数结构与有效率不一致,引起用不同药物的男女人数结构与有效率不一致,引起Simpson现象。现象。 为了保持三表结论的一致性,试验中要求男性患者中服用新药的人数与传统为了保持三表结论的一致性,试验中要求男性患者中服用新药的人数与传统药的人数相同(或尽可能接近)。药的人数相同(或尽可能接近)。例例病型A疗法B疗法病人数治愈数治愈率%病人数治愈数治愈率%普通型30018060.01006565.0重型1003535.030012541.7合计400215
13、53.840019047.5A、B种疗法治疗某病的治愈率比较 表表5-3 5-3 某年甲、乙两医院治疗某种疾病不同类型患者人数和治愈人数某年甲、乙两医院治疗某种疾病不同类型患者人数和治愈人数类型类型(1)甲医院甲医院 乙医院乙医院治疗人数治疗人数(2)治愈人数治愈人数(3)治愈率治愈率(%)()(4)治疗人数治疗人数(5)治愈人数治愈人数(6)治愈率治愈率(%)()(7)普通型普通型 300 180 60.0 100 65 65.0重型重型 100 40 40.0 300 135 45.0爆发型爆发型 100 20 20.0 100 25 25.0合计合计 500 240 48.0 500 2
14、25 45.0例例5-35-3 某年甲、乙两医院治疗某种疾病不同类型患者人数和最终治愈人数某年甲、乙两医院治疗某种疾病不同类型患者人数和最终治愈人数资料如表资料如表5-35-3所示。试进行甲乙两医院治疗效果的正确比较。所示。试进行甲乙两医院治疗效果的正确比较。二、标准化率的计算方法二、标准化率的计算方法 标准化率的计算方法因已有资料的条件不同而分成标准化率的计算方法因已有资料的条件不同而分成直接法和间接法。直接法的适用条件为已有被观察人群中各直接法和间接法。直接法的适用条件为已有被观察人群中各组的率资料。间接法的适用条件为缺乏各组的率,仅有各组组的率资料。间接法的适用条件为缺乏各组的率,仅有各
15、组的观察单位数和总率资料。无论是直接法还是间接法,关键的观察单位数和总率资料。无论是直接法还是间接法,关键是要选择一个统一的标准人群,来调整内部构成以达到可比是要选择一个统一的标准人群,来调整内部构成以达到可比的目的。选择标准人群的原则是:具有代表性的、内部构成的目的。选择标准人群的原则是:具有代表性的、内部构成相对稳定的、数量较大的人群作为标准。一般有以下三种选相对稳定的、数量较大的人群作为标准。一般有以下三种选择方法:择方法:采用全国、全省或全地区的对象,将其作为标准采用全国、全省或全地区的对象,将其作为标准构成,国际间比较时需要采用世界通用的标准构成;构成,国际间比较时需要采用世界通用的
16、标准构成;从欲从欲比较的两组样本中选一组样本例数较大的内部构成作为标准比较的两组样本中选一组样本例数较大的内部构成作为标准构成;构成;将要比较的两组资料内部各相应部分的观察单位数将要比较的两组资料内部各相应部分的观察单位数合并,作为共同的标准构成。合并,作为共同的标准构成。分组 标 准 组 被 标 化 组 病人数治愈数治愈率%病人数治愈数治愈率%1N1R1P1n1r1p12N2R2P2n2r2p2 KNkRkPknkrkpk合计NRPnrp计算标准化率的数据符号 把不同类型的标准治疗人数分别乘以两医院原治愈率得到甲、把不同类型的标准治疗人数分别乘以两医院原治愈率得到甲、乙两种医院不同类型该病患
17、者预期治愈数,甲、乙两医院预期治愈总数乙两种医院不同类型该病患者预期治愈数,甲、乙两医院预期治愈总数分别除以标准治疗总人数即得:分别除以标准治疗总人数即得: 类型类型(1 1)标准治疗人数标准治疗人数(2 2)甲医院甲医院 乙医院乙医院原治愈率(原治愈率(% %)(3 3)预期治愈数预期治愈数(4 4)= =(2 2)(3 3)原治愈率(原治愈率(% %)(5 5)预期治愈数预期治愈数(6 6)= =(2 2)(5 5)普通型普通型400400 60.060.0 240240 65.065.0 260260重型重型400400 40.0 40.0 160 160 45.0 45.0 180 1
18、80爆发型爆发型200200 20.020.0 4040 25.025.0 5050合计合计 10001000 440440 490490表表5-4 标准化后甲、乙两医院某病治愈率比较标准化后甲、乙两医院某病治愈率比较直接法:直接法: 例5-5 某人调查了甲、乙两县食管癌的死亡情况,甲县食管癌死亡数为1090人,乙县食管癌死亡数为981人,两县的人口资料如表5-6所示,比较甲乙两县食管癌死亡率。 表表5-6 甲、乙两县人口资料甲、乙两县人口资料年龄组(岁)年龄组(岁)甲县人口数甲县人口数构成比(构成比(%)乙县人口数乙县人口数构成比(构成比(%)01 620 78664.101 619 708
19、65.1630229 0319.06282 98711.3840240 5679.52249 37910.0350205 8368.14180 1937.2560142 7825.65103 2444.157089 1693.5350 5692.03合计合计2 528 471100.002 485 780100.00间接法:间接法:甲县的食管癌死亡率甲县的食管癌死亡率=1090/2528471=43.11/10万万乙县的食管癌死亡率乙县的食管癌死亡率=981/2485780=39.46/10万万甲县乙县甲县乙县 由上表可知甲县中由上表可知甲县中5050岁以上人口所占比重为岁以上人口所占比重为1
20、7.32%17.32%,乙县中,乙县中5050岁以上岁以上人口所占比重为人口所占比重为13.43%13.43%,又因为,又因为5050岁以上人口食管癌死亡率较高,这就岁以上人口食管癌死亡率较高,这就造成甲县的食管癌死亡率(造成甲县的食管癌死亡率(43.11/1043.11/10万)高于乙县(万)高于乙县(39.46/1039.46/10万)。这万)。这时甲乙两县食管癌死亡率是不可比的,必须消除了年龄构成上的差别后时甲乙两县食管癌死亡率是不可比的,必须消除了年龄构成上的差别后才能比较。这就要做率的标准化。首先,选另一地区食管癌各年龄组的才能比较。这就要做率的标准化。首先,选另一地区食管癌各年龄组
21、的死亡率作为标准死亡率(见表死亡率作为标准死亡率(见表5-75-7第第2 2列);然后,分别计算甲乙两县食列);然后,分别计算甲乙两县食管癌预期死亡人数(见表管癌预期死亡人数(见表5-75-7第第4 4、6 6列);最后分别计算甲乙两县食管癌列);最后分别计算甲乙两县食管癌实际死亡人数与预期死亡人数之比和标准化死亡率。实际死亡人数与预期死亡人数之比和标准化死亡率。年龄组年龄组(岁)(岁)(1)标准死亡率标准死亡率(1/10 )(2)甲县甲县乙县乙县人口数人口数(3)预期死亡人数预期死亡人数(4)=(2) (3)人口数人口数(5)预期死亡人数预期死亡人数(6)=(2) (5)00.091 620
22、 78611 619 7081302.18229 0315282 98764013.11240 56731249 379335044.20205 83691180 1938060113.20142 782162103 24411770175.5889 16915750 569156合计合计14.592 528 4714472 485 780393表表5-7 用间接法计算甲、乙两县食管癌标准化死亡率用间接法计算甲、乙两县食管癌标准化死亡率 若上述若上述“某事件某事件”为死亡,那么实际死亡人数与预期死亡为死亡,那么实际死亡人数与预期死亡人数之比称为标准化死亡比人数之比称为标准化死亡比SMRSMR。
23、若若SMRSMR1 1,表示被标化组的死亡率高于标准组;,表示被标化组的死亡率高于标准组;若若SMRSMR1 1,表示被标化组的死亡率低于标准组。,表示被标化组的死亡率低于标准组。 本例中甲县食管癌标准化死亡比本例中甲县食管癌标准化死亡比SMR=1090/447=2.44SMR=1090/447=2.44,乙,乙县食管癌标准化死亡比县食管癌标准化死亡比SMR=981/393=2.50SMR=981/393=2.50,表示甲、乙两县的,表示甲、乙两县的食管癌死亡率均高于标准组食管癌死亡率均高于标准组标准化死亡比:标准化死亡比:standardized mortality ratio,SMR三、标
24、准化法的注意事项三、标准化法的注意事项(一)标准化法的应用范围很广,当某个分类变量在两组中分(一)标准化法的应用范围很广,当某个分类变量在两组中分布不同时,这个分类变量就成为两组频率比较的混杂因素,布不同时,这个分类变量就成为两组频率比较的混杂因素,标准化法的目的就是消除这个混杂因素的影响。标准化法的目的就是消除这个混杂因素的影响。(二)标准化后的标准化率不再反映实际水平,它只表示资料(二)标准化后的标准化率不再反映实际水平,它只表示资料间相互比较的相对水平。间相互比较的相对水平。(三)标准化法的实质是找一个标准,使得能够在同一个平台(三)标准化法的实质是找一个标准,使得能够在同一个平台上进行
25、比较,标准选的不同所得到的标准化率值不同,但比上进行比较,标准选的不同所得到的标准化率值不同,但比较的结果应该一样,因此要说明所选用的标准和理由。较的结果应该一样,因此要说明所选用的标准和理由。(四)两样本标准化率仍然是样本值,也存在抽样误差,比较(四)两样本标准化率仍然是样本值,也存在抽样误差,比较时应作假设检验。时应作假设检验。第四节第四节 动态数列及其分析指标动态数列及其分析指标 动态数列(动态数列(dynamic seriesdynamic series)是按时间顺是按时间顺序将一系列统计指标(绝对数、相对数或平均数)序将一系列统计指标(绝对数、相对数或平均数)排列起来,用以观察和比较
26、该事物在时间上的变化排列起来,用以观察和比较该事物在时间上的变化和发展趋势。动态数列的分析是建立在相对比的基和发展趋势。动态数列的分析是建立在相对比的基础上,采用定基比和环比两种方式。常用的分析指础上,采用定基比和环比两种方式。常用的分析指标有绝对增长量、发展速度与增长速度、平均发展标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。速度与平均增长速度。 动态数列的编制原则:动态数列的编制原则:1.1.时期长短应该统时期长短应该统一;一;2.2.总体范围应该一致;总体范围应该一致;3.3.指标的内容应该一致;指标的内容应该一致;4.4.计算口径应该统一。计算口径应该统一。 动态数列
27、的作用:动态数列的作用:1.1.可以描述医疗卫生现可以描述医疗卫生现象在不同时间的发展状态和过程;象在不同时间的发展状态和过程;2.2.可以研究医疗可以研究医疗卫生现象的发展趋势和速度,以掌握其发展变化的卫生现象的发展趋势和速度,以掌握其发展变化的规律性;规律性;3.3.可以进行分析和预测。可以进行分析和预测。 例例5-6 某医院某医院2004-2011年日均门诊量动态变化如表年日均门诊量动态变化如表5-8所示,试所示,试作动态分析。作动态分析。 表表5-8 某医院某医院2004-2011年日均门诊就诊量动态变化年日均门诊就诊量动态变化年份年份(1)符号符号(2)日门诊日门诊人次人次(3)绝对
28、增长量绝对增长量发展速度(发展速度(%)增长速度(增长速度(%)累计(累计(4)逐年(逐年(5)定基比(定基比(6)环比(环比(7)定基比(定基比(8)环比(环比(9)2004 2631 100.0 100.0 2005 2805 174 174 106.6 106.6 6.6 6.62006 3250 619 445 123.5 115.9 23.5 15.92007 3611 980 361 137.2 111.1 37.2 11.12008 3968 1337 357 150.8 109.9 50.8 9.92009 4235 1604 267 160.9 106.7 60.9 6.72
29、010 5423 2792 1188 206.1 128.1 106.1 28.12011 6014 3383 591 228.6 110.9 128.6 10.9一、绝对增长量一、绝对增长量 绝对增长量是说明事物在一定时期内所增长的绝对值。包绝对增长量是说明事物在一定时期内所增长的绝对值。包括:括: 1.累计增长量(累计增长量(cumulative quantity of increase)是指报告是指报告期的指标与基线期的指标之差。以期的指标与基线期的指标之差。以2004年日门诊人次数为基线年日门诊人次数为基线期指标,期指标,2005年至年至2011年的日门诊人次数为报告期指标。如表年的日
30、门诊人次数为报告期指标。如表5-8第(第(4)栏中)栏中2008 年日门诊累计增长量为年日门诊累计增长量为39682631=1337(人次)。(人次)。 2.逐年增长量(逐年增长量(year after year quantity of increase )是指是指报告期的指标与前一期的指标之差。如表报告期的指标与前一期的指标之差。如表5-8第(第(5)栏中)栏中2008 年较年较2007 年日门诊年增长量为年日门诊年增长量为39683611=357(人次)。(人次)。二、发展速度与增长速度二、发展速度与增长速度 发展速度与增长速度说明事物在一定时期的变化情况,发展速度与增长速度说明事物在一定
31、时期的变化情况,均为相对比,可以计算定基比和环比。均为相对比,可以计算定基比和环比。 (一)(一)发展速度(发展速度(speed of development) 表示报告期指标的水平相当于基线期(或前一期)指标表示报告期指标的水平相当于基线期(或前一期)指标的百分之几或若干倍。的百分之几或若干倍。 1定基比定基比 是统一用某个报告时期的数据做基线期,将是统一用某个报告时期的数据做基线期,将各报告时期的数据与之相比。一组动态数列的定基比,是以各报告时期的数据与之相比。一组动态数列的定基比,是以某个固定的基线期数据为标准,可以清晰地反映出某事物在某个固定的基线期数据为标准,可以清晰地反映出某事物在
32、较长时间内发展变化的趋势。较长时间内发展变化的趋势。 2环比环比 是用前一个报告时期的数据为基数,以相邻的是用前一个报告时期的数据为基数,以相邻的后一报告时期的数据与之相比。一组动态数列的环比,其基后一报告时期的数据与之相比。一组动态数列的环比,其基数是依次更换的,可反映某事物逐期变化的趋势。数是依次更换的,可反映某事物逐期变化的趋势。 (二)(二)增长速度(增长速度(speed of increase) 表示的是净增加速度,增长速度表示的是净增加速度,增长速度=发展速度发展速度100%。 表示表示2008年日均门诊量比年日均门诊量比2004年日均门诊量多年日均门诊量多50.8%,2008年日
33、均门诊量比年日均门诊量比2007年日均门诊量多年日均门诊量多9.9%。三、平均发展速度与平均增长速度三、平均发展速度与平均增长速度 平均发展速度(平均发展速度(average speed of average speed of developmentdevelopment)和平均增长速度()和平均增长速度(average speed of average speed of increaseincrease),均说明某现象在一个时期中逐年平均增长的程),均说明某现象在一个时期中逐年平均增长的程度。度。 平均发展速度是一定时期内各环比发展速度的几何平均发展速度是一定时期内各环比发展速度的几何平均值
34、,计算公式为:平均值,计算公式为:式中,式中, 为基线期指标,为基线期指标, 为第为第n n期指标期指标 动态数列不仅可以分析已有资料,而且可以根据过去资动态数列不仅可以分析已有资料,而且可以根据过去资料的变化规律预测未来的情况。根据表料的变化规律预测未来的情况。根据表5-8的资料预测的资料预测2013年日均门诊就诊量,本例年日均门诊就诊量,本例2013年相当于年相当于 ,将已知数据带入,将已知数据带入公式:公式: 根据该医院根据该医院2004-2011年的平均发展速度,预计到年的平均发展速度,预计到2013年该医院的日均门诊量为年该医院的日均门诊量为7594人次。人次。 第五节第五节 软件实现软件实现Analyze Descriptive Statistics Crosstables(例5-1原始数据.sav) 制作列联表制作列联表第五节第五节 软件实现软件实现第五节第五节 软件实现软件实现多选题多选题SPSS实现:实现:资料:多选题(试验)资料:多选题(试验).sav 中的 x1-x5 xAnalyze 设计多对一关联设计多对一关联ok一对多:一对多:结果输出:结果输出:有3人一项未选:52、61和82号