分类变量的统计描述课件

上传人:cn****1 文档编号:568842508 上传时间:2024-07-27 格式:PPT 页数:36 大小:383.50KB
返回 下载 相关 举报
分类变量的统计描述课件_第1页
第1页 / 共36页
分类变量的统计描述课件_第2页
第2页 / 共36页
分类变量的统计描述课件_第3页
第3页 / 共36页
分类变量的统计描述课件_第4页
第4页 / 共36页
分类变量的统计描述课件_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《分类变量的统计描述课件》由会员分享,可在线阅读,更多相关《分类变量的统计描述课件(36页珍藏版)》请在金锄头文库上搜索。

1、 分类变量的统计描述u分类变量的频数分布及其统计指标分类变量的频数分布及其统计指标u标准化法及其应用标准化法及其应用u动态数列及其应用动态数列及其应用主要内容主要内容:第三章分类变量的统计描述第三章分类变量的统计描述分类变量的统计描述第一节第一节第一节第一节 分类变量的频数分布及其统计指标分类变量的频数分布及其统计指标分类变量的频数分布及其统计指标分类变量的频数分布及其统计指标表表3-1 3-1 某单位高血压患病情况某单位高血压患病情况年龄(岁)年龄(岁)(1 1)检查人数检查人数(2 2)患病人数患病人数(3 3)患者构成比患者构成比% %(4 4)患病率患病率% %(5 5)2020200

2、0200014014033.333.37.07.040401500150018018042.942.912.012.050-6050-6050050010010023.823.820.020.0合计合计40004000420420100.0100.010.510.5分类变量的频数分布分类变量的频数分布 分类变量的统计描述第一节第一节第一节第一节 分类变量的频数分布及其统计指标分类变量的频数分布及其统计指标分类变量的频数分布及其统计指标分类变量的频数分布及其统计指标分类变量的统计描述一、一、常用的相对数指标常用的相对数指标u比率比率u速率速率u比比三种类型:三种类型:三种类型:三种类型:第一节第

3、一节 分类变量的频数分布及其统计指标分类变量的频数分布及其统计指标分类变量的统计描述 频表示事物内部某个组成部分所占的比重,频表示事物内部某个组成部分所占的比重,包括:包括:频率指标频率指标和和构成比指标构成比指标。二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标 分子是分母的一部分分子是分母的一部分分子是分母的一部分分子是分母的一部分;无量纲,在;无量纲,在;无量纲,在;无量纲,在0 0 0 01 1 1 1范围内取值;范围内取值;范围内取值;范围内取值;K K K K是比例基数,可取是比例基数,可取是比例基数,可取是比例基数,可取100%100%100%10

4、0%,1000100010001000、10101010万万万万/10/10/10/10万等,根据习惯万等,根据习惯万等,根据习惯万等,根据习惯用法来决定。用法来决定。用法来决定。用法来决定。 第一节第一节 分类变量的频数分布及其统计指标分类变量的频数分布及其统计指标1.1.比率比率 分类变量的统计描述问:问: 结合例结合例3.13.1谈谈构成比与频率的区别。谈谈构成比与频率的区别。二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标第一节第一节 分类变量的频数分布及其统计指标分类变量的频数分布及其统计指标1.1.比率比率 分类变量的统计描述中国累积报告的中国累积报

5、告的HIV感染者按性别分布图感染者按性别分布图1985 2001.6二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标第一节第一节 定性变量的分布特征定性变量的分布特征 1.1.比率比率 分类变量的统计描述 例例例例3-13-13-13-1 某医生研究了慢性阻塞性肺病某医生研究了慢性阻塞性肺病某医生研究了慢性阻塞性肺病某医生研究了慢性阻塞性肺病(COPD)(COPD)(COPD)(COPD)病人的病人的病人的病人的吸烟情况,自吸烟情况,自吸烟情况,自吸烟情况,自19981998199819982000200020002000年收治年收治年收治年收治COPDCOPD

6、COPDCOPD病人病人病人病人356356356356人,其中人,其中人,其中人,其中231231231231人有三十年及以上的经常吸烟史人有三十年及以上的经常吸烟史人有三十年及以上的经常吸烟史人有三十年及以上的经常吸烟史( ( ( (日平均日平均日平均日平均1 1 1 1支以上支以上支以上支以上) ) ) ),在本院,在本院,在本院,在本院其它科室收治的同年龄组段的非其它科室收治的同年龄组段的非其它科室收治的同年龄组段的非其它科室收治的同年龄组段的非COPDCOPDCOPDCOPD病人病人病人病人( ( ( (无其它呼吸系统无其它呼吸系统无其它呼吸系统无其它呼吸系统疾患疾患疾患疾患)479

7、)479)479)479人,其中有三十年及以上的经常吸烟史的人,其中有三十年及以上的经常吸烟史的人,其中有三十年及以上的经常吸烟史的人,其中有三十年及以上的经常吸烟史的183183183183人人人人, , , ,试计算并比较两组病人的试计算并比较两组病人的试计算并比较两组病人的试计算并比较两组病人的吸烟率吸烟率吸烟率吸烟率。分类变量的统计描述 速率速率表示单位时间内某现象发生的频率。如表示单位时间内某现象发生的频率。如人时发病率人时发病率的分子是新发生的事件数,分母是人的分子是新发生的事件数,分母是人时数(观察人数乘以时间)的总和,时数(观察人数乘以时间)的总和,多用于大人多用于大人群长时间

8、随访的资料群长时间随访的资料。二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标2.2.2.2.速率速率速率速率:第一节第一节 定性变量的分布特征定性变量的分布特征 分类变量的统计描述二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标2.2.2.2.速率速率速率速率:第一节第一节 定性变量的分布特征定性变量的分布特征 分类变量的统计描述例例 在某医院的院内感染调查中,在某医院的院内感染调查中,50315031个病人共个病人共观察了观察了127859127859人日(例均人日(例均25.425.4日),其中有日),其中有596596人在

9、医院发生感染,求人在医院发生感染,求医院感染率。医院感染率。 医院感染率医院感染率医院感染率医院感染率=596/127859=0.0047=596/127859=0.0047=596/127859=0.0047=596/127859=0.0047人人人人/ / / /人日人日人日人日 意味着平均每天有意味着平均每天有意味着平均每天有意味着平均每天有0.47%0.47%0.47%0.47%的病人将在医院获得感染。的病人将在医院获得感染。的病人将在医院获得感染。的病人将在医院获得感染。第一节第一节 定性变量的分布特征定性变量的分布特征 二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标二

10、、常用的相对数指标2.2.2.2.速率速率速率速率:分类变量的统计描述uu上海常住人口出生婴儿性别比约为上海常住人口出生婴儿性别比约为上海常住人口出生婴儿性别比约为上海常住人口出生婴儿性别比约为107107107107:100100100100;uu深圳市出生人口男女性别比例为深圳市出生人口男女性别比例为深圳市出生人口男女性别比例为深圳市出生人口男女性别比例为1201201201208100810081008100;uu北京流动人口在京出生的性别比例高达北京流动人口在京出生的性别比例高达北京流动人口在京出生的性别比例高达北京流动人口在京出生的性别比例高达12810012810012810012

11、8100;uu重庆现在的男女比例为重庆现在的男女比例为重庆现在的男女比例为重庆现在的男女比例为140100140100140100140100,uu海南、广东等省出生的性别比例竟然高达海南、广东等省出生的性别比例竟然高达海南、广东等省出生的性别比例竟然高达海南、广东等省出生的性别比例竟然高达130130130130:100100100100以上;以上;以上;以上;u全国出生人口性别比为全国出生人口性别比为117117。二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标第一节第一节 定性变量的分布特征定性变量的分布特征 3. 3. 比比分类变量的统计描述二、常用的相

12、对数指标二、常用的相对数指标二、常用的相对数指标二、常用的相对数指标最常见最常见最常见最常见: : : : 体质指数(体质指数(体质指数(体质指数(BMIBMIBMIBMI)、男女性别比等)、男女性别比等)、男女性别比等)、男女性别比等相对比相对比=A/B=A/B第一节第一节 定性变量的分布特征定性变量的分布特征 3. 3. 比比比比是指任何两个相关联的变量是指任何两个相关联的变量是指任何两个相关联的变量是指任何两个相关联的变量A A A A与与与与B B B B之比。之比。之比。之比。 A A A A和和和和B B B B可以是绝对数、相对数和平均数,可以是绝对数、相对数和平均数,可以是绝对

13、数、相对数和平均数,可以是绝对数、相对数和平均数,A A A A和和和和B B B B的量纲可以不的量纲可以不的量纲可以不的量纲可以不同,也可相同,但同,也可相同,但同,也可相同,但同,也可相同,但A A A A和和和和B B B B互不包含互不包含互不包含互不包含. . . . 分类变量的统计描述防止概念混淆防止概念混淆计算相对数时分母应有足够数量计算相对数时分母应有足够数量 正确地合并估计频率正确地合并估计频率( (或强度或强度) )型指标型指标 相对数间的比较要具备可比性相对数间的比较要具备可比性: : 观察的对象是否同质,研究的方法(如检测手段、抽观察的对象是否同质,研究的方法(如检测

14、手段、抽样方法)是否相同,观察的时间是否一致等;被比较的总样方法)是否相同,观察的时间是否一致等;被比较的总体是否具有可比性。体是否具有可比性。 对相对数的统计推断对相对数的统计推断 第一节第一节 定性变量的分布特征定性变量的分布特征 应用相对数应注意的事项:应用相对数应注意的事项:应用相对数应注意的事项:应用相对数应注意的事项:二、常用的相对数指标二、常用的相对数指标分类变量的统计描述l例如表例如表3-23-2两种疗法的治愈率比较。两种疗法的治愈率比较。 l一、标准化法的基本思想一、标准化法的基本思想第二节第二节 标准化法及其应用标准化法及其应用 分类变量的统计描述l 要正确比较两厂的合计患

15、病率,必须先要正确比较两厂的合计患病率,必须先将两组工人的将两组工人的工龄构成工龄构成按照按照统一标准统一标准进行校正进行校正,然后计算出校正后的标准化患病率再进行比较。然后计算出校正后的标准化患病率再进行比较。这种用统一的内部构成,然后计算标准化率的这种用统一的内部构成,然后计算标准化率的方法方法,称为称为标准化法标准化法。l一、标准化法的基本思想一、标准化法的基本思想第二节第二节 标准化法及其应用标准化法及其应用 分类变量的统计描述 标准化法的标准化法的基本思想基本思想是:是:采用某影响因采用某影响因素的统一标准构成,对内部构成不同的各人素的统一标准构成,对内部构成不同的各人群率进行调整,

16、以消除人口构成不同对人群群率进行调整,以消除人口构成不同对人群总率的影响,使标准化率具有可比性。总率的影响,使标准化率具有可比性。 l一、标准化法的基本思想一、标准化法的基本思想常用计算方法:常用计算方法:u直接法直接法u间接法间接法第二节第二节 标准化法及其应用标准化法及其应用 分类变量的统计描述l二、标准化率的计算二、标准化率的计算p若已知年龄别死亡率,可采用若已知年龄别死亡率,可采用直接法直接法;根据已有资料的条件,采用不同的方法计算标准化率根据已有资料的条件,采用不同的方法计算标准化率p若只有总死亡数和年龄别人口数而缺乏年龄若只有总死亡数和年龄别人口数而缺乏年龄别死亡率时,或各年龄组人

17、口数较小,年龄别别死亡率时,或各年龄组人口数较小,年龄别死亡率不稳定时,宜用死亡率不稳定时,宜用间接法间接法。如:如:对死亡率的年龄构成标准化对死亡率的年龄构成标准化第二节第二节 标准化法及其应用标准化法及其应用 分类变量的统计描述l1.1.两两组组资资料料中中任任选选一一组组资资料料的的人人口口数数(或或人人口口构构成成)作作为两者的为两者的“共同标准共同标准”。这种方法适用于直接法。这种方法适用于直接法。l2.2.两两组组资资料料各各部部分分人人口口之之和和组组成成的的人人口口数数(或或人人口口构构成成)作为两者的作为两者的“共同标准共同标准”。这种方法适用于直接法。这种方法适用于直接法。

18、l3.3.另外选用一个另外选用一个通用的通用的或或便于比较的标准便于比较的标准作为两者的作为两者的“共同标准共同标准”,如采用全国、全省或全地区的数据作为标,如采用全国、全省或全地区的数据作为标准。准。 u选择标准构成的方法通常有三种:选择标准构成的方法通常有三种:第二节第二节 标准化法及其应用标准化法及其应用 l二、标准化率的计算二、标准化率的计算分类变量的统计描述计算标准化率的步骤:计算标准化率的步骤:计算标准化率的步骤:计算标准化率的步骤:l l1.1.1.1.根根根根据据据据对对对对比比比比资资资资料料料料所所所所具具具具备备备备的的的的条条条条件件件件选选选选用用用用直直直直接接接接

19、法法法法或或或或间间间间接法接法接法接法。l l2.2.2.2.选定标准构成。选定标准构成。选定标准构成。选定标准构成。l l3.3.3.3.选择公式选择公式选择公式选择公式计算标准化率计算标准化率计算标准化率计算标准化率第二节第二节 标准化法及其应用标准化法及其应用 l二、标准化率的计算二、标准化率的计算分类变量的统计描述第二节第二节 标准化法及其应用标准化法及其应用 分类变量的统计描述第二节第二节 标准化法及其应用标准化法及其应用 分类变量的统计描述l2.2.间接标准化法间接标准化法l例例5-6 5-6 经研究表明,女性原发性骨质疏松随年龄增长经研究表明,女性原发性骨质疏松随年龄增长患病率

20、增高。患病率增高。19981998年某省在城市和农村分别抽样调查了年某省在城市和农村分别抽样调查了5050岁以上的老年妇女岁以上的老年妇女776776例和例和789789例,这些人中患有原发例,这些人中患有原发性骨质疏松症者城市为性骨质疏松症者城市为322322例,农村为例,农村为335335例,总患病率例,总患病率分别为分别为41.5%41.5%和和42.5%42.5%。l由于本次调查的城乡老年妇女年龄构成不同,如表由于本次调查的城乡老年妇女年龄构成不同,如表5-75-7第第2 2栏和第栏和第5 5栏,需对两个总患病率进行标准化后方可比栏,需对两个总患病率进行标准化后方可比较。较。 第二节第

21、二节 标准化法及其应用标准化法及其应用 分类变量的统计描述第二节第二节 标准化法及其应用标准化法及其应用 分类变量的统计描述第二节第二节 标准化法及其应用标准化法及其应用 分类变量的统计描述l1.1.标标准准化化法法只只适适用用于于某某因因素素两两组组内内部部构构成成不不同同,并并有有可可能影响两组总率比较的情况。能影响两组总率比较的情况。l2.2.标标准准化化率率已已不不再再反反映映当当地地的的实实际际水水平平,它它只只表表示示相相互互比较的几组资料间的相对水平。比较的几组资料间的相对水平。l3.3.两两样样本本标标准准化化率率为为样样本本值值,若若了了解解两两样样本本标标准准化化率率之之间

22、的差别是否有统计学意义,应进行假设检验。间的差别是否有统计学意义,应进行假设检验。 l三、应用标准化时的注意事项三、应用标准化时的注意事项 第二节第二节 标准化法及其应用标准化法及其应用 分类变量的统计描述表表3-9 3-9 某大学某大学1992-20021992-2002年本科专业招生动态变化年本科专业招生动态变化年份年份(1 1)符号符号(2 2)学生学生人数人数(3 3)绝对增长量绝对增长量发展速度发展速度% %增长速度增长速度% % 累计累计 逐年逐年 (4 4) (5 5) 定基比定基比 环比环比 (6 6) (7 7) 定基比定基比 环比环比 (8 8) (9 9)19921992

23、a a0 042004200- - -100.0100.0100.0100.0- - -19931993a a1 145004500300300300300107.1107.1107.1107.1 7.1 7.17.17.119941994a a2 248004800600600300300114.3114.3106.7106.714.314.36.76.719951995a a3 349004900700700100100116.7116.7102.1102.116.716.72.12.119961996a a4 451505150950950250250122.6122.6105.1105

24、.122.622.65.15.119971997a a5 55320532011201120170170126.7126.7103.3103.326.726.73.33.319981998a a6 6 55105510 1310 1310190190131.2131.2103.6103.631.231.23.63.619981998a a7 757805780 1580 1580270270137.6137.6104.9104.937.637.64.94.920002000a a8 859505950 1750 1750170170141.7141.7102.9102.941.741.72.9

25、2.920012001a a9 960006000 1800 1800 50 50142.9142.9100.8100.842.942.90.80.820022002 a a101062006200 2000 2000200200147.6147.6103.3103.347.647.63.33.3第三节第三节第三节第三节 动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标 分类变量的统计描述第三节第三节第三节第三节 动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标 动态数列动态数列: 一系列按时间顺序排列起来的统计一系列按时间顺序排

26、列起来的统计指标,用以说明事物在时间上的变化和发指标,用以说明事物在时间上的变化和发展趋势。展趋势。u定基比定基比u环比环比分类变量的统计描述第三节第三节第三节第三节 动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标 主要指标主要指标:p一、绝对变化量一、绝对变化量p二、发展速度二、发展速度p三、增长速度三、增长速度p四、平均发展速度与平均增长速度四、平均发展速度与平均增长速度 分类变量的统计描述绝对增长量是说明事物在一定时期增长的绝对值。绝对增长量是说明事物在一定时期增长的绝对值。可分为可分为:累积变化量累积变化量: :即报告年的指标与某一固定年(基期即报告年

27、的指标与某一固定年(基期水平)指标之差,水平)指标之差,逐年变化量逐年变化量: :即报告年的指标与前一年指标之差,即报告年的指标与前一年指标之差, 第三节第三节第三节第三节 动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标 一、绝对变化量:一、绝对变化量:一、绝对变化量:一、绝对变化量:分类变量的统计描述发展速度发展速度: :表示报告期指标的水平相当于基期水平表示报告期指标的水平相当于基期水平的百分之多少或若干倍;的百分之多少或若干倍;第三节第三节第三节第三节 动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标 二、发展速度二、发展

28、速度环比发展速度环比发展速度= = 计算公式:计算公式:计算公式:计算公式:定基发展速度定基发展速度= =分类变量的统计描述增长速度增长速度: :表示的是净增加或减少了多少倍。可计表示的是净增加或减少了多少倍。可计算定基比增长速度与环比增长速度,算定基比增长速度与环比增长速度,第三节第三节第三节第三节 动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标 三、增长速度三、增长速度增长速度增长速度 = = 发展速度发展速度% - 100% - 100% = =发展速度发展速度-1-1。 分类变量的统计描述 是各环比发展速度的几何平均数,说是各环比发展速度的几何平均数,

29、说明某事物在一个较长时期中逐年平均发展明某事物在一个较长时期中逐年平均发展变化的程度。变化的程度。第三节第三节第三节第三节 动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标 四、平均发展速度和平均增长速度四、平均发展速度和平均增长速度四、平均发展速度和平均增长速度四、平均发展速度和平均增长速度计算公式:计算公式:平均发展速度平均发展速度= =平均发展速度平均发展速度= =1.04=104%= =1.04=104%平均增长速度平均增长速度= =平均发展速度平均发展速度-1=1.04-1=4%-1=1.04-1=4% 是各增长变化速度的平均数,说明某是各增长变化速度的平均数,说明某事物在一个较长的时期中逐年平均增长的事物在一个较长的时期中逐年平均增长的程度。程度。 平均发展速度平均发展速度平均发展速度平均发展速度: : : : 平均增长速度平均增长速度平均增长速度平均增长速度: : : : 分类变量的统计描述第三节第三节第三节第三节 动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标动态数列及其分析指标 主要指标主要指标:p一、绝对增长量一、绝对增长量p二、发展速度二、发展速度p三、增长速度三、增长速度p四、平均发展速度与平均增长速度四、平均发展速度与平均增长速度 分类变量的统计描述分类变量的统计描述

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号