03 定性变量的统计描述

上传人:飞****9 文档编号:130023374 上传时间:2020-04-24 格式:PPT 页数:116 大小:5.28MB
返回 下载 相关 举报
03 定性变量的统计描述_第1页
第1页 / 共116页
03 定性变量的统计描述_第2页
第2页 / 共116页
03 定性变量的统计描述_第3页
第3页 / 共116页
03 定性变量的统计描述_第4页
第4页 / 共116页
03 定性变量的统计描述_第5页
第5页 / 共116页
点击查看更多>>
资源描述

《03 定性变量的统计描述》由会员分享,可在线阅读,更多相关《03 定性变量的统计描述(116页珍藏版)》请在金锄头文库上搜索。

1、第三章 定性变量的统计描述 引子 两分类 多分类 举例 某年甲乙两地发生麻疹流行 甲地发病人数为 人 乙地发病人数为 人 甲地发病人数比乙地多 人 能否据此认为甲地麻疹发病比乙地严重呢 目的 比较甲 乙两地麻疹的发病情况 问题1 甲地麻疹发病比乙地严重吗 问题2 该怎样表示两地麻疹发病强度 往往先统计具有某种属性的个体数 进而用相对数来描述和比较这类变量 相对数 Relativenumber 的概念 是两个具有内在联系的指标之比 包括 频率 FrequencyorProportion 强度 Intensity 相对比 Relativeratio 第一节定性变量频率分布 定性资料 频率分布表 图

2、特点 能描述一个全面的分布特征 即把所有各种可能性的特征都给描述出来 相对数指标特点 从某个侧面来描述定性变量 尽管不一定能全面的描写某分布 但有助于统计描述和推断 相对数指标 频率分布表 图 分布特征 频率型指标 强度型指标 相对比指标 一 多分类变量的频率分布 表3 1某课题组为了解城乡居民慢性病的患病情况 于2010年对某地区城乡25个社区的居民进行了调查 课题组对资料进行了整理 将1381例被访者和284例慢性病患者按职业分组制成频数表见表3 1 表3 12010年某地区被访者和慢性病患者按职业分组的频率分布 图3 12010年某地区调查的被访者和慢性病患者的职业分布 图3 22010

3、年某地区慢性病患者的职业分布 二 二分类变量的频率分布 患慢性病的频率占 284 181 20 6 不患病的频率占 1 20 6 79 4 2 所以对这样一个二项分类来说 用一个20 6 就能描述整个资料的频率分布 表3 22010年某地区1381例被访者是否慢性病患者的频率分布 二分类资料 对1381名被访者中 农民患病的频率占19 8 不患病的占80 2 表3 32010年某地区1381例被访者按职业分组的慢性病患病率 图3 32010年某地区1381例被访者不同职业的慢性病的患病率 患病率 表3 42010年某地区1381例被访者按职业和性别分组的慢性病患病率 图3 4某地区1381例被

4、访者按职业和性别分组的慢性病患病率 第二节常用相对数指标 一 频率型指标 Frequency 指某现象发生的频率 或表示事物内部某个组成成分所占的比重或分布 频率的特征 分子是分母的一部分 无量纲 在0 1之间取值 计算公式 甲地30000人 二 强度 intensity 强度是流行病学 统计学术语 指单位时间内某现象发生的频率 分母含有时间 指单位时间内的频率 其统计学本质为频率强度 即概率强度的近似值 计算公式 特点 人时 人 观察时间 年 月 举例 10个人观察1年 单位 人年 10人年 1个人观察10年 有3个人 第1个人观察10年第2个人观察5年第3个人观察1年 16人年 相当于16

5、个人观察了1年 观察人时的总和 单位时间 折合的观察人数 1个人观察1年 1人年 单位时间内新发生的概率 式中的K为比例基数 可以为100 1000 10000 万 100000 10万等 例3 2某企业2003年有2839名职工 该企业每年都对职工进行体检 这一年新发生高血压病人5例 试求2003年的高血压发病率 答 即 2003年的高血压发病率为1 76人 1000人年 据此推测2003年观察人群发生高血压的概率是1 76 举例 在某医院院内感染调查中 5031个病人共观察了127859人日 人均25 4日 也相当于127859人各观察1日 其中有596人在医院发生感染 试求其院内感染率

6、答 即每天医院内发生院内感染的频率是0 47人 100人日 据此推测平均每天100人中有0 47个患者将在医院内发生感染 三 相对比 relativeratio 是两个有关联的指标A与B 实际应用中简称比 ratio 说明二者的对比水平 计算公式 意义 表示相对于B的一个单位 A有多少个单位 或A为B的若干倍或百分之几 1 A和B是绝对数 也可是相对数 平均数 2 A和B可是同性质的指标 也可是不同性质的指标 即其量纲可以相同 也可以不同 3 但A和B应互不包含 人口调查中使用的男女性别比例比 某病年龄组发病率之比 甲乙两地亩产量之比医院管理中 医护人员与病床数 之比 注意 举例 举例 某市1

7、977 1979年肺癌死亡率城区为19 39 10万 郊区为9 99 10万 比较二者的严重程度 答 即城区肺癌死亡率为郊区的1 94倍 R 19 39 9 99 1 94 四 应用相对数时应注意的问题 一 不可望文生义 不少指标命名混乱 某某率满天飞 有的某某率实际上只是相对比 更多的指标笼统的称为 率 但分不清究竟是频率 还是强度 二 频率型指标的解释要紧扣总体与属性 表3 12010年某地区被访者和慢性病患者按职业分组的频率分布 表3 22010年某地区1381例被访者是否慢性病患者的频率分布 表3 32010年某地区1381例被访者按职业分组的慢性病患病率 三 计算相对数的分母应有足够

8、数量 例一 甲医院治疗100例患者 其中40例有效 甲医院有效率是40 例二 乙医院治疗5例患者 其中2例有效 乙医院有效是2 5 其疗效有待于进步观察 故资料总例数过少 则计算所得相对数的偏差会比较大 这种情况下直接报告原始数据更为可取 四 正确的合并估计频率 举例 甲医院治疗患者100例 40例有效 乙医院治疗同类患者90例 30例有效 计算两院的总有效率 答 分别计算甲 乙两院的有效率 相加后除2 五 相对数间的比较要具有可比性 观察对象 研究方法 检验手段 抽样方法 观察时间等 观察对象的内部构成 非同期资料对比时应注意客观条件的变化 注意以下几个方面 六 对样本相对数的统计推断 统计

9、学研究特点 抽样研究 研究的是样本 目的对总体作出推断 得到的是频率 要对概率作出推断 第三节医学人口统计常用指标 医学人口统计 是从卫生保健的角度研究和描述人口数量 分布 结构 变动及其规律 研究人口与卫生事业发展的关系 是卫生统计学的重要组成部分 一 医学人口统计资料的来源 一 人口普查资料人口普查 census 是收集 整理和分析一个国家或一定地区在某一特定时间的人口 经济和社会资料的全过程 人口普查提供了最基本的人口数据和社会经济方面的资料 二 人口抽样调查资料人口抽样调查则相对省力 可以多次进行 也可以一次调查较多的项目根据样本所具有的数量特征还可推论总体的相应特征 三 人口登记资料

10、人口登记是指人口事件发生后随即进行登记 生命事件登记简称生命登记 联合国将其定义为 生命事件登记是对生命事件 包括出生 死亡等 的法定登记 记录和报告生命事件的发生 收集 整理和分析生命事件的有关资料人口迁移变动登记是对所发生的人口迁出或迁入事件进行记录 包括迁入或迁出的时间 地点 原因及个人的基本情况等 户口登记是按人或按户建立每个人一生 从出生到死亡 中一切人口事件的记录 包括姓名 性别等基本情况 此外还设有因出生 死亡 迁移及常住人口婚姻状况变动 分居 合居 失踪 寻回 收养 认领等引起户口变动方面的登记 二 描述人口学特征的常用指标 一 人口总数人口总数 populationsize

11、一般指一个国家或地区在某一特定时间的人口数 按惯例 一般采用一年的中点 即7月1日零时为标准时刻来进行统计当人口数在一年中是均匀变动时 可用相邻两年年末 12月31日 人口数的平均值计算年平均人口数 也可用年中 7月1日零时 人口数代表全年的平均人口数 二 人口学特征指标人口学的基本特征包括年龄 性别 文化 职业等 其中最常用来描述人口构成情况的是性别和年龄 老年 人口 系数指老年人口在总人口中所占比重 是说明人口年老程度的指标 可作为划分人口类型的尺度一般把65岁及以上的人口称为老年人口 少年儿童 人口 系数指14岁及以下少年儿童在总人口中所占比重 负担系数 dependencyratio

12、又称抚养比或抚养系数 是指人口中非劳动年龄人数与劳动年龄人数之比 老少比 指65岁及以上的老年人口与14岁及以下的少年儿童人口之比 表示每100名少年儿童对应多少老年人 是划分人口类型的标准之一 性别比 sexratio 指男性人口与女性人口的比值 表3 5人口学特征指标 三 有关生育的常用统计指标 有关生育的常用统计指标生育与计划生育统计资料的来源公安 卫生 民政和计划生育等部门 反映生育水平的统计指标粗出生率 crudebirthrate CBR 指某地某年的活产率总生育率 generalfertilityrate GFR 指某地某年平均每千名育龄妇女的活产数 年龄组生育率 age spe

13、cificfertilityrate ASFR 又称年龄别生育率 消除了育龄妇女内部年龄构成不同对生育水平的影响 终生生育率 life timefertilityrate LTFR 测量人口再生育的统计指标自然增长率 naturalincreaserate NIR 是粗出生率 CBR 与粗死亡率 CDR 之差 即NIR CBR CDR 粗再生育率 grossreproductionrate GRR 是只计算女婴的总和生育率 净再生育率 netreproductionrate NRR 确切能替代母亲一代执行生育职能的比例 表3 6生育与计划生育统计指标 反映计划生育工作情况的统计指标避孕现用率

14、contraceptiveprevalence 指育龄妇女中 已经采用避孕措施的频率 人工流产率 induceabortionrate 指某年内育龄妇女中人工流产的强度 计划生育率表示活产中符合计划生育要求的频率 它综合说明计划生育的质量 二 人口死亡统计指标我国人口死亡资料主要由公安部门负责收集 死因要严格按照国际疾病和有关健康问题的国际统计分类第十版 Internationalclassificationofdiseases ICD 10 中的死因分类填写 常用人口死亡统计指标测量死亡水平的指标 粗死亡率 crudedeathrate CDR 或称为死亡率 mortalityrate 指某

15、地某年平均每千人口中的死亡数 它反映居民总的死亡水平 表3 7人口死亡统计指标 婴儿死亡率 infantmortalityrate IMR 指某年活产儿中不满1周岁 婴儿 的死亡频率 新生儿死亡率 neonatalmortalityrate NMR 指某地某年活产儿中未满28天的新生儿死亡频率 新生儿后期死亡率 post neonatalmortalityrate PNMR 指某地某年活产儿中满28天但未满1岁的新生儿死亡频率 围生儿死亡率 perinatalmortality 5岁以下儿童死亡率 childmortalityunderage5 孕产妇死亡率 maternalmortality

16、rate 死因别死亡率 cause specificdeathrate CSDR 某病病死率 casefatalityrate CFR 反映死因构成及死因顺位的指标比例死亡比 proportionatemortalityrate PMR 也称为死因构成或相对死亡比 proportionofdyingofaspecificcause 指全部死亡人数中 死于某死因者所占的百分比 说明各种死因的相对重要性 死因顺位是指按各类死因构成比的大小由高到低排列的位次 说明各类死因的相对重要性 第四节疾病统计常用指标 疾病统计资料的来源 疾病报告和报表资料医疗卫生工作记录疾病专题调查资料 一 疾病和死因分类疾病的命名 nomenclatureofdiseases 为了深入认识疾病 有必要将各种不同的疾病加以命名和分类 就是要对每一种法定疾病情况给以确切的名称 疾病分类 classificationofdiseases 是在疾病命名法的基础上 考虑到对疾病的认识及防治需要 将一些具有共同特性的疾病归纳在一起 加以分类 现在国际上使用的是ICD的第十次修订本 简称ICD 10 二 疾病统计指标发病率 in

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号