第三章 常用卫生统计学方法

上传人:sh****na 文档编号:134571861 上传时间:2020-06-06 格式:PPT 页数:87 大小:1.99MB
返回 下载 相关 举报
第三章 常用卫生统计学方法_第1页
第1页 / 共87页
第三章 常用卫生统计学方法_第2页
第2页 / 共87页
第三章 常用卫生统计学方法_第3页
第3页 / 共87页
第三章 常用卫生统计学方法_第4页
第4页 / 共87页
第三章 常用卫生统计学方法_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《第三章 常用卫生统计学方法》由会员分享,可在线阅读,更多相关《第三章 常用卫生统计学方法(87页珍藏版)》请在金锄头文库上搜索。

1、01 卫生统计学概述 2020 6 6 CONTENTS 2020 6 6 变量值 观察值 定性 定量 一 卫生统计学的基本概念 变量 对每个观察单位的某项特征进行测定和观察 这种观察单位的特征称为变量 2020 6 6 01 计量资料 用度量衡的方法测量每个观察单位的某项研究指标量的大小 所得的数据称为数值变量 02 计数资料 将全体观察单位按某种性质或类别进行分组 然后清点各组中的例数 这样得到的数据称为计数资料 亦称为分类变量 03 等级资料 将全体观察单位按某种性质的不同程度分为若干组 分别清点各组中的例数 这种数据资料称为等级资料 统计资料 一 卫生统计学的基本概念 描述计量资料常用

2、统计方法 平均数 标准差等 统计分析方法 u检验 t检验 方差分析等 计数资料常用统计指标 率 构成比等 统计分析方法 u检验 2检验等 计数资料常用统计指标 率 构成比等 统计分析方法 秩和检验 2检验等 2020 6 6 是从总体中随机抽取有代表性的一部分观察单位 用样本信息去推断总体特征 样本 根据研究目的确定的同质的观察单位的某个变量值的全体 总体 一 卫生统计学的基本概念 2020 6 6 特点 不可避免 但可控制在一定范围 即使消除了系统误差 控制了随机测量误差 样本统计量和总体参数之间仍存在差别 这种由随机抽样引起的样本指标与总体指标的差异 由于某种必然因素所致 具有一定的方向性

3、 偶然机遇所致 无方向性 对同一样品多次测定 结果有高有低 抽样误差 系统误差 误差 2020 6 6 一 卫生统计学的基本概念 特点 不是偶然造成 观察结果一贯性的偏高或偏低 避免方法 1 通过周密的研究设计2 调查或测量过程中的质量控制 随机测量误差 特点 由于个体变异造成 抽样机遇所致 客观存在 不可避免 但可估计大小 也可增加样本含量使其减小 是指一次试验结果计算得到的样本率 频率 样本 描述随机事件发生的可能性大小的数值 事件A的概率记为P A 随机事件的概率P取值在0 1之间 概率 总体 一 卫生统计学的基本概念 02 计量资料的统计描述 2020 6 6 一 集中趋势 Centr

4、altendency 的描述 平均数 average 常用于描述一组变量值的集中趋势 是反映同质资料的平均水平或集中位置的特征值 2020 6 6 应用对称分布资料 尤其是正态分布资料 2020 6 6 常用平均数2 几何均数 geometricmean 表示符号 G 应用对数正态分布资料 变量值呈倍数关系 2020 6 6 常用平均数3 中位数 median 表示符号 M 2020 6 6 二 离散趋势 tendencyofdispersion 描述变量值的离散趋势用变异指标 全距常用变异指标四分位数间距方差和标准差变异系数 2020 6 6 常用变异指标1 全距 range 简记为R R

5、最大值 最小值 反映变量值的变异范围 各种类型资料都可应用 但只作参考资料 2020 6 6 2020 6 6 2020 6 6 标准差用途 1 表示同质变量值的离散程度 2 在多组资料均数相近 度量单位相同的条件下表示观察值的变异度大小 3 与均数结合描述正态分布的特征和估计医学参考值范围 4 与样本含量 n 结合 计算标准误 2020 6 6 用途 1 比较多组单位不同资料的变异度2 比较多组均数相差较大资料的变度 常用变异指标3 变异系数 coefficientofvariation 简记为CV 定义CV s X 100 2020 6 6 三 正态分布和参考值范围的估计 正态分布的概念和

6、特征 正态分布是以均数为中心呈对称的钟型分布 频数 人数 125129133137141145149153157161身高 cm f 120名12岁健康男孩身高的频数分布 Normaldistributioncurve 2020 6 6 正态分布的特征有 1 正态分布曲线在均数处最高2 正态分布以均数为中心 左右对称且逐渐减少3 正态分布曲线的两个参数 和 记作N 2 4 正态曲线在 1 处各有一个拐点 2020 6 6 正态曲线下的面积分布规律 1 占正态曲线下面积的68 27 1 96 占正态曲线下面积的95 00 2 58 占正态曲线下面积的99 00 若n 100 则 可用X代替 用s

7、代替 2 58 1 96 1 1 1 96 2 58 2 5 0 5 2020 6 6 正态分布的应用估计变量值的频数分布制定医学临床参考值 常用U值表 正常值范围双侧单侧 90 1 6451 28295 1 9601 64599 2 5762 326 95 双侧参考值 1 96 S99 双侧参考值 2 58 S95 单侧参考值 1 64 S 1 64 S 2020 6 6 3 百分位数法 用于偏态分布资料双侧参考值 0 05 P2 5 P97 5单侧参考值 0 05 P5或 P95 2020 6 6 03 计量资料的统计推断 2020 6 6 一 均数的抽样误差和标准误 一 均数的抽样误差

8、概念 由于抽样造成的样本均数与总体均数的差异或各样本均数之差异 表示方法 标准误 Standarderror 标准误为样本均数的标准差 是说明样本均数抽样误差的大小的指标 反映了样本均数与总体均数的差异 2020 6 6 2020 6 6 2020 6 6 特征以0为中心 左右对称t 分布曲线的形状与自由度有关 4 3 2 10 1 2 3 4 f t u d 5 1 自由度分别为1 5 的t 分布 2020 6 6 二 总体均数可信区间的估计 点估计 pointestimation 用样本均数作为总体均数的估计值 区间估计 intervalestimation 按一定的概率估计总体均数所在范

9、围 亦称总体均数的可信区间 2020 6 6 总体均数区间估计的方法 当n足够大 如100 时 X的平均数 接近正态分布总体均数95 可信区间 1 96 s 总体均数99 可信区间 2 58 s 2020 6 6 总体均数区间估计的方法 2 当样本含量n较小时 X的平均数 接近t 分布总体均数95 可信区间 t0 05 s 总体均数99 可信区间 t0 01 s 2020 6 6 三 假设检验的基本原理概念 假设检验是用来判断样本统计量与总体参数的差异是由抽样误差引起 还是本质差异造成的统计推断方法 一 假设检验的基本思想小概率事件不可能原理 小概率事件在一次试验中基本不可能发生 反证法思想

10、先对总体的参数或分布作出某种假设 再用适当的统计方法确定假设成立的可能性大小 推断此假设成立或不成立 2020 6 6 抽样误差所致P 0 05 来自同一总体 假设检验回答环境条件影响P 0 05 来自不同总体 两均数不等 2020 6 6 二 假设检验的基本步骤1 建立检验假设 确定检验水准H0 无效假设 假设两组或多组资料的总体均数相等 0或 1 2 3H1 备择假设 0 双侧检验 0或 0 单侧检验 检验水准 通常取 0 05 2020 6 6 2 选定检验方法 计算检验统计量根据资料类型及统计推断的目的选用合适的检验方法计算出统计量 t值 u值 2值等 3 确定P值 作出推断结论根据自

11、由度 查不同统计量的界值表 t值表 2值表等 确定现有统计量的概率P值 2020 6 6 确定P值 当 t0 05 差异无统计学意义 t0 01 t t0 05 0 01 按所取检验水准不拒绝H0P 按所取检验水准拒绝H0 2020 6 6 三 假设检验时应注意的问题保证比较的样本间有较好的均衡性和可比性 选用的假设检验方法应符合其应用条件 正确理解差别有无显著性的统计意义 结论不能绝对化 报告结论时应列出统计量值 注明单侧或双侧检验 写出P值的确切范围 2020 6 6 2020 6 6 例1 根据大量调查 已知健康成年男子脉搏数为72次 分 某医生在山区随机抽查25名健康成年男子 求得其脉

12、搏均数为74 2次 分 标准差为6 5次 分 能否据此认为山区成年男子的脉搏数高于一般 2020 6 6 1 H0 0 H1 0 0 05 2 074 2 72t 1 692S 6 5 3 自由度 n 1 25 1 24 查t值表 单侧 得t0 05 24 1 711 t 1 6920 054 在 0 05水准上 接受H0 不能认为该山区成年男子的脉搏数高于一般 2020 6 6 2020 6 6 n为对子数 2020 6 6 x1 x2t n1 1 s12 n2 1 s2211 n1 n2 2n1n2 2020 6 6 2020 6 6 04 分类资料的统计描述 2020 6 6 一 常用相

13、对数相对数 计数资料常用的统计指标 又称相对指标 Relationnumber 2020 6 6 常用相对数 一 率 Rate 频率指标 表示某现象发生的频率和强度 计算公式 实际发生某现象的观察数率 K可能发生某现象的观察单位总数 K为比例基数 可为100 或1000 等 2020 6 6 二 构成比 Constituentratio 又称构成指标 表示某一事物内部各组成部分所占的比重或分布 计算公式 某一事物各组成部分的个体数构成比 100 同一事物各组成部分的个体总数 2020 6 6 三 相对比 Relativeratio 表示两个有联系的指标 绝对数 相对数或平均数 之比 说明对比水

14、平 计算公式 A指标相对比 或 100 B指标1 对比指标 两个有关同类指标之比 如两地肿瘤死亡比2 关系指标 两个有关非同类指标之比 如每千人病床数 2020 6 6 二 应用相对数应注意的问题 1 不要把构成比当作率分析 最容易混淆 年龄组 岁 人口数癌肿病人数构成比 患病率 30633000191 33 030 57000017111 430 040 37400048632 6129 950 14300057438 5401 460 3025024216 2800 0 合计17502501492100 085 2 2020 6 6 二 应用相对数应注意的问题 2 计算相对数的分母不宜太小

15、 治疗数有效数总体率95 可信区间 211 99 427 93 502536 65 50025045 54 5000250049 51 可见 当n足够大时 相对数才稳定 2020 6 6 二 应用相对数应注意的问题 3 率或构成比的比较应注意可比性1 研究对象是否同质 方法 时间 种族 地区 环境等 2 其它影响因素 年龄 性别 在各组的内部构成是否相同3 同地区不同时期资料对比时 应注意客观条件是否一致4 对观察单位数不等的几个率不能直接相加求其平均率5 对样本率 或构成比 的比较应作假设检验 2020 6 6 三 率的标准化法 一 标准化法的意义和基本思想意义 在比较率时 如果比较的两组资

16、料其内部构成不同 且影响到比较结果 就不能直接进行比较 需要进行标准化处理后 消除由于内部构成不同对结果造成的影响 才能进行比较 标准化法 就是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法 标准化率 采用统一的标准调整后计算的率 2020 6 6 二 标准化方法选择 根据已知资料类型 直接法 已有被观察人群中各组的率资料 间接法 仅有各组的观察单位数和总率 没有各组率的资料 三 标准选择1 选择一个有代表性的 内部构成相对稳定的较大人群为标准 2 将比较的两组资料各对应组观察数合并作为标准 3 在比较的两组中任选一组内部构成做标准 2020 6 6 四 标化率的计算 直接法 例1998年某社区甲乙两企业高血压患病率 的普查结果甲企业乙企业年龄人口数构成比患病人数患病率人口数构成比患病人数患病率 1 2 3 4 5 6 7 8 9 30 93537 99101 168034 6440 640 84934 508610 140520 63297 250 42017 0714133 633316 969127 360 1506 109865 329214 8815854 170

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号