卫生统计学-重点整理资料东大文档推荐

上传人:粗**** 文档编号:135279806 上传时间:2020-06-14 格式:PDF 页数:13 大小:96.21KB
返回 下载 相关 举报
卫生统计学-重点整理资料东大文档推荐_第1页
第1页 / 共13页
卫生统计学-重点整理资料东大文档推荐_第2页
第2页 / 共13页
卫生统计学-重点整理资料东大文档推荐_第3页
第3页 / 共13页
卫生统计学-重点整理资料东大文档推荐_第4页
第4页 / 共13页
卫生统计学-重点整理资料东大文档推荐_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《卫生统计学-重点整理资料东大文档推荐》由会员分享,可在线阅读,更多相关《卫生统计学-重点整理资料东大文档推荐(13页珍藏版)》请在金锄头文库上搜索。

1、卫生统计学 绪论 卫生统计学的概念 P1 卫生统计学是应用概率论和数理统计学的基本原理和方法 研究居民卫生状况 以及卫生服务领域中数据的收集 整理和分析的一门科学 是卫生及其相关领 域研究中不可缺少的分析问题 卫生统计学的 4 个基本步骤 P3 设计 收集资料 整理资料 分析资料 卫生统计学的几个基本概念 P4 同质 在统计学中 若某些观察对象具有相同的特征或属性 我们就称 之为同质 或具有同质性 变异 同质个体的某项特征或属性的观察值或测量值之间的差异 总体 同质的所有观察单位某种特征或属性的观察值或测量值的集合 样本 从总体中随机抽取的具有代表性的部分观察单位的集合 样本中 包含的观察单位

2、个数成为样本含量 参数 反映总体特征的指标 一般是未知的 常用希腊字母表示 如总 体均数 总体率 等 统计量 根据样本观察值计算出来的指标 常用拉丁字母表示 如样本 均数x 样本率等 变量与资料 对每个观察单位进行观察或测量的某项特征或属性称为变 量 变量值的集合成为资料 定量资料 亦称计量资料 其变量值是定量的 表现为数值大小 一般 有度 量 衡单位 定性资料 亦称分类资料 其观察值是定性的 表现为互不相容的类别 或属性 一般无度 量 衡单位 可细分为 计数资料 等级资料 调查研究设计 1 调查研究的特点 P7 不能人为施加干预措施 不能随机分组 很难控制干扰因素 一般不能下因果结论 2 常

3、用抽样方法 名称 原理 单纯随机抽样 先将调查总体的全部观察单位统一编号 然后采用随机数字 表 统计软件或抽签方法之一随机抽取n 样本大小 个编号 由这n 个编号 所对应的 n 个观察单位构成研究样本 系统抽样 又称机械抽样或等距抽样 事先将总体内全部观察单位按某一顺 序号等距分成n 样本大小 个部分 每一部分内含m 个观察单位 然后从第 一部分开始 从中随机抽出第i 号观察单位 依此用相等间隔m 机械地在第 2 部分 第 3 部分直至第 n 部分内各抽出一个观察单位组成样本 分层抽样 先按对观察指标影响较大的某项或某几项特征 将总体分成若干 层 该特征的测定值在层内变异较小 层间变异较大 然

4、后分别从每一层内随 机抽取一定数量的观察单位结合起来组成样本 整群抽样 将总体划分为群 初级观察单位 各群由次级观察单位组成 随机抽取一部分群 调查抽中群的全部次级观察单位 实验设计 1 实验设计的特点 注意与调查研究的特点的区别 研究者可人为设置处理因素 受试对象接受何种处理因素或处理因素的何种水平是随机的 2 实验设计的三要素 四原则 基本要素 处理因素 受试对象 实验效应 基本原则 对照原则 随机原则 重复原则 均衡原则 实验设计的基本步骤 明确实验目的 确定研究对象 确定可比的实验组和对照组 确定把受试对象分配到各处理组中的原则 确定样本含量 确定方法和指标 偏倚及其控制 5 常用的实

5、验设计方案 主要掌握完全随机设计和配对设计 定量资料的统计描述 1 频数表的编制 求极差 确定组数和组距 一般8 15 组 确定组段 上限 下限 组距 归组计数 整理成表 2 频数表的用途 揭示资料的频数分布特征和频数分布类型 频数分布的特征 集中趋势和离散趋势 频数分布的类型 对称分布和偏态分布 高峰位置偏向数值小的一侧 正 右偏态分布 高峰位置偏向数值大的一侧 负 左偏态分布 便于发现某些特大或特小的可疑值 便于进一步计算指标和统计处理 3 连续型的定量资料 其频数图中各长方形是相连的 又称直方图 离散型的 定量资料 其频数图是非连续的 其频数图中各长方形是又间隔的 称直条 图 4 定量资

6、料集中趋势的描述 常用平均数 表达一组同质定量数据的平均水 平或集中位置 结合书本的例题加深理解 算术均数 适用于对称分布特别是正态分布资料 几何均数 适用于 对数正态分布 等比级数资料 观察值中不能有0 中位数 是一种位置平均数 适用于偏态分布资料 一端或两端无确切值 总 体分布不明的资料 百分位数 一组数据某一百分位置的水平 确定非正态分布资料的医学参考值 范围 平均数意义应用场合 均数平均数量水平对称分布 尤其正态分布 几何均数平均增减倍数等比 对数正态分布 中位数位次居中的观察值水平偏态 分布不明确 分布末端无确 定值 5 离散趋势是频数分布的另一特征 反映了观察值之间的变异情况 6

7、正态分布的特征 正态曲线在横轴上方均数处最高 并以均数为中心 左右对称 两端与横轴永 不相交 呈钟形的曲线 正态分布有两个参数 即位置参数 和形状参数 固定不变时 越大 曲线沿横轴越向右移动 固定不变时 越大 曲线越平阔 正态曲线下面积的分布有一定的规律 正态曲线与横轴之间的面积恒等于1 或 100 对称分布 对称轴两侧的面积各为50 在 区间的面积为 在 区间的面积为 在 区间的面积为 7 医学参考值范围 正态分布法 适用于正态或近似正态分布的资料 双侧界值 单侧界值 参考值范围 单侧双侧 80 90 离散趋势指标意义应用 极差 四分位数间距 方差和标准差 变异系数 反映一组数据的变异范围

8、反映全部观察值居中一半的范围 反映全部观察值之间的变异程度 标准差相对于均数的大小 资料不限 资料不限 适用于对称分布 尤正态 适用于单位不同或均数 差别较大的变量之间的 比较 2 xzS xz Sxz S 常用 z 值表 百分位数法 偏态分布资料以及资料中一端或两端无确切数值 双侧界值 单侧界值 上界为 P95 下界为 P5 定性资料的统计描述 1 常用相对数 率是指某现象 实际发生数 与可能发生某现象总数 之比 用以说明某现象发 生的频率或强度 常以百分率 千分率 万分率 十万分率等表示 构成比 是事物内部 某一观察单位数 与事物内部各组成部分观察单位的总数 之比 说明事物内部各部分所占的

9、比重 常以百分数表示 相对比 是两个有关的指标之比 用以描述两者的对比水平 两个指标可以 是绝对数 相对数或平均数 可以性质相同 也可以性质不同 2 应用相对数注意的事项 计算相对数分母不宜过小 不能以构成比代替率 率反映事物发生的频率 构成比表示事物内部各组分 所占的比重 二者性质不同 各个组成部分的构成比之和应为100 事物内 部各组成部分之间呈此消彼长的关系 计算合计率时 不能简单地相加求平均 率的比较时应注意可比性 3 标准化法是在一个指定的标准构成条件下进行率的对比的方法 意义 用统 一的 标准 消除资料由于内部构成不同而对所比较的总率产生的影响 标准 化法的基本思想 确定一个标准的

10、人口年龄构成 男 女人口都按该标准的人 口年龄构成 计算年龄别发病情况 最后计算出男 女的合计发病率 4 应用标准化法应注意的问题 标准化率便于比较 但不能反映实际水平 比较几个标准化率时 应在采用同一标准标化的情况下进行 若各组间的率出现明显交叉时 不宜采用标准化法比较 可直接比较各组的 率 两样本标化率的比较应作假设检验 第六章 总体均数和总体率的估计 1 抽样误差 由抽样引起的样本统计量与总体参数间的差异称抽样误差 不可 避免 可以控制 表现 样本统计量与总体参数之间的差异样本统计量之间的 差异 产生原因 个体变异 抽样 95 99 2 标准误 样本统计量的标准差称为标准误 样本均数的标

11、准差称为均数的标 准误 均数的标准误表示样本均数的变异度 总体标准差未知时 用样本标准差代替 3 标准差与标准误的区别 标准差表示个体差异的大小 标准误描述样本均数的变异程度 说明抽样 误差的大小 标准差描述资料的频数分布状况 可用于制定医学参考值范围 而标准误 用于总体均数的区间估计和假设检验 4 t 分布的特征 以 0 为中心 左右对称 自由度 越小 t 值越分散 曲线越平阔 尾部越高 当 趋于 时 t 分布逼近标准正态分布 t 分布曲线下面积为1 5 从界值表可看出 1 自由度 相同时 t 界值越大其对应的P值越小 2 概率 P 或尾部面积 相等时 越大 t 界值越小 3 t 值相等时

12、双侧概率为单侧概率的两倍 4 时 t 界值即为 z 界值 6 总体均数可信区间的计算 z 分布法 当 已知 服从标准正态分布 则总体均数的双测 可信区间为 未知但 n 足够大 n 50 t 分布法 当 未知 n 较小 7 常用单双侧 u 值 单侧双侧 8 可信区间的涵义 从总体中作随机抽样 每个样本可以算得一个可信区间 如 95 可信区间意味着做100 次抽样 算得 100 个可信区间 平均有95 个估计 正确 n X n S SX x z n 0 1 N 22 xx xzxz 22 xx xzSxzS 2 2 xx xtSxtS 可信区间的两个要素 一是准确度 反映在可信度的大小 二是精密度

13、 反映在区间的长度 假设检验 1 假设检验的基本思想 应用反证法和小概率原理 先对总体的参数或分 布作出某种假设 再用适当的方法根据样本对总体提供的信息 推断此假设应 当拒绝或不拒绝 2 假设检验的基本步骤 建立检验假设 确定检验水准 选定检验方法和计算检验统计量 确定 P 值 作出推断结论 3 型错误与 型错误 型错误 拒绝了实际上成立的 犯 弃真 的错误 其概率大小用表 示 可取单侧亦可取双侧 型错误 不拒绝了实际上不成立的H0 犯 存伪 的错误 其概率大小用 表示 只取单侧 其大小一般未知 只有在已知两总体差值 及 n 时 才能估算出来 推断结论与两类错误 注 当样本含量固定时 增大 减

14、小 反之亦然 若欲同时减小 与 则只有增加样本含量 若重点减小 型错误 可取小一些 如 若重点减小 型错误 可取大一些 如 或 4 检验效能 若两总体确有差别 按照 水准能够发现这种差别的能力 它的大小用 1 表示 检验效能的影响因素 容许误差 总体标准差 型错误 样本含量 n 5 假设检验应注意的事项 应有严密的研究设计 总体中的每个研究个体应具有同质性 样本的获取必须 遵循随机化原则 比较的组间应具有可比性 正确理解 水准和P值的意义 是人为预先设定的一个概率值 可有多个 P 是假定成立 得到实际观测数据的可能性的大小 一个样本按某一方法只能 得出一个 正确理解结论的统计学意义 实际情况检

15、验结果 拒绝 H 0 不拒绝 H 0 成立第一类错误 结论正确 1 不成立结论正确 1 第二类错误 0H 假设检验的结论不能绝对化 t 检验 1 t 检验的适用条件 未知 n 较小 n40 且所有 T5 时 基本公式为 专用公式为 当 n40 但有 1T 5 时 校正的基本公式为 校正的基本公式为 当 n 40或 T 1时 采用四格表确切概率法 配对四格表资料 2 检验的计算公式 当 b c 40 时 2 计算公式为 当 b c50mg 4 Wilcoxon 符号秩和检验 编秩 按照差值的绝对值从小到大编秩 差值为 0 者不参加编秩 绝对值相等 符号相同时顺次编秩 绝对值相等 符号相反时取平均

16、秩次 5 两样本比较的秩和检验 编秩原则 将两组数据混合起来从小到大统一编秩 数值相等且组别相同时顺次编秩 数值相等但组别不同时取平均秩次 第十二章双变量关联性分析 1 直线相关 又称简单相关 是用来描述具有直线关系的两变量x y 的相 互关系的统计方法 要求两变量均来自于双变量正态总体的随机变量 相关系数 r 没有单位 取值介于 1 与 1 之间 r 0 表示正相关 r 0 表示负 相关 r 0 表示零相关 r 时 两变量有高度相关关系 r 时 两变量有中度相关关系 r 时 两变量有低度相关关系 r 1 表示完全相关 r 0 表示无直线相关 但不一定没有关联性 2 等级相关应用范围 1 不服从双变量正态分布的资料 2 总体分布类型未知的资料 3 等级资料 第十三章直线回归分析 1 直线回归 注意与直线相关的区别 又称简单回归 用于研究一个变 量随另一个变量变化而变化的依存关系 回归关系 从而预测或控制未知变 量的一种统计分析方法 通过拟合线性方程来描述两变量间的回归关系 应用条件 要求因变量Y 呈正态分布 自变量 X 是可以精确测量和控制的变 量 2 直线回归方程式 b 为样本回归系

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号