卫生统计方法在医学中科学应用

上传人:san****glu 文档编号:114914171 上传时间:2019-11-12 格式:PPT 页数:112 大小:1,022KB
返回 下载 相关 举报
卫生统计方法在医学中科学应用_第1页
第1页 / 共112页
卫生统计方法在医学中科学应用_第2页
第2页 / 共112页
卫生统计方法在医学中科学应用_第3页
第3页 / 共112页
卫生统计方法在医学中科学应用_第4页
第4页 / 共112页
卫生统计方法在医学中科学应用_第5页
第5页 / 共112页
点击查看更多>>
资源描述

《卫生统计方法在医学中科学应用》由会员分享,可在线阅读,更多相关《卫生统计方法在医学中科学应用(112页珍藏版)》请在金锄头文库上搜索。

1、卫生统计学方法在医学中的应用 中南大学公共卫生学院 副院长 流行病与卫生统计学系 教 授 杨土保 博士生导师 主要内容 基本概念 常用统计方法 统计描述(定量资料、定性资料) 率的标准化 常用统计图表 t检验 2检验 秩和检验 直线相关与回归分析 卫生统计学基本概念 总体与样本 总体:表示大同小异的对象(某个测量值)全体 。如一个国家的所有成年人(身高值);某地的所 有小学生(身高值) 抽样:从研究总体中抽取一部分有代表性的个体 的方法; 样本:从研究总体中随机抽取的一部分有代表性 的个体; 数据:对样本中个体进行深入的观察与测量,获取 的测量值。 卫生统计学基本概念 变量的类型 变量(var

2、iable):分成定性(qualitative)与 定量(quantitative)两种类型。 定性变量(分类变量(categorical variable)或名义变量(nominative variable) 。 例如,职业(工、农、商、学、兵等) 是一个分类变量;其可能的“取值”不是数字 卫生统计学基本概念 二分类变量(binary variable),称 为0-1变量 例如,性别(男女)、疾病(有无 )和结局(生死)等。二分类变量常 用0和1来编码,0-1变量常称为假变量 (dummy variable)或哑变量,可以和真 变量一样参与计算。 卫生统计学基本概念 有序变量(ordinal

3、 variable)或等级变量。 分类变量的“取值”中自然地存在着次序 。例如,问卷调查常问对某件事情的满意 程度:极不满意、有点满意、中度满意、 很满意、极满意。有些临床体检或实验室 检验常用、+、+和+来表示测量结 果。 卫生统计学基本概念 定量变量 离散型变量(discrete variable):离散型 变量只能取整数值。例如,一月中的手术 病人数,一年里的新生儿数。 连续型变量(continuous variable):连续 型变量可以取实数轴上的任何数值。 “连续” 是指该变量可以在实数轴上连续变动,由 测量而得到。例如,血压、身高、体重等 。 卫生统计学基本概念 统计分析:一定的

4、设计样式决定了一定的数 据分析方法;不同设计下获得的资料常常 要用不同的方法来分析。 随机化区组设计(randomized block design)的方差分析不同于析因设计 (factorial design)的方差分析 病例-对照研究(case-control study),成 组对照的资料和匹配对照的资料的分析方 法不同 统计描述-定量资料 频数与频数分布 频数:某个测量值的个(例)数。 频数分布表:又称频数表。是将原始数据值适当分组后得到 各组的频数。 适用样本量较大的资料进行统计描述的常用方法。通 过频数表可以显示数据分布的范围与形态。 定量资料的统计描述 离散型定量变量的频数分布

5、例2-1 1998年某山区96名孕妇产前检 查次数资料如下:0,3,2,0,1,5, 6,3,2,4,1,0,6,5,1,3,3, ,4,7等共96个数值 定量资料的统计描述 表2-1:96名妇女产前检查次数分布的频数分布表 表2-1 1998年某地96名妇女产前检查次数分布 检查次数频数频率(%)累计人数累计频率(%) (1)(2)(3)(4)(5) 044.244.2 177.31111.5 21111.52222.9 31313.53536.5 42627.16163.5 52324.08487.5 51212.596100.0 合计96100 定量资料的统计描述 连续型定量变量的频数分

6、布 例:抽样调查某地120名18岁35岁健 康男性居民血清铁含量(mol/L), 将数据适当分组,计数每组的频数,根 据这些数据编制成的频数分布表,则能显 示出这组数据分布的特点。 定量资料的统计描述 数据 7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.07 20.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.77 18.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.61 14.2717.4022.5517

7、.5516.1017.9820.1321.0014.5619.8919.8217.48 14.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.54 24.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.36 17.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.53 14.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.31 21.7519.4715

8、.5110.8627.8121.6516.3220.7522.1113.1717.5519.26 12.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52 定量资料的统计描述 手工编制表步骤。 (1)计算全距(range,R),也称为极差 R = 最大值最小值 = 29.64-7.42=22.22( mol/L) (2)确定组段数与组距:组段数一般可在1015之 间选择。组距=上限下限=R/(预计的组段数) 。本例如果预计取12个组段,则组距长度约为 22.22/12=1.85,取整数2。两端的组段应分别包含 最小值或最大值; (

9、3)列表 做出如表2-2的表格,将选好的组段顺序 地列在 (1)列。按照“下限x上限” 的原则确定每 一例数据x应归属的组段。 定量资料的统计描述 频数分布图:在表基础上,可以绘制出图, 称为直方图(频率直方图)。 横轴:血清铁含量 纵轴:频率密度,即频率/组距(直条面积 等于相应组段的频率)。 在组距相等时,直方图中矩形直条的高 度与相应组段的频率成正比。 定量资料的统计描述 定量资料的统计描述 对称分布:频数最多的组段在中央 正偏峰分布:峰向左侧偏移的分布,右侧的 组段数多于左侧,为右偏峰分布。 负偏峰分布:峰向右侧偏移的分布,左侧的 组段数多于右侧,称为左偏峰分布。 定量资料的统计描述

10、定量变量的特征数 集中趋势统计指标 对于连续型定量变量,描述集中趋势常用 的统计量为算术均数、几何均数和中位数 。 算术均数:适合描述对称分布资料的集中位 置(也称为平均水平)。 定量资料的统计描述 几何均数:适用于观察值变化范围跨越多个数 量级的资料。其频数图一般呈正偏峰分布。 人们常用几何均数描述这类资料的集中位置 。 在医学研究中常适用于免疫学的指标。其 计算公式为 定量资料的统计描述 中位数:可用于各种分布的定量资料。中位 数的原意是指在总体中有一半个体的数值 低于这个数,一半个体的数值高于这个数 。 奇数: 偶数: 离散趋势统计指标 1.极差:一组变量值最大值与最小值之差。 极差不能

11、反映所有数据的变异大小,且受样 本含量的影响较大,N大,极差值相差也大,故 其稳定性较差。 2.四分位数间距: 四分位数是把全部变量值分为四部分的 百分位数,即第1四分位数(QL=P25)、第2四分位数( M=P50)、第3四分位数(QU=P75)。四分位数间距是 由第3四分位数和第1四分位数相减而得,记为QR。它 一般和中位数一起描述偏态分布资料的分布特征。 定量资料的统计描述 定量资料的统计描述 3.方差与标准差 方差(variance)也称均方差(mean square deviation),反映一组数据的平均离散水平。 离均差:每一个变量值与均数的差值, 离均差平方和(sum of s

12、quares):离均差平方后相 加得到的值 方差:离均差平方和除以N得到的值为总体方差。 标准差:方差开平方得到的值。 定量资料的统计描述 5.变异系数 变异系数(coefficient of variation)记 为,多用于观察指标单位不同时的变异程 度的比较。其计算公式为 三、定性资料的统计描述 常用的相对数指标 相对数指标大致有三种类型: 频率 构成比 相对比 常用的相对数指标 频率 频率型指标是最常见的, 通常近似地反映某一事件出 现的机会大小,如发病概率、死亡概率等 分子是分母的一部分;无量纲,在01范围内取值;K 是比例基数,通常取为100%,也可取为1000、1万/1万 和10

13、万/10万等,根据习惯用法来决定。 常用的相对数指标 构成比 表示事物内部某一部分的个体数与 该事物各部分个体数的总和之比,用 来说明各构成部分在总体中所占的比 重或分布。通常以100%为比例基数。 其计算公式为 常用的相对数指标 相对比型指标 相对比型指标是指任何两个相关联 的变量A与B之比。它表示相对于B的一个 (或十个、百个、千个等)单位,A有多 少个单位。A和B可以是绝对数、相对数和 平均数,A和B的量纲可以不同,也可相同 ,但A和B互不包含 相对比=A/B 最常见:男女性别比;每千人口的医 生数、每千人口的病床数、每医生的门诊 工作量 常用的相对数指标 应用相对数应注意的事项 防止概

14、念混淆 计算相对数时分母应有足够数量 正确地合并估计频率(或强度)型指标 相对数间的比较要具备可比性:观察的对象是否同质,研 究的方法(如检测手段、抽样方法)是否相同,观察的 时间是否一致等;被比较的总体是否具有可比性 对相对数的统计推断 率的标准化 概念与思想 死亡率的标准化的基本思想就是寻找一 个统一的分布(本例为人口的年龄分布) 作为标准组,然后每个比较组均按该分布 标准计算相应的死亡率,所得到的死亡率 是相对于标准组的,故称为标准化死亡率 ,也称调整死亡率。 率的标准化 标准化死亡率的计算 主要有直接法和间接法两种,其特 点见下表 直接法间接法 计算公式 或 其中, 本质特点实际上是p

15、i的加权均数,权重 是标准人口年龄的频率分布。 实际上是对原总死亡率的校正,校正系 数为标准化死亡比SMR。 适用条件已知:两地各年龄组死亡 率 (pi);标准组各年龄组人 数或构成比(Ni或Ni/N)。 已知:两地各年龄组人数及死亡总 数 ;标准组各年龄组死亡 率及总死亡率。 率的标准化 标准化法的注意事项 当且仅当欲比较的两个人群内部的年龄分布不同以及 每个人群内部年龄别死亡率也各不相同时方采用标准化法 。只有当要比较总率而且希望归因为人口构成不同之外的 其它因素时标准化才有意义。 标准化死亡率并不是被标化组本身的实际值,而是用 标准人口作为平台,对各被标化组进行的调整。选择的标 准人口不

16、同,算得的标准化死亡率也不同,因此,在比较 几个标准化死亡率时,应采用同一标准人口。 标准组应选择有代表性的、较稳定的、数量较大的人群。 通常选择相互比较的人群之一或将各个比较组的数据合并 作为标准组。 标准化死亡率的比较应作假设检验。 五. 常用统计图表 统计表 统计表的结构与种类 简单统计表:只包括一个分组变量 组合表:多于一个分组变量 常用统计图表 图2-5 统计表的结构 常用统计图表 表2-5 A、B两种药物在甲、乙两医院的疗效 药物 甲医院乙医院 总计 有效 无效 合计有效无效合计 A40105042850100 B351550331750100 合计75251007525100200 常用统计图表 列表原则和要求: 列表原则主要为重点突出、简单明了、主谓分明、 层次清楚。 表结构: 标题:多数场合标题应包括表的编号。标题位于 统计表的最上部。时间、地点 标目 分为纵标目与横标目。纵标目标示

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号