医学统计学总论

上传人:F****n 文档编号:88192564 上传时间:2019-04-20 格式:PPT 页数:39 大小:244.50KB
返回 下载 相关 举报
医学统计学总论_第1页
第1页 / 共39页
医学统计学总论_第2页
第2页 / 共39页
医学统计学总论_第3页
第3页 / 共39页
医学统计学总论_第4页
第4页 / 共39页
医学统计学总论_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《医学统计学总论》由会员分享,可在线阅读,更多相关《医学统计学总论(39页珍藏版)》请在金锄头文库上搜索。

1、医学统计学,统计学,描述统计学,推断统计学,理论统计学,应用统计学,参数估计,假设检验,统计学(statistics) 统计学是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。,根据研究领域和研究对象,统计学又分为:数理统计、经济统计、生物统计、医学统计、卫生统计,医学统计学(medical statistics): 用统计学的原理和方法研究医学中的问题。,卫生统计学(health statistics): 与医学统计学基本相同,但更侧重于社会、人群的卫生问题。,1. 寻找不确定现象背后隐藏的规律。,为什么要学统计学?,变异(variation

2、)是社会和生物医学中的普遍现象。 变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。,最大值=6.18, 最小值=3.29, 极差=2.89。 算术均数=4.72,标准差=0.57。,2. 用统计学思维方式考虑有关医学中的问题,1960年代初,药物沙利度胺(有称反应停)曾引起一次胎儿畸形的爆发,美国FDA发现有1267名医生开方子给19822名患者(含3760名育龄妇女),服用了250余万药片。这一事实提出一个问题:,医学界的“专业判断” 是否仍然可信?,批准了1962药物修正案,使得FDA成为医疗领域里药物有效性的最终仲裁者,3. 保证你的研究论文能通过统计学审查,

3、据国外6080年代对不同医学杂志发表论文的调查,有统计错误的论文的百分比最高达72%,最低也有20%。,国内1984年对中华医学杂志、中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(系列杂志仅占6.9%),数据分析方法误用达55.7%。,4. 获得循证医学证据的主要手段,“良好愿望的医学”(well-meaning medicine)转入“以证据为基础的医学” (evidence-based medicine,EBM)需要有统计学方法的支持。 全世界的

4、医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。,联系,区别,数学研究的是抽象的数量规律,统计学则是研究具体的、实际现象的数量规律 数学研究的是没有量纲或单位的抽象的数,统计学研究的是有具体实物或计量单位的数据 统计学与数学研究中所使用的逻辑方法不同 数学研究所使用的主要是的演绎 统计学则是演绎与归纳相结合,占主导地位的是归纳,1. 统计学运用到大量的数学知识 2. 数学为统计理论和统计方法的发展提供基础 3. 不能将统计学等同于数学,Statistics VS Mathmatics,医学研究中的统计学,统计学渗透在医学实践中,如诊断和选择治疗方案。从某种意义上讲,每个

5、人天生就是统计学家。 但是,这些判断究竟有多大把握是正确的呢? 在非典型性肺炎还不为人所熟悉时,有多少人把它当作一般肺炎进行治疗的呢? 医学实践需要尽量减少不确定性,需要统计学!,1. 统计设计:明确问题、试验设计 2. 搜集资料:取得准确可靠的原始资料 3. 整理资料:统计假设 4. 分析资料:假设演绎、统计推断,统计工作的步骤,第一步:设计 制定计划,对整个过程进行安排,是整个工作的关键。如何进行设计? 包括:背景-目的-方法-内容-经费预算等,第二步: 收集资料:根据计划取得可靠、完整的资料。 收集资料的方法有三种:统计报表、日常性工作、专题调查。 关键:注重资料的真实性。,第三步: 整

6、理资料:原始资料的整理、清理、核实、查对,使其条理化、系统化便于计算和分析。 可借助于计算机,常用软件:SPSS、SAS。,第四步: 分析资料(统计分析):统计学的关键所在。运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律。,目的 掌握统计分析基本思想,重应用,不深究数学推导 掌握处理实际资料和准确表达统计分析结果的技能 识别资料类型,选择正确的统计方法 对统计结果作出正确解释 顺利阅读专业文献中的统计内容 内容 医学研究中涉及统计学的名词和概念 统计分析的原则及基本思想 基本的统计分析方法,关于本课程,统计学基本概念,例1 调查2004年某市7岁男童的身高和体重 同质

7、:2004年、某市、7岁男童 变异:身高和体重各不相同 例2 研究某降压药的疗效 同质:高血压患者、用某药治疗 变异:疗效各不相同,A 同质: (homogeneity)事物的性质、影响条件或 背景相同或非常相近 变异: (variation)同质个体间的差异,B 随机事件:在一定条件下可能发生的事件 随机变量:(random variable) 随机事件在数量上 的表现 离散型变量: (discrete variable) 在一定区间内变量取值为有限个, 或数值可以一一列举出来 连续型变量: (continuous variable) 在一定区间内变量取值有无限个,或数值无法一一列举出来 有

8、序变量:(ordinal variable),C 总体:(population) 根据研究目的所确定的 同质观察单位的全体 样本:(sample)从总体中随机抽取的部分观察单位,D 参数: (parameter) 总体的某种统计特征值 统计量: (statistic )根据样本数据计算出的一个量,m 均 数 x p 比 例 P s 标准差 S,案例:研究2004年某地7岁男孩的身高情况。 假如该地2004年的7岁男孩有10万人,则最直接的方法就是普查:调查这10万个儿童,测量他们的身高,然后进行统计分析。但是工作量非常大。 我们可以通过随机抽样调查了解7岁男孩的身高情况。如调查200个儿童,测

9、量他们的身高,通过分析这200个儿童的身高推断该地10万个7岁男孩 身高情况。,1 研究目的:2004年某地7岁男孩的身高情况。 2 研究对象:该地在2004年的10万个7岁男孩。 3 观察单位:每个7岁男孩。 观察指标:身高(观察指标又称为变量);身高的测量值 (观察值)又称为变量取值或变量值。 总体:该地2004年的10万个7岁男孩身高观察值的全体 (即:10万个身高观察值构成的一个集合)。 6 样本:随机抽样所得到的200个7岁男孩身高观察值。 抽样:通过样本信息了解总体的情况。即:通过分析 200个7岁男孩身高了解10万个7岁男孩身高情况。,E 概率: (probability) 度量

10、随机事件发生可能性大小的 一个数值 ,用大写的P表示;取值0,1。 必然事件: P=1 不可能事件: P=0 频率: (frequency) 事件实际发生次数与可能发生次数的比率,设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f / n。 1,抛硬币:1/2 2,新生儿性别比:107:100,必然事件 P = 1 随机事件 0 P 1 不可能事件 P = 0 P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。,小概率事件,频率与概率的关系 样本频率总是围绕概率上下波动; 样本含量n越大,波动幅度越小,频率越接近概率; 随着实验

11、次数增至足够大,频率逐渐稳定于某一常数附近,则该常数为概率。,F 误差:(error) 指观察真值与观察值之差, 或样本指标与总体指标之差。,系统误差(systematic error),a. 仪器标准试剂未经校正; b. 测量者掌握尺度不同; c. 测量者的某种感官障碍等原因所导致测量 结果呈倾向性偏大或偏小。,特点:有倾向性;可避免。,特点:无倾向性;不可避免。,重复测量误差 (error of replication),抽样误差 (sampling error),由于抽样所导致样本指标与总体指标的差异(主要由变异引起),随机误差 (random error),统计资料的数据结构,二维(行

12、列)数据结构 行标志:观察单位/记录(case/records) 列标志:变量(variables) 标识变量 (marker variable):NO. 分组变量 (categorical variable)/分类变量(group variable)/因素(factor) 反应变量 (response variable):心电图、收缩压、舒张压、疗效 协变量(covariable ) :age, sex,100例高血压患者治疗后的临床记录,统计资料的数据类型,统计资料的数据类型,A 计数资料: (count data) 又称分类变量 将全体观测单位按照某种性质或特征分组,然后再分别清点各组观

13、察单位的个数。 特点:没有度量衡单位 多为间断性资料 (通过枚举或记数得来) 如:心电图检查结果(正常、异常) 性别(男、女) 血型(A、B、O、AB),统计资料的数据类型,B 计量资料: (measurement data) 又称定量资料,用仪器、工具等定量方法对观察单位测量(measure)某指标值所得到的资料。 特点:一般有度量衡单位,多为连续性资料 (通过测量得到) 如:患者身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(10/L)等;,统计资料的数据类型,C 等级资料: (ordinal data) 又称半定量资料,根据观察单位某指标量的大小,深浅或严重程度

14、分组,得到的各等级组观察单位数。 特点:有大小顺序,故又称有序分类资料 每一个观察单位没有确切值 各组之间有性质上的差别或程度上的不同 如 癌症分期:早、中、晚; 药物疗效:治愈、好转、无效、死亡; 尿蛋白: ,+,+及以上;,以12kPa为界分为正常与异常两组, 统计每组例数,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,计量资料,等级资料,计数资料,例:一组2040岁成年人的血压,三类统计资料的关系,三类统计资料的转换,计量与计数:正常与异常 等级与计量:转为平均秩次 计量与等级:如男性血红蛋白按量分为5等级 16 血红蛋白增高,小 结,统计工作的四个步骤 统计学的几个基本概念 误差 同质与变异 总体与样本 参数与统计量 概率与频率 统计资料的三种类型,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号