(优质医学)医学统计基本方法

上传人:日度 文档编号:145621348 上传时间:2020-09-22 格式:PPT 页数:193 大小:7.69MB
返回 下载 相关 举报
(优质医学)医学统计基本方法_第1页
第1页 / 共193页
(优质医学)医学统计基本方法_第2页
第2页 / 共193页
(优质医学)医学统计基本方法_第3页
第3页 / 共193页
(优质医学)医学统计基本方法_第4页
第4页 / 共193页
(优质医学)医学统计基本方法_第5页
第5页 / 共193页
点击查看更多>>
资源描述

《(优质医学)医学统计基本方法》由会员分享,可在线阅读,更多相关《(优质医学)医学统计基本方法(193页珍藏版)》请在金锄头文库上搜索。

1、第一节 医学统计学方法概述 Medical Statistics,医学统计基本方法,1,一、漫谈 ”统计”,日常生活中,我们常听到很多关于“统计”的词汇.例如: 国家统计局公布,2004年全国GDP增长9%; 国家气象局预报,明天北京天气阴,降水概率40%;,报刊统计信息文摘 2003年,北京市人平寿命77.93岁, 婴儿死亡率为5.56, 儿童计划免疫接种率98%. 这些主要健康指标已接近或超过中等发达国家的水平. 北京日报.京报网,2003年11月20日,2,统计学的概念,什么是统计学? statistics state 指政府,官方所要求的信息。,统计学是一门处理数据中变异性的科学和艺术

2、。 -John M.Last A Dictionary of Epidemiology,3,统计学的应用领域,统计学,经济学,管理学,医学,工程学,社会学,4,医学统计学概念,用统计学原理和方法研究医学问题. 应用概率论和数理统计的基本原理和方法,结合医学实际,研究资料和信息的搜集、整理与分析的一门学科。,(从看起来错综复杂的偶然性中揭露潜在的必然性),5,怎样学习医学统计学,1.重在理解基本的统计原理,各种统计方法的基本概念,掌握适用范围和注意事项;学习过程中必须注意联系实际、结合专业; 2.对于书中所引用的统计公式,只要求了解其意义及使用方法,不必深究其数理推导。充分利用计算工具,始终把注

3、意力放在统计公式的理解,正确选择及结果分析上。,6,二、医学统计学中的几个基本概念,7,(一)同质-变异,同质 homogeneity 指事物的性质、影响条件或背景相同或非常相近。 (条件相同,性质相似的个体),变异variation 在同质的条件下,就同一观察条件说,各观察单位表现出来的数量间存在着差异,这种客观存在的差异性为变异。通常来源于一些未加控制或无法控制的甚至不明原因的因素。,8,例1: 儿童身体发育: 同性别、同年龄 身高不同 例2:同种属、同性别、同年龄、同窝小白鼠喂以同样的饲料, 增重量不同,(同质),(变异),(变异),(同质个体),9,(二)总体(population)与

4、样本(sample) 总体:是根据研究目的确定的同质的研究对象的全体。是性质相同的所有观察单位某种变量值的集合。 例如:某地1990年正常成年人的血压值,10,有限总体finite population 明确了时间、空间范围内有限个观察单位的总体。,无限总体infinite population 总体是抽象的、设想的,无时间和空间范围的限制。被观察的个体数在理论上存在。 例如 :研究用某药治疗缺铁性贫血的疗效,总体中个体数目有限,总体中个体数目无限多,11,样本sample 是指从总体中随机抽取的有代表性的部分个体所组成的集合。 特点:代表性 随机性 可靠性 可比性,12,(三) 参数与统计量

5、 parameter and statistic,参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为、。固定的常数,总体,样本,抽取部分观察单位,统计量,参 数,推断inference,统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 。 参数附近波动的随机变量 。,13,(四)随机抽样抽样误差,随机抽样 random sampling,为了保证样本的可靠性和代表性,需要采用随机化的抽样方法(在总体中每个个体具有相同的机会被抽到)。,14,抽样误差 例 : 1982年某市全体7岁男童(总体) 的平均身高为122cm (总体均数). 随机抽取一个(份)样本,含110名

6、(样本含量), 平均身高为119.95cm ; 再随机抽取一个(份)样本, 含110名, 平均身高122.80cm; 抽样误差:样本均数 总体均数 一(份)样本的均数 另一(份)样本的均数,由于随机抽样所造成的样本统计量与总体参数的差异,或者各样本统计量之间的差异,称抽样误差。,15,(五)频率-概率,频率frequency 在相同的条件下,独立重复n次试验,随机事件A出现 f 次,则称f / n为随机事件A出现的频率。频率的大小反映了事件A发生的频繁程度,频率大,则事件A发生就频繁,这意味着A在一次试验中发生的可能性就大。,16,概 率 随机事件发生的可能性大小,用大写的P 表示;取值0,1

7、。,15黑球 85白球,上述摸球模型,一次摸出黑球的可能性 = 15%,17,必然事件 P = 1 随机事件 0 P 1 不可能事件 P = 0 P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。,小概率事件,Certain,Impossible,0.5,0,1,18,(六)误差,观测值(observed value)与真实值之差,以及样本指标与总体指标之差。,误差,抽样误差,随机测量误差,系统误差,系统误差:由于人为因素造成。在收集资料的过程中,由于仪器设备、标准试剂、判定标准等不准确,使测定结果呈倾向性的偏大或偏小,这种误差称为系统误差。应尽可能避免。

8、 (受确定因素影响,大小变化有方向性。),随机测量误差 由于对同一受试对象采用同一方法重复测定时所出现的误差。 (随机误差变动倾向具有不确定性,原因不明了,一般是不可避免的。),19,计量资料 计数资料 等级资料,三、医学统计资料的类型,资料类型不同,统计方法不同,20,(一)计量资料measurement data 对每个观察单位的某项指标用定量的方法,通过测量得到的数值,一般有度量衡单位。 如:身高(cm)、体重(kg)、血压(Kpa)等值,21,某单位1999年110名正常成年女性职工血清总胆固醇测量结果(mmol/l),22,(二)计数资料enumeration data 将观察单位按

9、某种属性或类别分组,然后清点所得各组的观察单位数。没有度量衡单位 ,通过枚举或记数得来。 多项分类:人群血型分布:、 二分类:蛔虫卵粪检:、,23,观察单位observations 个体individuals,Units;elements,变量variables,Quantitative data 计量资料,Qualitative data 计数资料,24,(三)等级资料ranked data 将观察单位按某种属性的不同程度分组,所得各组的观察单位数。,某疾病 治疗结果,25,例:一组2040岁成年人的血压,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,以12

10、kPa为界分为正常与异常两组,统计每组例数,三种资料之间的关系,26,四、统计学工作的基本步骤,统计设计,收集资料,整理资料,分析资料,调查设计 实验设计,资料来源 质量控制,审核 合理分组,统计描述 统计推断 ,27,第三章 医学统计基本方法第二节 数值变量资料的统计描述与推断,28,一、列表描述法 频数分布表 (frequency table),29,140名成年男子红细胞数,30,频数表的编制步骤,(1)求全距(range,R):即最大值与最小值之差; 本例极差: R=5.95-3.822.13 (2) 决定组数和组距:组数通常取10-15个组,组距为全距的十分之一, 再略加调整; 本例

11、 i= R /10=2.13/10=0.2130.20 (3) 列出组段: 第一组段必须包括最小值,最后一个组段必须包含最大值; (4) 划记计数,31,32,频数表的用途,1.作为陈述资料的形式 2.揭示计量资料的分布类型:正态分布、偏态分布 3.描述计量资料分布的集中趋势和离散趋势 4.便于发现某些特大或特小的可疑值,33,图示描述法 -频数分布图,Graph of frequency distribution,34,频数分布图直方图,对称分布,35,正偏态(右偏态) 峰向左偏移,向右侧拖尾,负偏态(左偏态) 峰向右偏移,向左侧拖尾,36,37,二、集中趋势的描述, 平均水平的度量,38,

12、1.算术均数(arithmetic mean,M) 适用于正态分布和近似正态分布的资料。 总体均数用表示;样本均数用表示。,39,直接计算法 将所有观察值直接相加再除以观察值的个数。,40,加权法(观察值个数较多时) 根据频数表计算均数的一种方法把各组的组中值视为各组观察值的代表值,分别乘以各组的频数得到各组观察值之和,然后将它们相加得到观察值的总和再除以总例数。,41,2.几何均数(geometric mean,G) 适用于偏态分布的变量值经对数转换后呈对称分布的资料,观察值间按倍数关系变化的资料,观察值间不能有0或负数。如抗体滴度、血清凝集效价、某些物质的浓度等。用G来表示。,42,直接计

13、算法,例2.2测得5个人的血清滴度的倒数分别是2,4,8,8,32,求平均滴度,则:5份血清滴度的平均水平是1:7,43,频数表资料的几何均数,44,3.中位数(median,M) 将一组观察值从小到大按顺序排列,居于中心位置的数值。在全部观察值中有半数的值比M大,另有半数的值比M小。 适用于当大部分观测值比较集中,少数观测值偏向一侧时;或资料分布情况不清楚时;或数据的最大值(最小值)无准确测量数据时。如传染病的潜伏期。任何分布的定量数据均可用中位数描述其分布的集中趋势,尤其是偏态分布和一端或两端无确切数值的资料。,45,当样本量为奇数时 当样本量为偶数时,例:0.842.855.468.58

14、9.60中位数是M=X35.46,例:0.842.858.589.60中位数是 M=12(X2X3)12(2.85+8.58)5.72,46,频数表法,公式:,47,4.百分位数(Percentile, Px),将一组数据按照从小到大的顺序排列并等分为100等分,位于第x分位的数叫做第x百分位数,记做Px 在一组数据中,全部观测值的x%小于Px, 而1-大于Px,x%,48,49,百分位数示意图,百分位数(percentile),50,百分位数的应用,中位数用于反映一组数据的趋中位置或平均水平 百分位数可用来描述资料的观测值序列在某百分位置的水平,51,三、离散趋势指标的描述,52,有两组男子

15、身高如下,其均数相等,问两组身高(特征)是否一样? 甲组:170, 175, 180, 185, 190 均数=180 (cm) 乙组:160, 170, 180, 190, 200 均数=180 (cm),53,设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3),54,1.极差(Range) 全距,优点:简便 缺点:1. 只利用了两个极端值 2.样本量大,R也会大 3.不稳定 应用:用于说明传染病、食物中 毒等的潜伏期。,55,2.四分位数间距( quartile range),百分位数 数据从小到大 排列,在百分尺度下,所占百分比对应的值。记为Px。 四分位间距 QRP75 P25,P100(max) P75 P50(中位数) P25 P0(min),56,3.离均差平方和 (sum of squares,SS),57,4.方差(variance) 总体方差 样本方差,离均差平方和,自由度,58,应用公式:,59,5.标准差(standard deviation),总体标准差,样本标准差,60,例3.1 对甲乙两名高血压患者连续观察5天,测得其收缩压为: 甲 162 145 178 142 186(均数为162.6) 乙 164 160 163 1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号