医学统计学专项课程

上传人:luobi****88888 文档编号:94013274 上传时间:2019-07-31 格式:PPT 页数:79 大小:1.40MB
返回 下载 相关 举报
医学统计学专项课程_第1页
第1页 / 共79页
医学统计学专项课程_第2页
第2页 / 共79页
医学统计学专项课程_第3页
第3页 / 共79页
医学统计学专项课程_第4页
第4页 / 共79页
医学统计学专项课程_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《医学统计学专项课程》由会员分享,可在线阅读,更多相关《医学统计学专项课程(79页珍藏版)》请在金锄头文库上搜索。

1、本资料来源,医学统计学,温医公卫学院黄陈平,医学实践中遇到的统计学问题举例(1),某中医师对某方剂进行改良,改良后的方剂治疗某病患者30例,有效率为80%,原方剂治疗30例,有效率为60%,问两者有效率有无差别?,医学实践中遇到的统计学问题举例(2),某医师用、和三种方案治疗婴幼儿贫血患者,治疗一个月后,血红蛋白的增加克数如下表,问三种治疗方案对婴幼儿贫血的疗效是否相同?,表,.,三种方案治疗后血红蛋白增加量(),24,20,20,36,18,11,25,17,6,14,10,3,26,19,0,34,24,-,1,23,4,5,医学实践中遇到的统计学问题举例(3),在小学生的课间餐面包中添加

2、赖氨酸,以研究其对儿童体重和身高增长的影响,拟分析赖氨酸添加的最佳浓度和面包烤制的最佳条件。赖氨酸的浓度有五个水平:0.0%,0.2%,0.4%,0.6%,0.8%,面包烤制条件有两个水平:甲和乙。如何设计和分析?,医学实践中遇到的统计学问题举例(4),医学实践中遇到的统计学问题举例(5),医学实践中遇到的统计学问题举例(6),22例期非小细胞肺癌患者在不同日期经随机化分配到放疗组和放化疗联合组,从缓解出院日开始随访,随访时间(月)如下,试比较放疗和放化疗联合两种治疗方案的疗效有无差别? 放疗组 1,2,3,5,6,9+,11,13,16,26,37+ 放化疗联合组 10,11+,14,18,

3、22,22,26,32,38,40+,42+,医学实践中遇到的统计学问题举例(7),欲研究胃癌患者术后发生院内感染的影响因素,某医生记录了50名胃癌患者术后院内感染情况,并调查了下列可能的影响因素: 年龄(岁)、手术创伤程度(分5等级)、营养状态(分3等级)、术前预防性抗菌(分有无)、 白细胞数(109/L)、 肿瘤病理分级(19级)。 1. 欲筛选哪些因素是影响胃癌患者术后发生院内感染的主要因素, 应选择何种统计分析方法? 2. 经统计分析得知营养状态(X3)和肿瘤病理分级(X6)是有意义的影响因素,若一胃癌患者营养状态评分(X3)为1,肿瘤病理分级(X6)为4,则预计其术后发生院内感染的概

4、率是多少?,医学实践中遇到的统计学问题举例(8),学习医学统计学的要求,最低要求:知道常见的统计学方法,会模仿着去应用。 基本要求:了解有关统计方法的原理,能较熟练地运用统计软件,解决常见的统计学问题。 较高要求: 对较复杂的统计学问题,能独立提出系统的解决方案。,第一章 绪 论,一、什么是统计学? Whats statistics?,是一门关于收集、整理和分析(统计)数据的科学。 医学统计学是统计学方法在医学中的运用。 医学研究中观测结果多为随机事件,通过统计学方法可以揭示其内在规律。,问题1: 产生随机性的原因? 如一组七岁男童的身高。 问题2: 大量性随机现象的统计有无规律性?,(1)设

5、计: design (2)收集资料 collection of data (3)整理资料 sorting data (4)分析资料 analysis of data,二、统计工作的基本步骤,1)专业设计 2)统计设计,1)统计报表 2)医疗卫生工作记录 3)专题调查和实验,1)对数据检查、核对 2)按分析要求分组、汇总,1)统计描述 2)统计推断,用定量方法测定得到,有大小之分,有度量衡单位。,三、 统计资料类型,(一)计量资料 measurement data,将观察单位按属性或类型分组计数所得的资料。 分为:1、二项分类资料; 2、多项分类资料。,(二)计数资料 enumeration c

6、ount data,(三)等级资料 ranked ordinal data,将观察单位按某属性不同程度分组计数所得的资料。,例:测得一群人Hb值(g/dL),此资料为 ; 按正常和异常分为两组,此时资料为 ; 按量的多少分为: 16 (Hb增高)。此时资料为 。,资料间的相互转化,四、统计学的基本概念,(一)同质与变异,同质(homogeneity) 指各观察指标受相同因素影响的部分。,变异(variation) 在同质的基础上个体间的差异。,例某地某年用随机抽样方法检查了140名健康成年男子的红细胞数(1012/L),检测结果如下表:,观察指标的同质部分:“某地某年健康成年男子” 观察指标的

7、变异部分:各个体间红细胞数间的差异,医学统计学的基本概念,(二)总体与样本(population & sample),总体:是根据研究目的所确定的同质观察单位(某种变量值)的全体。 1)有限总体(有时间、空间限制) 例研究2008年温州市肝癌死亡率。 2)无限总体 例研究某药对高血压病的疗效。 样本:从总体中随机抽取一部分个体所组成的集合。,医学统计学的基本概念,(三)随机抽样,1.单纯随机抽样 2.系统(机械)随机抽样 3.整群随机抽样 4.分层随机抽样,从总体中随机遇而定抽取部分个体的过程。(总体中每一个观察单位均有同等的机会被抽取到) 随机抽样是样本客观反映总体情况的前提。 随机抽样方法

8、:,单纯随机抽样,即先将调查总体的全部观察单位编号,再随机抽取部分观察单位组成样本。,例:欲了解某单位职工HBsAg阳性率,该单位有职工1000人,试按单纯随机抽样法,抽取一例数为100的样本。,系统随机抽样,又称等距抽样或机械抽样,即先将总体的观察单位按某一顺序号等分成n个部分,再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽一个观察单位组成样本。,例:欲了解某单位职工HBsAg阳性率,该单位有职工1000人,试按系统抽样法,抽取一例数为100的样本。,整群随机抽样,先将总体划分为n个群,每个群包括若干观察单位,再随机抽取k个群,并将被抽取的各个群的全部观察单位组成样本

9、。,例:某校有80个班级,各班学生50人,现用锡克氏试验调查该校学生白喉易感率,随机抽查了8个班的全部学生。,分层随机抽样,按有关影响因素把观察对象分成若干层次,然后将同一层次的观察对象进行随机抽取。,例:欲了解某地人群HBsAg阳性率情况,按年龄段、职业、性别等因素分层后进行抽样。,医学统计学的基本概念,(四)误差 主要有:粗差、系统误差、随机误差(如测量误差、 抽样误差等),问题:某中医师对某方剂进行改良,改良后的方剂治疗某病患者30例,有效率为80%,原方剂治疗30例,有效率为60%,问两者有效率有无差别?,抽样误差:抽样引起的总体参数与样本统计量之间sampling error 的差别

10、。,医学统计学的基本概念,(五)参数与统计量 (parameter & statistic) 参数: 统计量: 检验统计量:,总体的特征量,如总体均数、总体标准差等。 样本的统计指标如样本均数、标准差等。 用于统计检验的样本指标。 如 t、u、x2、F 等,均表示某事件发生可能性大小的量。,(六)频率和概率,但:频率为变量,fn(A) =m/n 概率P(A)为常数。 若n足够大, fn(A) P(A),小概率事件 P(A) 0.05 “小概率事件一次是不太可能发生的”,医学统计学的基本概念,第二章 计量资料的统计描述,第一节 计量资料的统计描述,一、计量资料的频数表 二、集中趋势的描述 三、离

11、散程度的描述,例某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如下表:,1、频数表的编制 2、频数分布的特征 3、频数分布的类型 4、频数表的用途,一、计量资料的频数表,(1)求全距或极差(R),(2)定组段和组距(i),1. 频数表的编制,(3)列出频数表,某地140名正常男子红细胞数的频数表,2. 频数分布的特征,(1)集中趋势 (2)离散趋势,(1)对称分布 其中一种常见的类型为正态分布. (2)偏态分布 有正偏态、负偏态之分.,3. 频数分布的类型,4. 频数表的用途 (1)了解资料的分布类型. (2)发现异常值. (3)在频数表的基础上计算有关指标。,1、算术均数 ,X

12、 2、几何均数 G 3、中位数 M,二、集中趋势的描述,概念: 数值的平均. 计算: 1)直接法:,例2.1 求某地140名正常成年男子红细胞数均值为,1. 均数(mean) ,X,2)加权法:,应用: 对 称分布,尤其是正态分布.,概念:指一组数据的倍数平均。 计算:(1)直接法:,2. 几何均数 ( geometric mean, G ),例:5份血清的抗体效价为1:10,1:100,1:1000,1:10000,1:100000,求其平均效价。,或者: 1:10,1:100,1:1000,1:10000,1:100000的指数部分为:-1,-2,-3,-4,-5,其平均值为-3,故G =

13、10-3=1:1000,(2)加权法:,何谓对数正态分布? 某资料由变量值 X1,X2, Xn组成,已知其分布呈偏态。若每个变量值取对数,如Y1=lgX1,Y2=lgX2, Yn=lgXn,且Y1,Y2, Yn呈正态分布。 此时,,将对数值还原为原始数值,则:,应用: (1)变量值呈倍数关系 (2)对数正态分布,3. 中位数 M,概念:是一组由小到大按顺序排列的观察 值中位次 居中的数值。 计算:(1)直接法: n为奇数时,n为偶数时,某病患者9人发病潜伏期为2,3,3,3,4,5,6,9,16天, 求中位数。 若在第20天又发现1例患者,则其中位数为:,3. 中位数 (median M),利

14、用百分位数计算公式进行计算. 百分位数(PX)是一种位置指标, 。中位数是一个特定的百分位数,即M= P50 。,(2)频数表法:,百分位数计算公式:,百分位数计算公式:,M,M,P25,P75,应用: (1)偏态分布资料; (2)资料分布一端或两端有未确定值。,三、离散程度的描述,例: 三组同性别、同年龄儿童的体重(Kg)如下,分析其集中趋势与离散趋势。 甲组:26 28 30 32 34 均数:X=30 Kg 乙组:24 27 30 33 36 均数:X=30 Kg 丙组:26 29 30 31 34 均数:X=30 Kg,三、离散趋势的描述,只用平均数描述资料的弊病,It has bee

15、n said that a fellow with one leg frozen in ice and the other leg in boiling water is comfortable。 ON AVERAGE !,描述离散程度的常用指标,1、全距(极差) (R) 2、四分位数间距(QR) 3、方差(2 S2)和 标准差(、S) 4、变异系数 (CV),反映一组同质观察值个体差异的范围。 R甲=8; R乙=12; R丙=8。 缺点(1)不能反映组内其它观察值的变异度。 (2)样本含量越大,则全距可能也越大。,1. 全距(极差),即P75P25 四分位数可看作是一组同质观察值居中的50%变量值的变异范围。,2. 四分位数间距(quartile range, QR),不受极值影响,较稳定。,与全距比较有何优点?,应用: (1)偏态分布; (2)资料一端或两端有未确定值。,变量值的离散程度可看作是各个变量值距离中心点(均数)的远近问题。 用算式表示: x 但: x=0 则求: x2 (离均差平方和) x2 大小与变异度有关外,还与变量值个数(N)有关。 故:,3. 方差(2 S2)和 标准差(、S) (variance & standard deviation),为了用原单位表示,开方即:,标准差

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号