课件人群健康研究的统计学方法

上传人:好** 文档编号:107465554 上传时间:2019-10-19 格式:PPT 页数:52 大小:421KB
返回 下载 相关 举报
课件人群健康研究的统计学方法_第1页
第1页 / 共52页
课件人群健康研究的统计学方法_第2页
第2页 / 共52页
课件人群健康研究的统计学方法_第3页
第3页 / 共52页
课件人群健康研究的统计学方法_第4页
第4页 / 共52页
课件人群健康研究的统计学方法_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《课件人群健康研究的统计学方法》由会员分享,可在线阅读,更多相关《课件人群健康研究的统计学方法(52页珍藏版)》请在金锄头文库上搜索。

1、2019/10/19,1,第七章,人群健康研究的统计学方法,2019/10/19,2,“统计”一词,对一般人来说并不陌生。 在报刊上常见用来说明我们工作、事业成 绩的数字、表、图,称为统计数字、统计 表和统计图。 在西方,统计学(statistics)一词, 源出于state(国家、情况),专指有关“国 情”的学问,最初多用于文字记叙,后发展 为数量比较,随着概率论思想与方法的引 入,逐渐形成今天在理论与应用方面都已相当完备的独立学科。,1. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高也大于乙班?为什么? 2用A,B

2、两种药物分别治疗同病患者各50人,如果A药的治愈率(60%)高于B药(50%),证明A药的疗效优于B药。这种说法对吗?为什么?,思考题,2019/10/19,4,医学统计学的主要研究内容,1、统计学设计(1)内容:临床试验设计、实验室研究设计、调查研究设计等。 (2)目的:控制和缩小随机误差,消除系统误差;节约样本含量;尽可能多地获取有关信息,达到高效低耗的目的。 2、统计分布 事物所表现的数量特征是千差万别的,其所呈现的分布规律是进行统计学推断的基础和根据。 3、各种统计量(或称统计指标)的性质、特点及其分布规律 4、统计分析方法(包括各种数学模型)尤其是随着计算机的普及和发展,多因素分析方

3、法发展很快。,2019/10/19,5,如何学习医学统计学,1、掌握基本概念、基本原理和基本方法。培养统计思维能力。 2、掌握常用统计分析方法。对统计公式,要求了解其用途、适用条件和注意事项。切忌死记硬背,关键是灵活运用。 3、重视习题课。联系实际,紧密结合专业知识,多做练习题。,2019/10/19,6,例:治疗某病的新疗法 新法:(100例) 有效20例,有效率20%; 旧法:(100例) 有效15例,有效率15%; 这两个百分数就是统计描述指标,现在的问题是,这两种疗法的有效率会稳定不变吗?如果说不会,是什么原因?那么,两种疗法的真实有效率会是多少?我们能根据统计描述( 20%与15%)

4、就去正式采用还有较大副作用的新疗法?对这样的差异问题,你能再凭直觉去作“否定”?在作任何回答之前,必须判断20%与15%之间的差别是真实的差异,或是仅仅由于“机遇”所致。这里,统计推断可提供帮助。学过统计学,将会了解不仅可判断新疗法是否较好?而且,如果判断它是较好,还能估计判断是错误的可能性有多大。,2019/10/19,7,统计分析是科研工作中的一种有力工具。 它从科研的总体设计、资料采集、资料整理、 资料分析直到最后作出结论都有密切关系。 掌握了这个工具可以使用较少的人力、物力 和时间获得比较可靠的结果。需要运用统计 方法的场合而不去运用它可能造成不应有的 缺陷或得出错误的结论。,2019

5、/10/19,8,例: 北京某医院某大夫使用“乌贝散” (乌贼骨3钱,白芨3钱,川贝3钱, 甘草3钱,共研细末过120目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4%。那么如果别的医院,其它大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?显然,不一定恰为94.4%,那么是多少呢?比它高还是比它低?这就是一个求可信区间的问题。,2019/10/19,9,例:某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为78,平均疗程为三周左右。问此药治疗玫瑰糠疹的确有效吗?由于玫瑰糠疹具有自然治愈的情况,一般不服药,多喝水,到三周左右有些患者也会自愈。所以,此

6、药的78疗效有待探讨。 这就要求设立具有可比性的对照组。,2019/10/19,10,再譬如,用某药治某病,治一例有效, 能说100有效吗?治疗二例有效,能说明 100有效吗?治十例,其中九例有效,能 说90有效吗?显然,观察的例数将是个重要因素,例数太少不足以说明问题。观察例数太多,将费时,加重科研经济负担。那么观察多少例能说明问题?这是一个样本可靠性问题。,2019/10/19,11,一些现象既有规律性又有随机性,肺癌患者中(主动或被动)吸烟的比例较大,这体现了规律性,而绝非每个吸烟的人都会患肺癌,这体现了随机性; 再如,一般来说,白种人身材比黄种人要高些,这就是规律性,但对于具体的一个白

7、人和一个黄种人,就很难说谁高谁矮了,这体现随机性。,2019/10/19,12,第一节 统计学方法概述,一、统计学的意义 统计学是运用数理统计的原理和方法,研究数据资料的搜集、整理、分析与推断的科学,是认识社会和自然现象客观规律的数量特征的重要工具。 医学统计学 是认识医学现象数量特征的重要工具,是运用数理统计的原理和方法,结合医学实际,来研究医学科研的实验设计和数据处理的一门科学。 “医学统计学是处理医学资料中的同质性(homogeneity)和变异性(variation)的科学与艺术”,2019/10/19,13,二、统计学中的几个基本概念,(一) 同质与变异 (二) 总体与样本 (三)

8、参数与统计量 (四) 误差 (五) 概率,2019/10/19,14,(一)同质与变异 homogeneity and variation,同质:指观察单位(研究个体)间被研究指标的影响因素相同。 个体:即观察单位,是统计研究中的最基本单位。 变量:观察单位的研究特征 变量值:变量的观察结果 变异:指同质的个体之间的差异 。,2019/10/19,15,同质与变异的例子,例1 调查2008年淄博市7岁男童的身高和体重 同质:2008年、淄博市、7岁男童 变异:身高和体重各不相同 例2 研究某降压药的疗效 同质:高血压患者、用某药治疗 变异:疗效各不相同,2019/10/19,16,120名正常

9、成年男子红细胞计数值(1012/L),最大值=6.18, 最小值=3.29, 极差=2.89 算术均数=4.72,标准差=0.57,2019/10/19,17,2019/10/19,18,(二) 总体与样本 population and sample,总体:根据研究目的所确定的同质观察单位某项变量值的集合(全体)。 分有限总体与无限总体,样本:从总体中随机抽取的部分观察单位变量值的集合。,2019/10/19,19,随机抽样 random sampling,为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。,2019/10/19,20,(三) 参数与

10、统计量 parameter and statistic,参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为、。固定的常数,推断inference,统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 。 参数附近波动的随机变量 。,2019/10/19,21,(四) 误差 error,误差:泛指实验数据的实测值与真实值之差,1 系统误差 2 随机测量误差 3抽样误差,2019/10/19,22,系统误差 systematic error,在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为偏倚(b

11、ias)。 特点:观察值系统性、方向性、周期性的偏离真值。 可以通过严格的实验设计和技术措施消除。,2019/10/19,23,2随机测量误差 (random error of measurement )或称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机地变化。 随机测量误差服从正态分布,可以用概率统计方法处理。,2019/10/19,24,3抽样误差 ( sampling error) 我们从同一总体中随机抽取若干个例数相同的样本,其样本统计量之间会有所不同。这种由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异,统计

12、上称为抽样误差。 抽样误差在医学生物实验中最主要的来源是个体的变异。所以这是一种难以控制的、不可避免的误差。但抽样误差是有一定规律的。,2019/10/19,25,(五) 概率probability,确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。,随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。 随机事件的特征:随机性;规律性:每次发生的可能性的大小是确定的。,概率:随机事件发生的可能性大小,用大写的P表示;取值0,1。,2019/10/1

13、9,26,必然事件 P = 1 不可能事件 P = 0 随机事件 0 P 1 P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。,小概率事件,2019/10/19,27,样本的实际发生率称为频率。设在相同条件下,独立重复进行N次试验,事件A出现n次,则事件A出现的频率为f=n /N。 频率与概率间的关系: 概率是参数,频率是统计量; 频率总是围绕概率上下波动; 样本含量n越大,波动幅度越小,频率越接近概率。,频率 frequency,2019/10/19,28,三 统计资料的类型,(一) 数值变量资料 (二) 分类变量资料 (三) 变量间转化,2019/1

14、0/19,29,观察单位observations 个体individuals,变量variables,numerical variable data 数值变量资料,Categorical variable data 分类变量资料,Units;elements,2019/10/19,30,(一)数值变量资料 numerical variable data,用定量 方法测定观察单位(个体)某项指标数值的大小,所得的资料,称数值变量资料。也叫定量资料Quantitative data或计量资料,特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(10/

15、L);资料之间具连续性。,2019/10/19,31,(二)分类变量资料 categorical variable data,将观察单位按某种属性或类别分组,然后清点各组的观察单位数,所得的资料称分类变量资料也叫定性资料(Qualitative data),特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女),2019/10/19,32,1、无序分类(unordered categories),各类别之间有性质上的不同,而无程度上的差别。 二项分类 如临床某些检验结果用阳性或阴性反应表示,对一批某病患者检验完毕后,清点呈阳性或阴性反应的各有若干例。 多项分类 调

16、查某人群的血型分布,按照、四型分组。清点所得该人群的各血型组的人数是计数资料;,2019/10/19,33,2、有序分类资料(ordinal category data),各类别之间有性质上的差别,且排列有序,给人以“半定量”的概念,所以也叫等级资料 Rank data。 癌症分期:早、中、晚。 药物疗效:治愈、好转、无效、死亡。 尿蛋白: ,+,+,2019/10/19,34,实例数据1,2019/10/19,35,实例数据2,2019/10/19,36,(三) 变量间的转化,例:一组2040岁成年人的血压,以12kPa为界分为正常与异常两组,统计每组例数,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,数值变量资料,等级资料,分类变量资料

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号