《医学统计学绪论课件》由会员分享,可在线阅读,更多相关《医学统计学绪论课件(54页珍藏版)》请在金锄头文库上搜索。
1、绪论 IntroductionMedical statistics医学统计学2 Outline1234什么是医学统计学?一些重要的基本概念如何学好医学统计学?总结3统计学(Statistics)Statistics is the science dealing with the collections, analysis, interpretation and presentation of masses of numerical data. (Webster 国际大词典)Statistics is the science and art of dealing with variation i
2、n data through collection, classification and analysis in such a way as to obtain reliable result. 研究数据数据的收集,整理和分析的一门科学。4l统计学是一门以社会现象统计学是一门以社会现象总体数量方面总体数量方面为对象的为对象的方法论科学,是研究如何有效地收集、整理和分方法论科学,是研究如何有效地收集、整理和分析受析受随机影响随机影响的数据,并对所考察的问题作出的数据,并对所考察的问题作出推推断或预测断或预测,直至为采取决策和行动提供依据和建,直至为采取决策和行动提供依据和建议的一门学科。议的一
3、门学科。5统计是什么?What is Statistics?l若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。 Florence Nightingale 1820一19106数据处理的工具和技能数据处理的工具和技能7天气预报生活中的统计学投机取巧投机取巧8人类学文学经济学史学地理学物理学社会学农学生物学医学药学中医学气象学法学医学统计学 Medical Statistics卫生统计学 Health Statistics生物统计学 Biostatistics科研中的统计学9医学统计学 医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整
4、理、分析和推断的一门科学。医学统计学(Medical Statistics)10为什么要学医学统计学?1. 采用统计学方法,采用统计学方法,发现不确定现象背发现不确定现象背后隐藏的规律。后隐藏的规律。最大值=6.18, 最小值=3.29, 极差=2.89。 算术均数=4.72,标准差=0.57。变异(变异(variation)是社会和生物)是社会和生物医学中的普遍现象。医学中的普遍现象。 变异使得实验或观察的结果具有变异使得实验或观察的结果具有不确定性。不确定性。11l2. 2. 用统计学思维方式考虑有关医学研究中的问题用统计学思维方式考虑有关医学研究中的问题l3. 3. 保证你的研究论文能通
5、过统计学审查保证你的研究论文能通过统计学审查 国际生物医学杂志编辑协会在其国际生物医学杂志编辑协会在其生物医学期刊投稿的统一要求生物医学期刊投稿的统一要求中也包含了统计学要求(中也包含了统计学要求(Uniform Requirements for ManuscriptsUniform Requirements for Manuscripts Submitted to Biomedical Journals Submitted to Biomedical Journals) http:/ www.acponline.orghttp:/ www.acponline.orgl4. 4. 获得获得循证
6、医学循证医学证据的主要手段证据的主要手段 “良好愿望的医学良好愿望的医学”(well-meaning medicine)转入)转入“以证据为基础的医学以证据为基础的医学” (evidence-based medicine,EBM)需要有统计学方法的支持。)需要有统计学方法的支持。为什么要学医学统计学?12l几十年来不少国内外的有识之士对各种刊物进行过调查,几十年来不少国内外的有识之士对各种刊物进行过调查,评价本期刊或某些期刊在一定时限内有百分之几的论文应评价本期刊或某些期刊在一定时限内有百分之几的论文应用研究设计或统计分析不恰当,甚至没有进行研究设计和用研究设计或统计分析不恰当,甚至没有进行研
7、究设计和统计分析。不合格率大多在统计分析。不合格率大多在30%60%之间。这个数字几之间。这个数字几十年来几乎没有变化!十年来几乎没有变化! l中华心血管病杂志中华心血管病杂志第第37卷第卷第7期(期(2009年年7月)载文对月)载文对本期刊第本期刊第35卷第卷第12期期第第36卷第卷第11期共期共200篇论文作了检查,篇论文作了检查,发现其中应用医学统计方法不当者有发现其中应用医学统计方法不当者有49篇,接近篇,接近1/4,而出,而出现各种错误或欠缺者则达现各种错误或欠缺者则达101篇,占半数。篇,占半数。 13医学研究的三个步骤1. 1. 研究设计研究设计3. 3. 结论结论2. 2. 资
8、料分析资料分析统计学推断统计学推断专业推断专业推断结合结合假设假设实验或调查获得数据实验或调查获得数据l运用医学统计学的起点,也是高质量地完成整个研究的重要基础。l在数据分析的基础上,应用统计学处理的结果,进行统计学推断;同时,依据相应的专业知识,作出专业性的结论。l在研究设计基础上,通过实验(试验)或调查,将所得数据进行统计学处理的过程。14一些基本概念l同质和异质l变异l总体和个体l参数和统计量l随机l概率和频率l小概率事件和小概率原理l抽样误差l变量的分类15基本概念之一:同质和异质l同质(homogeneity): 性质相同l异质(heterogeneity):性质不同同质和异质是相对
9、的概念不同质的个体不能笼统地混在一起分析个体的同质性是构成研究总体的必备条件研究内容(指标/变量)不同,对同质性的要求不同16在研究事物的形状时同质和异质示例在研究事物的颜色时17基本概念之二:变异 l同质事物之间的差别称为变异(Variation)l变异的两个方面:l不同观察单位(个体)间的差别l同一个体在不同阶段的差别(重复测量)18变异示例发热者体温波动正常人体温波动19基本概念之二:变异l同质个体间的差异。l结果是随机的,不可预测的。l一种或多种不可控因素(已知的或未知的)作用下的综合表现。l个体变异是普遍存在的。l个体变异是有规律的。l没有个体变异,就没有统计学!20基本概念之三:总
10、体、个体和样本 l总体(population): 按研究目的所确定的同质研究对象某项观察指标的全体,即全体观察单位。有限总体(finite)无限总体(infinite)l个体(individual): 是构成总体的最基本观察单位;l样本(random sample): 从研究总体中随机抽取具有代表性的部分观察单位。l代表性,包含了总体的特性 为什么要抽样?21基本概念之四:参数和统计量 总体参数(population parameter)l未知的,固有的,不变的,需要研究的!样本统计量(sample statistic)l已知的,变化的,有误差的!样本含量(sample size)22总体参数
11、(population parameter)总体的特征值称为参数。l未知的,固有的,不变的l需要研究的23样本统计量(sample statistic)在总体被确定之后,总体参数就是一个常数,是不会变化的,不管你是否确切知其大小;而统计量是几乎总是随着样本而变的。由样本所算出的统计指标或特征值称为统计量(statistic) 。l已知的,变化的,有误差的!24样本含量(sample size)样本中包含个体的数量。 25基本概念之五:随机l随机(random):是指机会均等,无主观影响,目的是保证样本对总体的代表性、可靠性l机会均等,无主观影响l抽样随机(random sampling) 有相
12、同的机会被抽到l分组随机(random allocation) 有相同的机会被分到不同的组中l顺序随机(random order) 有相同的机会先后接受处理26基本概念之六:频率和概率l频率 Relative frequency :在n次随机试验中,事件A发生了m次,则比值称为事件A在这n次试验中出现的频率27基本概念之六:频率和概率抛硬币试验在概率的统计学定义上的诠释试验者投掷次数出现“正面”次数频率X X X20120.6000Buffon404020480.5069De Morgan 409220480.5005Fisher1000049790.4979K.Pearson12000601
13、90.5016K.Pearson24000120120.500528基本概念之六:频率和概率l概率的统计学定义: 数理统计学中的大数定理表明:当观察次数n越来越大,频率f 的随机波动幅度越来越小,并最终趋向于一个常数p:随机事件A发生的概率 (Probability)。l概率描述事件发生可能性大小的一个度量 。是一种参数。常用P来表示;0P 129基本概念之六:频率和概率l概率的古典定义:有限个(N)可能结果(A1,A2,A3AN);每个结果出现的机会相同;任一次试验中,至少出现一种可能的结果;任一次试验中,只出现一种可能的结果;则在某次试验中,出现某一个结果的可能性为1/N,出现某M个结果中
14、的一个的概率为M/N 30基本概念之六:频率和概率抛硬币试验在概率的统计学定义上的诠释每次投掷两枚硬币A和B,出现的四种可能A正B正、A反B正、A正B反、A反B反其概率都是1/4。每次试验肯定会出现上述四种结果中的一个,且仅会出现一个。31基本概念之七:小概率事件l小概率事件小概率事件(rare event)(rare event) 当某事件发生的概率很小(可能性很小),统计学上称该事件为小概率事件。 医学上:小于或等于0.05l小概率原理小概率原理 小概率事件并不表示不可能发生,但在某一次试验中,是不会发生的。32l抽样误差(sampling error)由抽样引起的样本统计量与总体参数间的
15、差别。原因:个体变异抽样表现:l样本统计量与总体参数间的差别l不同样本统计量间的差别抽样误差是有规律的! 基本概念之八:抽样误差 33基本概念之九:变量的分类 观察对象个体的特征或测量的结果。 个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,称为随机变量,简称变量(variable),变量的取值称为变量值或观察值。 34第一种分类(三类资料)(1) 定量资料(quantitative data) 以定量值表达每个观察单位的某项观察指标,如血脂、心率等。特点:l 各观察单位间只有量的差别;l 数据间有连续性。 35(2) 定性资料(qualitative data) 以定性方式表达每
16、个观察单位的某项观察指标,如血型、性别等。特点:l 各观察单位间或者相同,或者存在质的差别;l 有质的差别者之间无连续性。 第一种分类(三类资料)36(3) 等级资料(ranked data,ordinal data)以等级表达每个观察单位的某项观察指标,如疗效分级、心功能分级等。特点: 各观察单位间或者相同,或者存在质的差别; 各等级间只有顺序,而无数值大小,故等级之间不可度量。第一种分类(三类资料)37资料类型的判断病例号年龄(岁)性别身高(cm)血型心电图尿WBC职业RBC1012/L135女1.65A正常教师4.67244男1.74B正常工人5.21326男1.80O正常职员4.104
17、25女1.61AB正常农民3.92541男1.71A异常+工人3.49645女1.58B正常+工人5.48750女1.60O异常+干部6.78828男1.76AB正常+干部7.10931女1.62O正常军人5.2438l按照取值的特性:数值变量 Numerical Variable 定量变量:既有顺序的意义,又有间隔的意义,可以认为是连续的;往往有单位;取值间的差异是可以度量的分类变量 Categorical Variable :取值是是分散、定性的,表现为互不相容的类别和属性l无序分类 Unordered Categorical定性变量: 无顺序,无间隔,仅有分类二项分类多项分类l有序分类
18、Ordered Categorical 等级变量:仅有顺序,无单位;取值间的差异是不可度量的第二种分类(两类资料)39 数值变量资料(numerical variable) 分类资料(categorical variable) 二分类(binary( dichotomous) variable) 多分类(polytomous variable )无序多分类(multinomial)有序多分类(ordinal)(等级资料,ranked data)第二种分类(两类资料)40资料类型的判断病例号年龄(岁)性别身高(cm)血型心电图尿WBC职业RBC1012/L135女1.65A正常教师4.67244
19、男1.74B正常工人5.21326男1.80O正常职员4.10425女1.61AB正常农民3.92541男1.71A异常+工人3.49645女1.58B正常+工人5.48750女1.60O异常+干部6.78828男1.76AB正常+干部7.10931女1.62O正常军人5.2441数学上的分类l连续性资料(continuous data) l离散型资料(discrete data) 42基本概念之九:变量的分类l不同分类的互相转化 定量资料(数值变量)定性资料(无序分类变量)定量资料(数值变量)等级资料(有序分类变量)等级资料(有序分类变量)定性资料(无序分类变量) 信息量只有减少,不可增加4
20、3基本概念汇总总体个体、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风 险44医学统计学思维l归纳型思维 推理型思维l从样本到总体 l从个别到一般45建立医学统计学思维 l生物体的变异是普遍存在的,这种变异是有规律的;l抽样误差是不可避免的,抽样误差是有规律的;l统计推断是有风险的,这种风险是可以控制的。46统计学的作用l工具l发现规律,而不是创造规律l概率论:规律性中的随机性l统计学:随机性中的规律性47总结l基本概念:统计学,统计学研究的步骤统计资料的分类同质、变异总体、个体、样本总体参数、样本统计量、样本含量随机概率、小概率事件、小概率原理抽样误差变量的分类48
21、学习医学统计学的要求l建立统计学思维学会从不确定性、机遇、风险和推断的角度去思考医学问题提高自身的科学素质和医学研究能力;l学会设计结合专业作出严密的试验设计并获得可靠、准确、完整的资料;l学会分析与表达学会运用统计方法充分挖掘资料中蕴含的信息,恰如其分地进行理性概括,写出具有科学认证的研究报告和学术论文。49如何学好医学统计学l培养归纳推理型思维:从特殊推断一般,从个体推断总体,有犯错误的可能 日常演绎推理型思维:从一般到特殊l时刻牢记变异的客观存在和其规律的客观存在性。l对数据的态度:严肃、认真、实事求是。学术道德l正确应用所学到的公式和方法。不生搬硬套。在做习题的时候耐心体会。l统计学是发现规律而非发明规律。l以医学理论作为指导。反对唯数字论。l正确认识统计软件的作用。50统计软件lSASlSPSSlSTATA515253SPSS统计软件54