《医学统计学课件PPT》由会员分享,可在线阅读,更多相关《医学统计学课件PPT(67页珍藏版)》请在金锄头文库上搜索。
1、医学统计学医学统计学Medical Statistics医学统计学讲授内容医学统计学讲授内容第一章第一章 绪论绪论第二章第二章 计量资料的统计描述计量资料的统计描述第三章第三章 总体均数的估计与假设检验总体均数的估计与假设检验第四章第四章 多个样本均数比较的方差分析多个样本均数比较的方差分析 第五章第五章 计数资料的统计描述计数资料的统计描述第六章第六章 几种离散型变量的分布及其应用几种离散型变量的分布及其应用第七章第七章 检验检验第八章第八章 秩转换的非参数检验秩转换的非参数检验第九章第九章 双变量回归与相关双变量回归与相关第十章第十章 统计表与统计图统计表与统计图第十一章第十一章 多因素试
2、验资料的方差分析多因素试验资料的方差分析第十二章第十二章 重复测量设计资料的方差分析重复测量设计资料的方差分析第十五章第十五章 多元线性回归分析多元线性回归分析第十六章第十六章 logistic回归分析回归分析第十七章第十七章 生存分析生存分析第十八章第十八章 判别分析判别分析第十九章第十九章 聚类分析聚类分析第二十三章第二十三章 常用综合评价方法常用综合评价方法第二十四章第二十四章 量表研制与量表资料的统计分析方法量表研制与量表资料的统计分析方法“非常痛心地看到,因为数据分析的缺陷和错误,那么多非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险好的生物研究工作
3、面临着被葬送的危险” ” 。 - - F. Yates,M.J.R. Healy 统计知识统计知识的运用的运用撰写论文:报告自己观撰写论文:报告自己观察或实验的研究结果。察或实验的研究结果。阅读论文:吸收新知识,阅读论文:吸收新知识,了解学术进展。了解学术进展。为什么要学医学统计学? 60年年代代到到80年年代代,国国外外医医学学杂杂志志调调查查表表明明:20%72%的的论论文文有有统统计错误。计错误。 1984年年对对中中华华医医学学杂杂志志、中中华华内内科科杂杂志志、中中华华外外科科杂杂志志、中中华华妇妇产产科科杂杂志志、中中华华儿儿科科杂杂志志595篇篇论论文文的的调调查查结结果为:果为
4、: 相相对对数数误误用用占占 11.2%,抽抽样样方方法法误误用用占占15.9%,统统计计图图表表误误用用占占11.7% 1996年年对对4586篇篇论论文文统统计计(中中华华医医学学会会系系列列杂杂志志占占6.9%),数数据据分析方法误用达分析方法误用达55.7%。 2001年年中中华华预预防防医医学学杂杂志志:中中华华医医学学会会系系列列杂杂志志误误用用约约54%(1995)。)。 1996年,有机构对申报科技成果的年,有机构对申报科技成果的4586篇科研论文分篇科研论文分析,统计方法使用率为析,统计方法使用率为76%。 医学论文中统计运用错误,除了影响论文的科学性,医学论文中统计运用错误
5、,除了影响论文的科学性,还可能导致严重的伦理学问题。还可能导致严重的伦理学问题。 为什么要学医学统计学? 英国统计学家英国统计学家R.A.Fisher(1890-1962)对遗传学家对遗传学家Mendel(1822-1884)杂交试验结果的评价杂交试验结果的评价:Mendel的豌豆杂交试验的豌豆杂交试验: 父本父本 母本母本第一代第一代 YG YG第二代第二代 Y/Y Y/G G/Y G/G杂交试验结果杂交试验结果:绿色种子的频率绿色种子的频率2001/8023期望值期望值=8023 0.25=2006, 标准差标准差=39Prop(2001.52011.5)=0.11, 结合结合Mendel
6、历次报告的其它实历次报告的其它实验结果验结果,每次都有如此好的吻合的概率约每次都有如此好的吻合的概率约10万分之万分之4。为什么要学医学统计学?绪论Introduction讲授内容:一、医学统计学的意义二、统计学中的几个基本概念三、统计资料的类型四、医学统计工作的基本步骤五、学习医学统计学应注意的问题一、医学统计学的意义1.统计学(statistics):应用数学的原理与方法,研究数据的搜集、整理与分析的科学,对不确定性数据作出科学的推断。2.医学统计学(statisticsofmedicine):统计学的原理与方法应用于医学科研与实践。一、医学统计学的意义3.统计学方法的特点:(1)用数量反
7、映质量1)体格检查(量血压、脉搏)个体健康质量2)考试分数个体学习质量3)期望寿命期望寿命反映人群健康状况的指标反映人群健康状况的指标 4) 婴儿死亡率婴儿死亡率反映卫生服务质量的指标反映卫生服务质量的指标.一、医学统计学的意义(2)用群体归纳个体请同学们回答:2002年长沙市7岁男孩有多高?1)7岁男孩身高有高有矮2)n=100,cm95%之间二、统计学中的几个基本概念1、研究单位(观察单位、unit)和 变量(variable)、变量值(valueofvariable)(1)、研究单位(unit):研究中的个体(individual),是根据研究目的确定的。二、统计学中的几个基本概念例如:
8、研究7岁男孩身高的正常值范围一个人研究大学生视力一只眼睛研究水污染情况一毫升水研究细胞变性一个细胞研究肝癌的地区分布一个地区二、统计学中的几个基本概念(2)变量(variable):研究单位的研究特征。例如:研究7岁男孩身高的正常值范围变量:身高(3)变量值(valueofvariable)二、统计学中的几个基本概念变量值(valueofvariable):变量的观察结果。例如:研究7岁男孩身高cm,118.6cm,121.8cm,)研究某人群性别构成变量值:男、女。二、统计学中的几个基本概念2、同质(homogeneity)和变异(variation)(1)、同质(homogeneity):
9、根据研究目的给研究单位确定的相同性质。研究长沙市2004年7岁男孩身高的正常值范围?同质:同长沙市、同7岁、同男孩、同无影响身高的疾病。二、统计学中的几个基本概念(2)、变异(variation)变异(variation):同质研究单位中变量值间的差异。例如:1)长沙市2004年7岁男孩身高有高有矮2)相同的药方治疗相同的疾病的病人,疗效有好有坏二、统计学中的几个基本概念3、总体(population)和样本(sample)(1)、总体(population):是根据研究目的确定的同质研究单位的全体。更确切地说是同质研究单位某种变量值的集合。例如:调查某地2002年正常成年男子的红细胞数的正常
10、值范围二、统计学中的几个基本概念研究单位:一个人变量:红细胞数同质:同某地、同2002年、同成年男子、同正常。总体:1)某地所有的正常成年男子2)某地所有的正常成年男子的红细胞数二、统计学中的几个基本概念1)有限总体(finitepopulation):研究单位数是有限的例如:调查某地2002年正常成年男子的红细胞数的正常值范围2)无限总体(infinitepopulation):研究单位数是无限的例如:高血压患者无时间、空间限制。二、统计学中的几个基本概念(2)样本(sample):是总体中抽取的有代表性的一部分。注意:随机抽样(无主观性)样本含量(samplesize):样本中包含的研究单
11、位数。例如:某药治疗高血压患者30名样本含量(n)为30二、统计学中的几个基本概念4、参数(parameter)和统计量(statistic)(1)参数(parameter):根据总体个体值统计计算出来的描述总体的特征量。一般用希腊字母表示(2)、统计量(statistic):根据样本个体值统计计算出来的描述样本的特征量。一般用拉丁字母表示二、统计学中的几个基本概念总体参数一般是不知道的统计学抽样研究的目的就是:样本统计量总体参数二、统计学中的几个基本概念5、系统误差(systematicerror)、非系统误差(nonsystematicerror)、抽样误差(samplingerror)误
12、差(error)是指实际观察值与观察真值之差、样本指标与总体指标之差。二、统计学中的几个基本概念(1)、系统误差(systematicerror):由于仪器未校正、测量者感官的某种障碍、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值两侧,而是有方向性、系统性或周期性地偏离真值。例如:测量血糖,有斑氏法和葡萄糖氧化法,斑氏法的测量结果偏高易受体内还原性物质的影响。二、统计学中的几个基本概念这类误差可以通过实验设计和技术措施实验设计和技术措施来消除或使之减少。观察性研究由于组间不可比性产生的系统误差称为偏倚(bias),如吸烟组的平均年龄大于吸烟组,两组死亡率的差异包含年龄偏倚。二、统计
13、学中的几个基本概念(2)、非系统误差(nonsystematicerror)由于研究者偶然失误而造成的误差。例如:仪器失灵、抄错数据、点错小数点、写错单位等,亦称过失误差(grosserror)这类误差应当通过认真检查核对予以清除,否则将会影响研究结果的准确性。二、统计学中的几个基本概念(3)、抽样误差(samplingerror):由于抽样所造成的样本统计量与总体参数的差别。例如:cmn=100N=5cm特点:1)不可避免性2)有统计规律性二、统计学中的几个基本概念产生原因:个体差异(生物变异)二、统计学中的几个基本概念6、频率(relativefrequency)、概率(probabili
14、ty)、小概率事件(1)、频率(relativefreguency):一次随机试验有几种可能结果,在重复进行试验时,个别结果看来是偶然发生的,但当重复试验次数相当多时,将显现某种规律性。例如,投掷一枚硬币,结果不外乎出现“正面”与“反面”两种,现在,我们看一掷币模拟试验:二、统计学中的几个基本概念实验者投掷次数出现“正面”次数频率HuPingchengHuPingchengHuPingchengHuPingchengHuPingchengHuPingchengHuPingcheng740.5714Buffon二、统计学中的几个基本概念可见,在相同条件下重复试验,试验结果为“正面”或“反面”虽不
15、能事先断定,但我们知道试验的所有可能结果只有两种。 在重复多次后,出现“正面” 或“反面”这个结果的比例称之为频率。二、统计学中的几个基本概念(2)、概概率率(probability) 概概率率是是度度量量随机事件发生可能性大小的一个数值。随机事件发生可能性大小的一个数值。 设设在在相相同同条条件件下下,独独立立地地重重复复n次次试试验验,随随机机事事件件A出出现现 次次,则则称称 为为随随机机事事件件A出出现现的的频频率率。当当n逐逐渐渐增增大大时时, 频频率率 趋趋向向于于一一个个常常数数,则则称称该该常常数数为为随随机机事事件件A的的概概率率,可可记记为为 P(A) ,简简记记为为 。
16、0P(A)1二、统计学中的几个基本概念0P(A)1随机事件P(A)=1必然事件P(A)=0不可能事件。二、统计学中的几个基本概念频率是就样本而言的,而概率从总体的意义上说的,m/n是概率 p(A) 的估计值。试验次数越多,估计越可靠。二、统计学中的几个基本概念(3)小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将称为小概率事件,我们认为小概率事件在一次试验中不可能发生。二、统计学中的几个基本概念湖南风采:中奖概率大约为:1/671万交通事故:发生概率为:1/20万三、统计资料的类型变量与统计资料的分类方法.数值变量(numericalvariable)和计量资料(mea
17、surementdata).无序分类变量(unorderedcategoriesvariable)和计数资料(enumerationdata).有序分类变量(ordinalcategoriesvariable)和等级资料(rankeddata)三、统计资料的类型1.概述数值变量数值变量.构成计量资料构成计量资料分类变量无序分类变量无序分类变量.构成计数资料构成计数资料 有序分类变量有序分类变量.构成等级资料构成等级资料三、统计资料的类型.数值变量与计量资料1).数值变量(numericalvariable):变量值是定量的,表现为数值大小,一般有度量衡单位。如:身高(cm)、体重(kg)、血压
18、(pa)、坐高/身高。2).计量资料(measurementdata):由一群个体的数值变量值构成的资料,即一群变量值。cm,118.6cm,121.8cm)三、统计资料的类型3.无序分类变量与计数资料1).无序分类变量(unorderedcategoriesvariable):变量值是定性的,有类别。特点:类别是客观存在的,各类无秩序,可任意排列;类与类之间界限清楚,(理论上)不会错判。如:性别:男、女。血型:O、A、B、AB。2).计数资料(enumerationdata):一群个体按无序分类变量的类别清点每类有多少个个体,即分类个体数。如:卫生统计学教研室教师性别构成:男:,女:7。某人
19、群血型构成:O:20A:35B:30AB:10三、统计资料的类型4.有序分类变量与等级资料1).有序分类变量(ordinalcategoriesvariable):变量值是定性的、分等级。特点:等级是主观划分的,各级没有大小但有秩序,必须从低到高或由高到低;级和级之间界限模糊,可能错判。如:疗效:无效、好转、显效、治愈。血清反应:、+、+、+2).等级资料(rankeddata):一群个体按有序分类变量的级别清点每级有多少个个体,即分级个体数。如:某地某人群EB病毒抗体反应:+:+:+:四、医学统计工作的基本步骤1、设计(design)专业设计统计设计调查设计医学科研设计实验设计临床实验设计医
20、学科研设计的程序医学科研设计的程序科科研研选选题题: : 选选题题又又叫叫立立题题,确确定定所所要要研研究究的的问问题。题。选题是科研的起点,也是关系到成败的关键。选题是科研的起点,也是关系到成败的关键。(1 1)题意产生:)题意产生:( (综述综述) ) 背景材料来源:个人经验的积累;背景材料来源:个人经验的积累; 向有关专家请教向有关专家请教 ; 文献检索文献检索等等. .专业设计文献检索的要点文献检索的要点(1 1)有助于认识本课题的重要性)有助于认识本课题的重要性(2 2)了解有关的既往研究工作情况)了解有关的既往研究工作情况(3 3)了解有关研究现状)了解有关研究现状(4 4)寻找可
21、借鉴的研究方法)寻找可借鉴的研究方法(5 5)注意有关的不同见解与争论。)注意有关的不同见解与争论。 如:与如:与*商榷类文章商榷类文章专业设计文献检索的几种查法文献检索的几种查法(1 1) 先查国内文献,再查国外文献先查国内文献,再查国外文献(2 2) 先查综述性文章,后原始文章。先查综述性文章,后原始文章。(3 3) 先近期后远期先近期后远期(4 4) 先核心期刊后一般期刊。先核心期刊后一般期刊。专业设计 综述性文章:是收集大量文献资料经综述性文章:是收集大量文献资料经过分析综合,结合自己的工作和体会整理过分析综合,结合自己的工作和体会整理成的文章。它是对某一课题或新进展作出成的文章。它是
22、对某一课题或新进展作出的总结,并指明发展方向,有较大的参考的总结,并指明发展方向,有较大的参考价值,是专题性文献资料最集中的表现形价值,是专题性文献资料最集中的表现形式。式。 专业设计科研选题的原则科研选题的原则(1 1)创创新新性性:包包括括探探索索和和创创新新两两个个连连续续的的过过程程,创创新新就就是是选选择择前前人人没没有有解解决决或或没没有有完完全全解解决决的的问问题题。是是本本学学科科的的空空白白点,或者将会在理论上或应用上有新的发展和补充。点,或者将会在理论上或应用上有新的发展和补充。(2 2)科学性)科学性:以科学理论为指导,符合客观规律。:以科学理论为指导,符合客观规律。(3
23、 3)先先进进性性:先先进进性性是是相相对对的的,有有国国际际先先进进和和国国内内先先进进。 更重要的是结合实际条件选择适合的先进技术。更重要的是结合实际条件选择适合的先进技术。(4 4)可可行行性性:研研究究课课题题的的主主要要技技术术指指标标实实现现的的可可能能性性。它它包括人、财、物的支持和工作基础。包括人、财、物的支持和工作基础。 专业设计选题方法选题方法(1 1) 从招标范围中选题。从招标范围中选题。(2 2) 从碰到的问题中选题从碰到的问题中选题(3 3) 从文献的空白点选题从文献的空白点选题(4 4) 从已有的课题延伸中选题从已有的课题延伸中选题(5 5) 从改变研究内容组合中选
24、题从改变研究内容组合中选题(6 6) 从其他学科移植中选题。从其他学科移植中选题。专业设计四、医学统计工作的基本步骤统计设计的内容要包括资料的收集、整理和分析全过和的设想和安排。例如:研究目的和假说?研究对象和研究单位?研究因素(变量)?收集哪些原始资料?用什么方式和方法取得这些原始资料?怎样整理汇总和计算统计指标?如何控制误差?预期会得到什么结果?需要多少经费?统统计设计四、医学统计工作的基本步骤在研究者对统计设计的构思过程中,有以下几个问题最为关键:如如何何进进行行抽抽样样?如如何何安安排排设设计计所所规规定定的的 干干预预措施或称处理(措施或称处理(treatment)。)。要达到研究目
25、的应抽取多少个观察单位?要达到研究目的应抽取多少个观察单位?如如何何在在诸诸多多的的影影响响因因素素中中,分分离离出出研研究究同同素素对对结果的效应?结果的效应?统计设计四、医学统计工作的基本步骤(1)、对照的原则 对照(control)原则,即在均衡条件下实现实验组与对照组间科学对比的原则,它回答如何从诸多影响因素中,分离出研究因素对实验结果的效应问题。所谓均衡性,即可比性,是指在对比组中,除研究因素不同外,或施加的处理不同外,其他影响实验结果的非研究因素,包括实验过程中的实验条件和辅助措施,都应相同。统计设计无对照的研究夸大了门腔分流手术的作用无对照的研究夸大了门腔分流手术的作用表表1-2
26、1-2 关于门腔分流手术的关于门腔分流手术的5151次研究结果次研究结果对照方式对照方式 门腔分流手术的价值门腔分流手术的价值 小计小计 非常支持非常支持支持支持 不支持不支持 无对照无对照 24 7 1 32 非随机对照非随机对照 10 3 2 15 随机对照随机对照 0 1 3 4 合合 计计 3411 6 51 统计设计统计学家统计学家 Student 1930年年2月至月至6月月主持的牛奶营养主持的牛奶营养试验的现场观察试验的现场观察研究:研究:对照组(对照组(1万儿童)万儿童)饮奶组(饮奶组(1万儿童)万儿童)对照组对照组饮奶组饮奶组 年龄(岁)年龄(岁) 体体重重(磅磅)结论:对照
27、组体重饮奶组结论:对照组体重饮奶组统计设计四、医学统计工作的基本步骤(2)、重复(repetition)的原则重复(repetition)原则,即确定样本含量的原则,它回答至少应抽取多少个观察单位的问题。统计设计四、医学统计工作的基本步骤(3)、随机化(randomization)的原则1)、随机抽样(randomizedsampling):指总体中的每一个观察单位都有同等机会进入样本;2)、随机分配(randomizedallocation):指本次研究所选定的实验受试对象都有同等机会进入根据研究目的而设定的处理组和对照组。统计设计四、医学统计工作的基本步骤2、收集资料(collection
28、ofdata)(1)资料来源第一手资料 1)经常性:统计报表(传染病报表、职业病报表、 医院工作报表、死亡登记、疫情报告等),工作记录(卫生监督记录、健康检查记录、病历等); 2) 一时性:专题调查、实验或临床试验。第二手资料:已公布的资料,如数据银行、全国、全省卫生统计资料。 四、医学统计工作的基本步骤(2)、资料要求1)完整:观察单位及观察项目完整。2)准确:即真实、可靠。真实是统计学的灵魂。3)及时:即时限性。如人口普查规定调查开始日期和截止日期。四、医学统计工作的基本步骤3、整理(sortingdata)资料 整理资料即原始数据的条理化、系统化的过程。DataCollectionMai
29、n Data AnalysisDataScreening Time consuming ,even tedious Fundamental to an honest analysis of the dataTheissuesshouldbeconcernedindatascreeningTheaccuracyofthedataMissingdataOutliersThefitbetweenyourdataandtheassumptionsPerfectornear-perfectcorrelationsamongvariables四、医学统计工作的基本步骤4、分析(analysisofdata
30、)资料任务:计算有关指标,反映数据的综合特征、阐明事物的内在联系和规律。工具:1)foxbase数据库2)spss3)SAS四、医学统计工作的基本步骤统计描述统计分析统计推断参数估计假设检验五、学习医学统计学应注意的问题1、医学统计学研究的是群体的数量特征适当的统计指标2、学会统计学的思维方法抽样研究抽样误差结论具有概率性医学专业知识解释五、学习医学统计学应注意的问题3、正确选用统计学方法(1)资料类型不同统计学方法不同(2)设计类型不同统计学方法不同(3)研究目的不同统计学方法不同.五、学习医学统计学应注意的问题4、不管公式来源、推导,只要求了解其意义、用途和应用条件。举例:1)看电视,知道开、关就行。2)牛吃的是草,挤出来的是牛奶。数据结果THANK YOU !