医学统计学:第一章 绪论

上传人:汽*** 文档编号:570164769 上传时间:2024-08-02 格式:PPT 页数:52 大小:441KB
返回 下载 相关 举报
医学统计学:第一章 绪论_第1页
第1页 / 共52页
医学统计学:第一章 绪论_第2页
第2页 / 共52页
医学统计学:第一章 绪论_第3页
第3页 / 共52页
医学统计学:第一章 绪论_第4页
第4页 / 共52页
医学统计学:第一章 绪论_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《医学统计学:第一章 绪论》由会员分享,可在线阅读,更多相关《医学统计学:第一章 绪论(52页珍藏版)》请在金锄头文库上搜索。

1、医学统计学医学统计学 第一章第一章 绪论绪论一 统计学介绍n1 统计学(Statistics)统计学是一门以社会现象总体数量方面为统计学是一门以社会现象总体数量方面为对象的方法论科学,是研究如何有效地对象的方法论科学,是研究如何有效地收集、整理和分析受随机影响的数据,收集、整理和分析受随机影响的数据,并对所考察的问题作出推断或预测,直并对所考察的问题作出推断或预测,直至为采取决策和行动提供依据和建议的至为采取决策和行动提供依据和建议的一门学科。一门学科。统计学nWebster: Statistics is the science dealing with the collections, an

2、alysis, interpretation and presentation of masses of numerical data.nArmitage:Statistics is the science and art of dealing with variation in data through collection, classification and analysis in such a way as to obtain reliable result. 2.统计学的发展历史A)古典统计学时期17世纪中叶至18世纪中叶统计学萌芽时期,有记述学派和政治算术学派。(1)记述学派或国

3、势学派 创始人是德国的康令(H.Coning,1606-1681)和阿亨瓦尔(G.Achenwall,1719-1772)很少进行数量方面的研究,未涉及统计学的实质。(2)政治算术学派创始人是英国的威廉配第(W.Petty,1623-1687),用计量方法以及对比法综合研究社会经济问题。B)近代统计学时期18世纪末至19世纪末,主要有数理统计学派和社会统计学派。(1)数理统计学派产生于19世纪中叶,在概率论的基础上形成,奠基人为比利时的凯特勒(A.Quetelet,1796-1874)提出了误差理论。(2)社会统计学派19世纪后半叶,德国克尼斯(K.G.A.Knies,1821-1898)首创

4、,认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学。C)现代统计学时期20世纪初至今。同自然科学、工程技术科学紧密结合,进入了统计学发展的鼎盛时期。n英国的Gosset(1876-1937)提出了小样本理论。n波兰的Neyman(1894-1981)建立了统计假设理论。n美国的Wald(1902-1952)创立了决策理论。n美国的Cochran(1909-1980)提出了实验设计的理论和方法。3.医学统计学医学统计学以医学为指导,用统计学的原理和方法研以医学为指导,用统计学的原理和方法研究医学的一门应用科学。究医学的一门应用科学。包括:包括:研究设计研究设计 资料分析资料分

5、析n医学统计学 Medical Statisticsn卫生统计学 Health Statisticsn生物统计学 Biostatistics4.医学科研中统计学的作用医学科研中统计学的作用吸烟危害健康的论证吸烟危害健康的论证:Muller(1939)采用病例对照设计搜集到一组肺癌患者,采用病例对照设计搜集到一组肺癌患者,并寻找一组其它特点相类似的非肺癌患并寻找一组其它特点相类似的非肺癌患者作为对照组,逐一询问是否吸烟、吸者作为对照组,逐一询问是否吸烟、吸烟量、吸烟时间,发现肺癌组吸烟率高,烟量、吸烟时间,发现肺癌组吸烟率高,对照组低。由此得出吸烟有害健康的结对照组低。由此得出吸烟有害健康的结论

6、。论。但统计学权威但统计学权威Berkson认为,吸烟能认为,吸烟能提高许多种死因下的死亡率,这一点提高许多种死因下的死亡率,这一点不可理解。除非有证据证明吸烟对整不可理解。除非有证据证明吸烟对整体健康有害或加速老化,否则会怀疑体健康有害或加速老化,否则会怀疑是对照组的选择及资料搜集带来的偏是对照组的选择及资料搜集带来的偏倚所致。倚所致。nFisher认为:已有的研究不能排除遗传认为:已有的研究不能排除遗传的因素,也许有些人具某种遗传因素,的因素,也许有些人具某种遗传因素,既爱吸烟,又易得癌,而没有此因素者既爱吸烟,又易得癌,而没有此因素者既厌吸烟,又难得癌。如果真是如此的既厌吸烟,又难得癌。

7、如果真是如此的话,戒烟就没有意义了。话,戒烟就没有意义了。瑞典的双生研究,调查了一方吸烟另瑞典的双生研究,调查了一方吸烟另一方不吸烟同卵双生男一方不吸烟同卵双生男274对,女对,女264对,异卵双生男对,异卵双生男733对,女对,女653对对吸烟与不吸烟相比,咳嗽的相对危险吸烟与不吸烟相比,咳嗽的相对危险度约度约1.8-2.5倍倍MMSE分组的两组分组的两组PD患者疾病特征比较患者疾病特征比较特特 征征MMSE正常正常(n=13)MMSE异常异常(n=11)检验值P值年年龄(年)(年)73.97.566.27.22.5640.018*病程(年)病程(年)3.64.23.91.5-0.2930.

8、772Hoehn-Yahr1.70.62.10.7-1.4670.157UPDRS-motor26.98.534.512.3-1.7880.088简易智能状态检查量表简易智能状态检查量表(Mini-Mental State Examination,MMSE)年龄是年龄是MMSE异常的危险因素?异常的危险因素?统计软件nSASnSPSSnSTATAnBMDP二二.统计工作的步骤统计工作的步骤1.设计设计(design)要对所作工作的全过程有一个全面的设想,要对所作工作的全过程有一个全面的设想,明确研究的目的,对研究的事物有一定明确研究的目的,对研究的事物有一定的了解(可以通过查阅文献资料或作预的

9、了解(可以通过查阅文献资料或作预试验来实现)。试验来实现)。如:要研究什么?如:要研究什么?收集什么资料?收集什么资料?如何收集?如何收集?人力财力条件可否?人力财力条件可否?观察对象和观察单位是什么?怎样汇总资料?观察对象和观察单位是什么?怎样汇总资料?计算哪些统计指标?计算哪些统计指标?样本例数是多少?样本例数是多少?预期结果怎样?预期结果怎样?2.收集资料收集资料(collection of data)取得准确完整的原始数据。取得准确完整的原始数据。资料来源有:资料来源有:统计报表统计报表 工作记录(病历或化验报告单)工作记录(病历或化验报告单) 调查或实验结果。调查或实验结果。3.整理

10、资料整理资料(sorting data)将原始数据系统化条理化,即数据的预处将原始数据系统化条理化,即数据的预处理。理。4.分析资料分析资料(analysis of data)计算有关统计指标,阐明事物的内在联系计算有关统计指标,阐明事物的内在联系和规律,包括统计描述和统计推断。和规律,包括统计描述和统计推断。三三.统计中的几个概念统计中的几个概念1 变量变量(variable)收集资料中确定了的观察单位称为个体,在统计收集资料中确定了的观察单位称为个体,在统计工作中反映个体的特征称为变量。工作中反映个体的特征称为变量。如要调查某地中学生的健康状况,每一个要调查如要调查某地中学生的健康状况,每

11、一个要调查的学生称为个体,反映中学生的健康指标身高、的学生称为个体,反映中学生的健康指标身高、体重、胸围、肺活量、体温、脉搏数、血压等体重、胸围、肺活量、体温、脉搏数、血压等都称作为变量。又如病人的年龄、性别、红细都称作为变量。又如病人的年龄、性别、红细胞数、血红蛋白含量、患病时间等。胞数、血红蛋白含量、患病时间等。变量的观察值(观察结果)可以是定变量的观察值(观察结果)可以是定量的也可以是定性的,可分为量的也可以是定性的,可分为数值变量数值变量:可以度量大小,如血压等:可以度量大小,如血压等分类变量分类变量 无序变量无序变量:血型、性别:血型、性别 有序变量有序变量:如测定某人群:如测定某人

12、群血清反应分血清反应分-、+、+、+四级四级2.总体和样本总体和样本(population and sample)n总体是根据总体是根据研究目的研究目的确定的确定的同质的同质的研研究对象的究对象的全体全体n总体分有限总体和无限总体总体分有限总体和无限总体n样本是从总体中样本是从总体中随机随机抽取的抽取的部分部分观察观察单位单位如研究某地如研究某地2010年的正常成人的血压值,年的正常成人的血压值,现随机抽取现随机抽取150人,分别测定其血压人,分别测定其血压值,则该地值,则该地2010年全部正常成人的血年全部正常成人的血压值就构成了一个总体,这压值就构成了一个总体,这150人的人的血压值就是样

13、本。血压值就是样本。n统计推断就是要从样本信息去推断总统计推断就是要从样本信息去推断总体特征体特征n样本要具代表性,须:样本要具代表性,须:随机抽取随机抽取 例数足够多。例数足够多。同质(homogeneous)n具有相同性质的事物称为同质的。否则称为异质的或者间杂的(heterogeneous)。n同质和异质是相对的概念n不同质的个体不能笼统地混在一起分析3.同质与变异(同质与变异(homogeneity and variation)在研究事物的形状时同质和异质示例在研究事物的颜色时n变异(变异(variation)是指在相同条件下同类事是指在相同条件下同类事物的观察单位在同一指标上的差别。

14、物的观察单位在同一指标上的差别。n结果是随机的,不可预测的n一种或多种不可控因素(已知的或未知的)作用下的综合表现n个体变异是普遍存在的n个体变异是有规律的n没有个体变异,就没有统计学!统计分析的任务就是在同质分组的基础上,统计分析的任务就是在同质分组的基础上,通过对变异所呈现出的统计规律性的研通过对变异所呈现出的统计规律性的研究,透过偶然现象,揭示同质事物的本究,透过偶然现象,揭示同质事物的本质特征和规律质特征和规律4.随机(Random )n随机 :是指机会均等,目的是保证样本对总体的代表性、可靠性n随机抽样 有相同的机会被抽到n随机分组 有相同的机会被分到不同的组中n顺序随机5.概率(概

15、率(probability)概率是描述某事件发生的可能性大小的一概率是描述某事件发生的可能性大小的一个度量。个度量。如抛一枚均匀的硬币,如抛一枚均匀的硬币,“正面正面”朝上的概率为朝上的概率为50%。对于结果不确定的现象,每一种可能结果对于结果不确定的现象,每一种可能结果都是一个随机事件,简称事件,用都是一个随机事件,简称事件,用A表表示,事件示,事件A发生的可能性大小记作发生的可能性大小记作 P(A)或或Pr(A) 小概率事件小概率事件 P0.05 或或0.01小概率原理小概率原理必然事件必然事件 P=1 不可能事件不可能事件 P=0区分频率与概率,大样本情况下频率是概区分频率与概率,大样本

16、情况下频率是概率的一个较好的估计值率的一个较好的估计值频率Relative frequency n在n次随机试验中,事件A发生了m次,则比值称为事件A在这n次试验中出现的频率试验者试验者投掷次投掷次数数出现出现“正面正面”次数次数频率频率Buffon404020480.5069 De Morgan 409220480.5005Fisher1000049790.4979K.Pearson1200060190.5016K.Pearson24000120120.5005Romanovsky罗曼诺夫斯基罗曼诺夫斯基80640396990.4923蒲丰蒲丰(Buffon)17071788,法国博物学家、

17、法国博物学家、数学家、生物学数学家、生物学家、宇宙学家和家、宇宙学家和作家。作家。统计模拟的妙用:计算圆周率的计算圆周率的计算n阿基米德阿基米德:穷竭法穷竭法n刘徽刘徽:割圆术割圆术n16世世纪(法法)韦达、达、(英英)瓦利斯、瓦利斯、(德德)欧拉欧拉实验者实验者时间时间针长针长l投掷次数投掷次数相交次数相交次数Buffon17770.522127043.142Walf18500.8500025323.1596Smith18550.6320412183.1554De Morgan18601.06003823.137Fox18840.7510304893.1595Lazzerini19010.8

18、3340818083.1415929Reina19250.541925208593.1795P=2l/a 6.参数与统计量(参数与统计量( parameter and statistic )根据样本观察值计算出的统计指标,称统根据样本观察值计算出的统计指标,称统计量(计量(statistic),常用拉丁字母表示。),常用拉丁字母表示。反映变量值总体分布特征的统计指标,称反映变量值总体分布特征的统计指标,称参数(参数(parameter),常用希腊字母表),常用希腊字母表示。示。例要了解某地例要了解某地12岁健康男孩的平均身高岁健康男孩的平均身高(参数),今测得(参数),今测得100名男孩身高值

19、,名男孩身高值,求得平均数(统计量)。求得平均数(统计量)。四统计资料的类型四统计资料的类型根据变量的类型可以将统计资料分成三类。根据变量的类型可以将统计资料分成三类。1 定性资料定性资料(qualitative data) 将观察单位按某种属性或类别分组,所得将观察单位按某种属性或类别分组,所得各组的观察单位数。如调查某人群的血各组的观察单位数。如调查某人群的血型分布,按型分布,按O、A、B、AB分组,得各血分组,得各血型组的人数,又如作结核菌素试验,要型组的人数,又如作结核菌素试验,要计算阴、阳性人数。计算阴、阳性人数。2定量资料定量资料(quantitative data) 对每个观察单

20、位用定量方法测定某项指对每个观察单位用定量方法测定某项指标量的大小,所得资料称计量资料,一标量的大小,所得资料称计量资料,一般有单位。如体检时的身高、体重、胸般有单位。如体检时的身高、体重、胸围、肺活量、呼吸次数等,又如病人的围、肺活量、呼吸次数等,又如病人的红、白细胞数、血红蛋白、血小板数。红、白细胞数、血红蛋白、血小板数。3等级资料(半定量资料)等级资料(半定量资料)(ranked data) 将观察单位按某种属性或某个标志分组,将观察单位按某种属性或某个标志分组,得到各组的观察单位数,但各组之间具得到各组的观察单位数,但各组之间具等级顺序。如某病住院病人的治疗结果,等级顺序。如某病住院病

21、人的治疗结果,按显效、有效、改善、无效分组,又如按显效、有效、改善、无效分组,又如测定某项血清反应的测定某项血清反应的 -、+、+、+人数。人数。根据分析需要,三种资料可以转化根据分析需要,三种资料可以转化每个人的血红蛋白属定量资料每个人的血红蛋白属定量资料若将血红蛋白按量(若将血红蛋白按量(g/L)的多少分成五等:)的多少分成五等:160(血红蛋白增高)得(血红蛋白增高)得各等级人数,就是等级资料各等级人数,就是等级资料若按正常与异常分组得各组人数,则得到定性资料若按正常与异常分组得各组人数,则得到定性资料定量资料定量资料等级资料等级资料定性资料定性资料一圆,内接一正三角形,在圆中任作一弦,求弦长大于三角形边长的概率?

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号