《统计学幻灯片--ch01统计学绪论》由会员分享,可在线阅读,更多相关《统计学幻灯片--ch01统计学绪论(61页珍藏版)》请在金锄头文库上搜索。
1、目 录 第一章 绪论 第一篇 基本统计方法 第二章 计量资料的统计描述 第三章 总体均数的估计与假设检验 第四章 多个样本均数比较的方差分析 第五章 计数资料的统计描述 第六章 几种离散型变量的分布及其应用 第七章 检验 第八章 秩转换的非参数检验 第九章 双变量回归与相关 第十章 统计表与统计图,第十一章 多因素试验资料的方差分析 第十二章 重复测量设计资料的方差分析 第十三章 协方差分析 第十四章 多变量数据的统计描述与统计推断 第十五章 多元线性回归分析 第十六章 logistic回归分析 第十七章 生存分析 第十八章 判别分析 第十九章 聚类分析 第二十章 主成分分析与因子分析 第二十
2、一章 典型相关分析 第二十二章 常用统计预测方法 第二十三章 常用综合评价方法 第二十四章 量表研制与量表资料的统计分析方法,第二篇 高级统计方法,第三篇 医学科学研究设计 第二十五章 医学科学研究设计概述 第二十六章 观察性研究设计 第二十七章 实验研究设计 第二十八章 临床试验研究设计 第四篇 数据处理与统计软件应用 第二十九章 数据处理的一般原则与方法 第三十章 SPSS统计软件 第三十一章 SAS统计软件 第三十二章 Stata统计软件 第三十三章 数据处理的其他统计方法 附录一 医学人口统计与疾病统计常用指标 附录二 统计用表 附录三 英汉名词对照,(1)具有继承性和创新性 (2)
3、具有针对性和实用性,教材特点:,1。自备作业本,考试卷面成绩90分,课外 作业10分,考试前交作业,不交作业者 不准参加考试。 2。自备计算器,如有兴趣,可自学SPSS11.5。,学 习 要 求,第一章 绪论 第一节 统计学的几个基本概念 第二节 医学统计工作的基本步骤 第三节 统计学发展简史,统计学(Statistics) 是一门研究数据的搜集、整理、分析的科学。,定义:是研究医学数据的搜集、整理、分析 的科学。 特点:1、资料的数字化,数量反映质量 2、由偶然性(不确定性)的剖析 中,发现事物的必然性(确定 性),医学统计学(medical statistics),医学统计学,学习内容:
4、1、统计学的基本原理、方法基础 (学 习重点) 2、业务统计应用(如:临床医学、预 防医学、卫生事业管理),医学统计学,目的:医学科研的数学工具 核心:计算和比较反映群体综合数量特征的 统计指标。 例如:期望寿命反映人群健康状况的指标 婴儿死亡率反映卫生服务质量的指标,第一节 统计学的几个基本概念,一、个体与变量、总体与样本,个体(观察单位等):统计研究中的基本 单位据研究目的而定 变量(观察指标等):要研究的个体特征 例如:身高、体重、性别、血型、反 应、疗效等,变量值:变量的取值 例如:身高 1.65米 体重 52公斤 性别 女 血型 “O”型 反应 阴性 疗效 好转 资料:由多个变量值构
5、成 例如:血糖的样本资料,同质:给个体规律的一些相同性质(使研究变量的 已知影响因素齐同) 如:变量为身高,长沙市2004年7岁正常男童即为同质 变异:同质个体的变量值的差异 如:长沙市2004年7岁正常男童的身高值各不相同 特点:生物个体变异较大(原因:难于掌握的因素 造成。如:影响身高的有遗传、营养等因素),定义:根据研究目的确定的同质个体(变量 值)的全体。 例如:长沙市2004年7岁正常男童(身高值)的全体 有限总体(finite population):明确规定了空间、时间、人群范围内有限个观察单位的总体。 无限总体(infinite population): 没有时间和空间范围的限
6、制,其观察单位的全体数只是理论上存在,因而可视为“无限”的总体。,总体(population):,定义:从总体中随机抽得的部分观察单位, 其实测值的集合 例如:长沙市2002年7岁正常男童中随机 抽取 200名,其身高值构成一个样本,样本( sample ),抽样研究,注意:获取样本信息是手段,推断总体 特征是目的。,二、变量与资料 变量分类是资料分类的基础,计量资料:(measurement data)又称定量资料或数值变量资料。为测定每个观察单位某项指标的大小而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。 例如:身高资料、体重资料,计数资料(enumeration da
7、ta)又称定性资料或无序分类变量资料。为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。其变量值是定性的,表现为互不相容的属性或类别。,二分类:如性别、生死、疾病有无; 多分类:如A、B、O、AB血型。,等级资料(ranked data) 又称半定量资料或有序分类变量资料。为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。 例如:观察用某药治疗某病患者的疗效,以每名患者为观察单位,结果可分为治愈、显效、好转、无效四级。 统计分析方法的选用,是与资料类型密切联系的。,资料分类可互相
8、转换,例如:测得5人的WBC(个/m3)数如下: 3000 6000 5000 8000 12000 数值变量 过低 正常 正常 正常 异常 分类变量 若按正常3人,异常2人分组二分类变量 若按过低1人,正常3人,过高1人分组等级资料,三、误 差,定义:实测值与真值之差。 1、随机误差:不恒定的、随机变化的误差,由多种尚无法控制的因素引起。无方向性。 主要指重复测量产生的测量误差和抽样过程产生的抽样误差。 通常,测量误差远小于抽样误差,因此统计学主要考虑抽样误差。,非随机误差又可分为系统误差和非系统误差两类: 2、系统误差:实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原
9、因往往是可知的或可能掌握的,大小变化有方向性。 3、非系统误差(过失误差): 研究者偶然失误而造成的误差。,四、频率与概率,1频率(frequency) ,假设在相同条件下,独立地重复做n次试验,A在n次试验中出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率。当试验重复很多次时,有,2概率(probability): 概率是度量随机事件发生可能性大小的一个数值。 设在相同条件下,独立地重复n次试验,随机事件A 出现 次,则称 为随机事件A 出现的频率。当n逐渐增大时,频率 趋向于一个常数,则称该常数为随机事件A 的概率,可记为 ,简记为 。,取值:,频率是就样本而言的,而概率从总体
10、的意义上说的,m/n是概率 的估计值。试验次数越多,估计越可靠。,小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将 称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为很可能不发生。,第二节 医学统计工作的基本步骤,主要指统计设计,是影响研究能否成功的最关键环节,是提高观察或实验质量的重要保证。 内容:包括对资料搜集、整理和分析全过程的设想与安排 。,一、设计,3对照(control),实验设计的三个基本原则,1随机化(randomized sampling),2. 重复(repleation),目的:指应采取措施使能取得准确可靠的原始 数据。 资料来源
11、: 统计报表。 经常性工作记录。 专题调查或实验研究。 统计年鉴和统计数据专辑。 要求:1、随机性 2、样本含量足够大,二、搜集资料,三整理资料,是将原始数据净化,系统化和条理化,以便为下一步计算和分析打好基础的过程。,四分析资料(统计分析),目的 :在表达数据特征的基础上,阐明事物的内在联系和规律性。 包括两方面: 1.统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。 2.统计推断:用样本信息推断总体特征:参数估计,假设检验。,统计分析,第三节 统计学发展简史,1. 早期 公元前3050年古埃及人为修建金字塔筹集建筑费,对全国的人口和财产进行了普查。,19世纪,应用数
12、学家为解决赌徒们在博彩中出现的输赢概率问题逐渐形成和发展了概率论,从而为统计学的发展奠定了坚实的基础。,2. 近代,计算机和统计软件如SAS、SPSS的出现 使统计学得到了突飞猛进的发展。,3. 现代,生物统计学著名 历史人物其人其事,1.数学神童 Gauss (17771855),德国数学神童高斯 在孩童时就能够快速计算出“1+2+3+ +100=5050”的答案。他对统计的主要贡献除了正态分布( normal distribution )外,还有算术均数、几何均数、二项分布理论和最小二乘法等。,其实,在Gauss 之前就有人发现了正态分布,但只有他很快将之应用于天文学研究,并使其应用价值广
13、为人知,故正态分布又称高斯分布(Gaussian distribution)。,2. 从酿酒师到统计 主管的Gosset(1876-1937),1899年Gosset在英国都柏林一酿酒公司做酿酒师,在对小样本进行质量控制的研究中发现了t 分布,其论文1908年以Student为笔名发表。自此开创了小样本统计的新纪元。,非常有趣的现象是,Gosset的数学欠佳,因而不能自己解决 t 检验的理论和应用问题,其最后的完善,是由Fisher, Neyman 和E Pearson 先后完成的。正如后人评价的那样:“Gosset提出实际问题,Fisher 和 E Pearson 将其转成统计问题,Neym
14、an用数学解决问题”。,实际上是1925年Fisher在 t 分布的应用一文中定义的。,大家熟知的公式:,3.医院统计与卫生管理统计的 先驱F.Nightingale (1820-1910),1854年9月南丁格尔出任土耳其英国总医院的女护士总管。鉴于医院没有任何医疗统计,登记也十分简单,仅仅记载下某年某日一个人死亡了。因而,她紧急提议建立医院的医疗统计室。她认为图表是她发明的一种表达形式。,1857年底,按照南丁格尔的建议在陆军部建立了四个下属委员会,陆军部统计委员会是其中之一。1858年她当选英国皇家统计学会会员,是该学会最早的女会员。1860年,第四届国际统计大会议题之一就是“南丁格尔小
15、姐的医院统计标准化计划”,南丁格尔在会上报告了她的论文“医院统计学”。1862年,维多利亚出版社出版了她的著作医院统计与医院规划。,4. 把统计作为“披荆斩棘” 工具的人类学家Galton,“回归”一词来源于Galton的自然遗传。他是达尔文的表兄弟,人类学家,早年学医,曾在剑桥大学念书。尽管他的数学不是很好,但在人类学和优生学研究中萌发的统计学思想,对生物统计的发展产生了深远影响,如“回归”、 双变量正态分布的概念等。,当人类科学的探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计学工具可以为其开辟一条前进的通道。, F Galton (1822-1911),学习方法,掌握基本概念 重在正确应用 选择恰当方法 满足应用条件 善于解释结果,教学目的,培养统计思维 用于医学科研,谢谢大家!,