统计学概述和统计软件初步PPT课件

上传人:W**** 文档编号:151732125 上传时间:2020-11-17 格式:PPT 页数:88 大小:4.60MB
返回 下载 相关 举报
统计学概述和统计软件初步PPT课件_第1页
第1页 / 共88页
统计学概述和统计软件初步PPT课件_第2页
第2页 / 共88页
统计学概述和统计软件初步PPT课件_第3页
第3页 / 共88页
统计学概述和统计软件初步PPT课件_第4页
第4页 / 共88页
统计学概述和统计软件初步PPT课件_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《统计学概述和统计软件初步PPT课件》由会员分享,可在线阅读,更多相关《统计学概述和统计软件初步PPT课件(88页珍藏版)》请在金锄头文库上搜索。

1、Biostatistics,2,课程说明,生物实验设计与数据处理 Expermental Design and Data Analysis for Biologists Gerry P.Quinn Michael J.Keough 实验设计与分析 美 Douglass C.Mongomery ,第三版 试验设计与处理 袁志发 周静芋 ,高等教育出版社,2000 SPSS宝典,Gxs Presentations,本章内容,4,生命科学的任务和问题,任务:我们需要描述某些生命活动或者某一种涉及生命现象的规律。 问题: 什么是现象? 现象的种类? 其特点是什么?,5,模糊性现象,随机性现象,确定性现

2、象,现象的种类和其研究方法,指在一定条件下必然会发生(或不发生)的事件,也可称为决定性事件。,研究方法:经典数学,指在基本条件不变的情况下,各次实验或观察会得到不同的结果的现象,而且这一结果是不能准确预料的。,研究方法:概率统计学,指事件的发生规律无序。,研究方法:模糊数学,现 象,如早晨太阳从东方升起,水向低处流,万有引力,标准大气压,纯水 100沸腾,等等。,例如血球计数,昆虫密度调查,某一时刻车间中开动的车床数,优秀选手射击弹着分布,抽样时某一样品合格与否,等等。,6,我们通过什么途径了解事物的状态?或者说是现象?,数据收集以后,应该怎样处理才能得到“规律”?,展现事物特征的资料是如何的

3、来的?,有没有方法可以预测事情的发生或者说明其规律?,数据是什么?应该怎样收集?,如何研究随机性现象?,7,问题的进展,当然,我们在之前所学的数学可以帮助我们构建、理解由方程描述的规律; 但是,对于没有明显方程的规律我们之前所学就无法描述了; 更为重要的是: 我们即使构建出了方程,方程是真实的反映还是特例,或者如何辨别其真伪? 我们如何从纷乱的数据中找出规律? 我们如何把实验设计得更科学? 实验中的数据是否为真?如何提出错误数据?,8,孟德尔的遗传学定律的如何得来的?,孟德尔是奥地利的修道士,也是一位自然科学的教师,曾经受过良好的数学训练。他一边教书,一边在他的修道院里种花以实验。他选了豌豆

4、(garden pea) 作为实验的题材。从它们的颜色、茎高、豆形等外表特性作为选种的根据,令其交配之后,观察其后代情况。 孟德尔通过碗豆杂交实验发现遗传第一与第二定律;,9,孟德尔和他的遗传定律,其实孟德尔并不是唯一的一个在那个时代从事植物杂交实验以观察遗传现象的生物学家,但却为唯一的一个能从植物的杂交实验中发现生物特征遗传的定律的科学家; 他成功的根本原因是利用了那个时代的生物学家仍不会使用的数学分析法来处理他的实验结果。 假如孟德尔 (G. Mendel) 对数学没有良好基础的话,他能不能发现遗传定律?,10,应该使用什么工具帮助发现规律?,研究的现象到底存在什么“规律”?,过程应该如何

5、安排才能高效?,所以,实际上我们在解决类似的问题上遇到了一些麻烦:,过程能否优化?,所得规律的正确性?适用范围?,11,“按照现代理论,自然规律的基础不是因果性,相反,本质上具有统计性质。 人们断言,一切自然规律在原则上都是统计性的,只是我们观察操作不完善,我们才受骗去信仰因果性。” - Albert Einstein,12,“当人类科学探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计工具可为其开辟一条前进的通道”。 -英国著名遗传学家 Galton,13,在20世纪初,英国统计大师R.A. Fisher在Rothamasted农业试验场工作时发明了田间试验的各种不同设计及发展出变方分析(A

6、nalysis of Variance)与变积分析(Analysis of Covariance)方法分析数据。 这些试验设计与分析方法,不但是统计理论与方法上的伟大成就,更对二十世纪粮食的增产与农作物的改良具有不可磨灭的贡献。,14,在二十世纪50年代英国的B. Hill将Fisher在农业上的随机试验设计应用在医学与药物评估上,发展出随机双盲的临床试验之基础,对人类健康福祉做出了重大的贡献。 另外,在美国国家卫生研究院任职的J. Cornfield 将统计方法应用在流行病学上证明抽烟与肺癌间的因果关系。,15,什么是统计学?,Statistics 来源于 State ,状态的描述构成了近代

7、统计学的重要起源之一。 早期的人口调查提供了国家、状态的简单描述,Statistics 也有数字或者数值数据的含义。 统计学是研究如何收集、处理与分析数据,并且由此作出决策的一门学科。,16,统计学,统计学是一门全新的数学学科,不仅是对我们思维方法的新训练,也将是我们今后工作中使用最多的数学方法。 简而言之,统计学就是一门对数据进行整理与分析的数学分支。 数理统计是研究和揭示随机现象统计规律性的一门数学学科。 数理统计也常被称为概率统计,这是因为,数理统计的理论基础是概率论,即数理统计是由概率论和数理统计两部分内容组成的。,17,统计学的主要思想,随机性和频率稳定性。 随机事件的结果一般是不可

8、预料的,那又如何研究呢?个别随机事件(结果)在一次实验或观察中可以出现或不出现,但在大量实验中,它出现的次数与总实验次数之比常常是非常稳定的.这种现象称为频率稳定性,正是随机事件内在规律性的反映. 直观上,我们用一个数 P(A)来表示随机事件 A发生可能性的大小,P(A)就称为A的概率一般来说,当实验次数n越来越大,直至趋于无穷时,频率也会逐渐趋近于概率。,18,频率的稳定性,19,统计学需要解决的主要问题,抛掷 100 个硬币,出现正面个数是不确定的( 随机性 ) 如果是均匀硬币,那么基本上是在 50 个左右( 规律性 )。 问题: 如果把这 100 个硬币再抛掷一次,正面出现个数基本不会和

9、上一次抛掷相同( 规律性中的随机性 )? 这个差异究竟来自随机性还是因为硬币的不均匀性?或者是人在投掷的时候的错误? 换言之,我们需要找出事件发生的原因是事件本身的随机性导致,还是由于系统的误差,或者是人为的因素导致?,20,比如:,小儿麻痹症疫苗的研制: 实验组:200,000 人,有 56 人被感染 对照组:200,000 人,有 138 人被感染 究竟是这种疫苗真的有效,还是因为这两组小孩各自的身体、环境等因素产生的随机差异?,21,随机现象的统计规律性,人们经过长期实践并深入研究后发现,这类现象虽然就每次实验或观察结果来说其有不确定性,但在大量重复实验或观察下,它的结果却具有某种规律性

10、。 1粒种子发芽的可能性不好确定,但一批种子的发芽率却是可以确定的,等等。 我们把随机现象在大量重复试验或观察中所呈现出的固有规律称之为随机现象的统计规律。,22,统计的特点,1. 概率性 它不仅表现在环境统计学的研究手段是概率论,以及建立在概率论基础上的数理统计方法,更主要的是利用统计方法解决问题时所得出的每一个结论是不确切的,是在一定误差概率的允许下,作出的可靠推断 2. 归纳性 从辩证法角度看样本是研究对象的特殊规律,统计学由样本推断总体的研究思路乃是由特殊到一般的归纳过程 3. 实践性 归纳研究规律的同时,还非常重视将其所归纳的结论应用于科学实践,检验统计结论的准确性或演绎出更为具体的

11、理论方法,23,统计的功用,(1)提供整理和描述数据资料的科学方法,确定某些性状和持性的数量特征。 一批试验或数据资料,若不整理则杂乱无章,不能说明任何问题。 统计方法提供了整理资制、化繁为简的科学程序,它可以从众多约数据资料中,归纳出几个特征数或绘出一定形式的图表,使试验研究者能从少数的特征效或一些简单的图表中了解大批资料所蕴藏的信息。,24,统计的功用,(2)判断试验结果的可靠性。 一般在试验中要求除试验因素以外,其他条件都应控制一致,但在实践中无论试验条件控制得如何严格,其试验结果总是受试验因素相其他偶然因家的影响。 偶然因素的影响就是造成试验误差的重要原因。一个试验结果,是由试验因素造

12、成的还是试验误差造成的,要正确判断就必须应用统计分析方法。,25,统计的功用,(3) 确定事物之间的相互关系、提供由样本推断总体的方法。 试验的目的在于认识总体规律,但由于总体庞大,一般无法实施,在研究过程中都是抽取总体中的部分作为样本,用统计方法以样本来推断总体的规律性,在这种推断中,统计原理和方法起到了理论上的保证作用。,26,统计的功用,(4)提供试验设计的一些重要原则。 为了以较少的人力、物力和财力取得较多的试验信息和较好的试验结果,在一些生物学研究中就需要科学地进行试验设计,如对样本容量的确定、抽样方法、处理设置、重复次数的确定以及试验的安排等,都必须以统计学原理为依据。 从统计分析

13、和试验设计的关系来看,统计学原理可以为试验设计提供合理的依据,而试验设计又是统计分析方法的进一步运用。,27,统计学的主要内容,最早的统计学就是从描述性统计开始的,从最初的简单的数据收集,到开始计算数据集的特征,继而发展到为其他的统计方式提供合适的统计量。,28,1. 描述性统计,描述性统计实际上就是对原始资料进行整理并作基本分析 统计的基本特点,是以样本推断总体。如果在大样本情况下,就需要通过统计资料初步整理之后 ,再从资料中计算出三个主要的统计量 ,即平均数 、标准差及标准误 。以用来根据样本推断总体的特征,一是资料的集中性,以平均数来表示,二是资料的离中性,以标准差来表示,三是衡量平均数

14、的可靠性 用标准误来表示。,29,统计学的主要内容,显著性检验是统计学、数学和实验科学的一次里程碑式的飞跃,它第一次为人们的研究提供的合理的,能够在实践中有足够的结果支撑的比较、归纳和演绎的方法。,30,2. 显著性检验,显著性检验又称假设检验,或统计推断 1平均数间差异的比较 在进行生物科学研究工作 中,经常会遇到两组或两组 以上数据的平均数它们之间进行 比较,就有一个有无显著差异的问题或者说孰优孰劣的问题 。 2属性资料的检验 生物学领域中有许多性状不能直接用测量的方法来加以衡量,均可以应用属性统计的方法 ,通过对具有相同属性的计数来分析 3方差分析 方差分析目的主要是为了进行多个平均数间

15、的比较。 表述分类变量与数值变量的效应关系,31,描述统计与推断统计的关系,实验样本,总体的内在规律,数理统计和概率论,样本特征,总体参数,样本统计量,总体特征,32,描述统计与推断统计的关系,character,样本,总体,概率和统计方法,对于样本的特征性描述 提供显著性检验的数据基础,提供由样本到总体的方法 判断因素和因素间影响的大小 评价关系存在与否,33,统计学的主要内容,又为人们打开了另一扇科学的大门!它首次向人们以一个比较可信的方式提供了试验因素和实验结果之间,以及试验因素之间存在的“关联性”的评价方法。,34,3. 相关与回归,相关:研究变量之间相互关系的密切程度 ,以相关系数来

16、表示。 例如 ,人的身高与体重存在着一定程度的相关一 般身高越高,其体重可能越大。相关系数可用来表示两者间的相关程度 回归:指两个或两个以上的变量存在着从属关系,即一个变量 (x)变化时,引起另一变量(y)的相应变化的估计。 主要研究数值变量之间的效应关系,35,统计学的主要内容,从最初的仅仅为了使试验的过程比较有条理,慢慢发展到既提供了试验的条理性,又提供了充分的完整的试验过程及其结果的分析评价方案。,36,统计的基本方法,抽样理论: 介绍如何收集数据。主要抽样方法,样本容量的确定,抽样误差问题等 参数估计: 如何根据数据得到总体参数的信息,点估计、区间估计,Bayes 估计等 假设检验: 如何对关于总体的一些假设做出决策,正态总体参数的检验,分布拟合检验,秩检验,统计决策等 方差分析 回归与相关 多元分析: 研究若干个变量之间的关系聚类分析、判别分析、主成分分析、因子分析、典型相关分析等等。,37,利用的对问题的非统计知识,使设计和分析尽可能的简单,尽量使用对照原则,识别实际的显著性和统计学的显著性之间的区别,试验通常时序

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号