高级生物统计--基本知识讲义

上传人:我** 文档编号:115347336 上传时间:2019-11-13 格式:PPT 页数:172 大小:6.59MB
返回 下载 相关 举报
高级生物统计--基本知识讲义_第1页
第1页 / 共172页
高级生物统计--基本知识讲义_第2页
第2页 / 共172页
高级生物统计--基本知识讲义_第3页
第3页 / 共172页
高级生物统计--基本知识讲义_第4页
第4页 / 共172页
高级生物统计--基本知识讲义_第5页
第5页 / 共172页
点击查看更多>>
资源描述

《高级生物统计--基本知识讲义》由会员分享,可在线阅读,更多相关《高级生物统计--基本知识讲义(172页珍藏版)》请在金锄头文库上搜索。

1、高级生物统计学,第三章 多年多点试验结果的联合分析,第一章 单个自由度比较分析,第二章 裂区试验设计及其统计分析,第四章 曲线回归分析,第五章 多元回归分析,第六章 协方差分析,第七章 一次回归正交设计及其统计分析,生物统计学基本知识回顾,第八章 二次回归正交设计及其统计分析,第九章 二次旋转设计及其统计分析,基本知识回顾,第三节 生物统计学的基本方法,第一节 生物统计学的基本概念,第四节 田间试验及设计方法,第二节 生物统计学的基本原理,第五节 方差分析,第六节 直线回归分析,生物统计学及其特点,生物统计学(Biometry or Bio-statistics)是数学中的概率论与数理统计学在

2、生物科学中的应用而形成的一门系统性学科。,统计学,理论统计学即数理统计学,应用统计学,社会科学领域的统计学,自然科学领域的统计学,1.逻辑性较强;,2.假设较多,比较抽象;,3.统计方法的分析过程复杂;,4.规律性较强;,5.分析方法的分析步骤不具灵活性。,其特点:,第一节 生物统计学的基本概念,1.数据(data)在科学试验或调查过程中,对研究对象的某些特征、特性进行观察记载得到的数字资料的总称。数据具有变异性和趋中性。,2.变数(variable)生物个体具有变异性的特征、特性。变数的某一具体数值称为变量(variate)或观测值(observed value) 。 连续性变数(conti

3、nuous variable)是指观测值在一定范围内可以取任何一个数值,这些观测值一般是通过测量或称量的方法获得的。 离散性变数(discontinuous or discrete variable)是指观测值只能取0或正整数的变数,其观测值一般通过观察和计数的方法获得的。,第一节 生物统计学的基本概念,3.总体(population or universe) 根据研究目的而确定的,具有共同性质的个体所组成的集团,或者说是整个研究对象中每个个体某一变数所有观测值的总称。,5.样本(sample)从总体中抽出一部分有代表 性的个体或观测值。,4.总体的参数或参量(parameter) 根据总体全

4、体观测值算出的总体特征数。常用希腊字母表示。 如总体平均数 ,方差2,标准差 等。,6.统计数或统计量(statastic)根据样本所有观测值计算出的样本特征数。常用英文字母表示。例如样本平均数 ,方差S2,标准差S等。,第一节 生物统计学的基本概念,算术平均数:,7.平均数(average or mean)是数据的代表值,表示资料中观测值的中心位置。,中(位)数(median):,众数(mode):,几何平均数(geometric mean):,所有观测值的总和除以观测值 数目所得的商。,将资料所有观测值排序后,居于中间位置的那个观测值的值(或,当观测值数目为偶数时,那两个观测值的和之半)。

5、,资料中最常见的一数,或次数分布表中次数最多的那组的组中值。,n个观测值的乘积的n次方根。,其中以算术平均数最为常用。,第一节 生物统计学的基本概念,极差(range) 一组数据的最大值与最小值之差。,8.变异数表示数据资料变异大小的数值。,离均差平方和简称平方和(sum of squares,SS) 可较好地衡量资料的变异。 定义公式: 计算公式: 其中C为矫正数,为资料中所有观测值总和的平方除以观测值的个数。,第一节 生物统计学的基本概念,8.变异数表示数据资料变异大小的数值。,方差(variance)是平方和除以观测值的个数。,总体方差(population variance):,样本方

6、差(sample variance):,分类资料:,分类资料:,第一节 生物统计学的基本概念,8.变异数表示数据资料变异大小的数值。,标准差(standard deviation)是方差的正根值。,总体标准差(Population SD):,样本标准差(Sample SD):,变异系数(Coefficient of Variation,记为C.V. )是指资料的标准差与平均数之比。即:,不可能事件,第二节 生物统计学的基本原理,随机事件,事件,概率,必然事件,某事件出现的概率用P( )表示;例如P(A)、 P(B)等。,概率的有效范围为01,即0P(A)1。,必然事件记为,其概率为1,即 P(

7、) = 1。,不可能事件记为 ,其概率为0,即 P() = 0。,随机事件的概率在01之间,即0P(A)1。,1.事件(event)与概率(probability),第二节 生物统计学的基本原理,事件间的关系,和事件,积事件,互斥事件,对立事件,事件系,事件的独立性,完全事件系,完全互斥事件系,第二节 生物统计学的基本原理,计算事件概率的法则,互斥事件的加法定律,可以引伸到:n 个两两互斥的事件的概率等于这 n 个事件的概率之和。,即:如果AB=,则P(A+B)=P(A)+P(B)。,即:如果AiAj=,则P(Ai)=P(Ai)。,第二节 生物统计学的基本原理,计算事件概率的法则,互斥事件的加

8、法定律,独立事件的乘法定律,可以引伸到:n 个相互独立的事件同时发生概率等于这 n 个事件各自发生的概率之乘积。,即:P(AB)=P(A)P(B)。,完全互斥事件系的概率之和为1。,即,如果AiAj=同时A1+A2+An=,则P(Ai)=1。,第二节 生物统计学的基本原理,2.二项分布(binomial distribution):由对立事件构成的总体称为二项总体(binomial population),二项总体观测值的概率分布即为二项分布。,若某事件出现的概率为p,其对立事件出现的概率为q=1-p,做n次重复独立试验,该事件出现X次的可能性(概率)有多大?现在是: n=2,p=3/4,q=

9、1/4,X可以为0,1,2。 P(X=0)=(1)(1/4)(1/4)=(1) (3/4)0(1/4)2=(1) p0q2-0 P(X=1)=(2)(3/4)(1/4)=(2) (3/4)1(1/4)1=(2) p1q2-1 P(X=2)=(1)(3/4)(3/4)=(1) (3/4)2(1/4)0=(1) p2q2-2 其中系数为在n个中取X个进行组合的数目。,所以,概率分布函数为:,第二节 生物统计学的基本原理,比较下面两个概率分布图,会发现二项分布的形状是由n和p两个参数决定的。当 p = q = 0.5 时,分布是对称的;当 p q 时,分布就不对称; p和q差异越大,分布就越偏斜。,

10、第二节 生物统计学的基本原理,利用概率分布表,可以计算出随机变量 X的总体平均 数 和总体方差 2。,对数列求和得 X的总体均数为:,同法求得 X 的总体方差为:,将方差开平方得 X 的总体标准差为:,第二节 生物统计学的基本原理,于是,随机变量X落在区间(X1,X2)内的概率为:,3.正态分布(normal distribution)连续性变数的概率分布,其概率密度函数为: 记为 其中为X的平均数, 为X的方差。,其概率分布函数为:,第二节 生物统计学的基本原理,正态曲线的特性:, 单峰,倒钟状,当X= 时,f(x)达最大值;, 当X时,f(x)0;, 以X=为轴左右对称;, 曲线与横轴间面

11、积为1;, 在X= 处有两个拐点;, 若 不变, 改变使曲线左右平移, 形状不变;=0时, 对称轴与纵轴重合;说明 代表了数据的中心位置;, 当 不变, 改变使曲线形状改变,对称轴不变; 当 变小时,曲线变高瘦,中部的面积变大;当 变 大时,曲线变矮胖,中部的面积变小;说明 衡量了 资料的变异程度。,第二节 生物统计学的基本原理,于是原变量X在区间(X1,X2)之间的概率就可以用u在区 间(u1,u2)之间的概率来计算。,因为X的平均数为,方差为2, 所以 的平均数为: 方差为:,统计学家已经将标准正态分布的概率计算出来,我们 只要学会查表就可以计算对应于不同的u的(u)值。,第二节 生物统计

12、学的基本原理,统计学一个主要任务是研究总体和样本之间的关系,总体和样本之间的关系可以从两个方向进行研究: 从总体到样本:即研究从总体中抽出的所有可能样本的统计数的分布及其与原总体之间的关系。即抽样分布的情况。 从样本到总体:即研究从总体中抽出的一个随机样本,用该样本的统计数来估计总体的参数,即参数估计;对总体的参数作出推断,即统计假设测验。,4.抽样分布(sampling distribution)研究样本统计数的概率分布。,第二节 生物统计学的基本原理,研究样本的方法 对于比较小的总体,可以将总体中所有可能的样本都抽出来进行研究样本统计数的分布。 对于较大或无限总体,可以从中抽出比较多的样本

13、来研究样本统计数的分布。,抽样又分为复置抽样和不复置抽样 复置抽样 将抽得的个体放回总体继续参加抽样。 不复置抽样 抽得的个体不放回总体参加后续的抽样。,大数定律:对客观事物进行足够多地观察,客观事物的规律性就会充分显现出来。 大数定律保证了参数估计的可靠性。统计上,E( )=, E(S2)= 2, E(S) ,第二节 生物统计学的基本原理,样本平均数的抽样分布,如果有一个总体,大小为N,平均数为,方差为 2。,从这总体中抽取一个大小 为 n 的样本,可以算出样 本平均数 。,这个 不是常 数,而是一个随机变量。 因为你下次再从这总体中抽 取一个大小为 n 的样本,这 个 的值就不同了。,如果

14、N是个有限大的数,将一共有m=N n种可能的样本。 如果N是个无限大的数,则m是个无限大的整数。这m个 可以构成一个总体。称为样本平均数的衍生总体。,统计学已经证明,样本平均数总体的平均数等于原总 体的平均数,样本平均数总体的方差等于原总体方差 的n分之一。即 ,两个独立样本平均数差数的总体分布,如果从一个具有参数1,12的正态总体中抽取大小为 n1的样本,样本平均数为 ;又从另一个具有参数2, 22 的正态总体中抽取大小为n2的样本,样本平均数 为 。则两样本平均数之差数 将服从总 体平均数为 ,总体方差为 的正态分布。,将 转换为正态离差 就可以计算出差数 落在某区间的概率。,如果两个独立

15、样本来自不同的非正态总体,只有当 12 22 ,且n1n2都足够大时,两样本平均数之差数 才近似服从正态分布。否则分布很难确定。,第二节 生物统计学的基本原理,请注意,上面讨论到的抽样总体,不论是 样本平均数总体 还是 两样本平均数之差数的总体 其样本平均数和方差与原总体的平均数和方差都有相应的关系,与原总体的分布无关。,如果原总体的分布为已知,则相应的抽样总体的分布 就更为清楚了。,以下讨论原总体的分布与相应的抽样总体的分布之间的关系。,第二节 生物统计学的基本原理,实际应用中,当n30时,就可以应用此定理。,如果原总体服从正态分布 ,则无论样本容 量n是大是小,样本平均数 将服从平均数为 , 方差为 的正态分布。即,如果原总体不是正态分布的,但已知其总体均数为 , 方差为 ,则当从中抽取的样本容量n足够大时,中心 极限定理指出,样本平均数 将服从平均数为 , 方差为 的正态分布。即,将 转换为正态离差 u,就可以计算出 落在某区间的 概率。,第二节 生物统计学的基本原理,在前面介绍了标准化正态分布即u分布的定义公式: 。现在由此可以衍生出另外两个u值的计算公式,即符合正态分布的样本平均数和样本平均数差数衍生总体的u值转换公式:,样本平均数衍生总体:,样本平均数差数衍生总体:,正态总体中的数值,正态总体的平均数,正态总体的标准差,第二节 生物统计学的基本原

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号