试验设计与统计分析

上传人:宝路 文档编号:52748015 上传时间:2018-08-25 格式:PPT 页数:113 大小:3.72MB
返回 下载 相关 举报
试验设计与统计分析_第1页
第1页 / 共113页
试验设计与统计分析_第2页
第2页 / 共113页
试验设计与统计分析_第3页
第3页 / 共113页
试验设计与统计分析_第4页
第4页 / 共113页
试验设计与统计分析_第5页
第5页 / 共113页
点击查看更多>>
资源描述

《试验设计与统计分析》由会员分享,可在线阅读,更多相关《试验设计与统计分析(113页珍藏版)》请在金锄头文库上搜索。

1、试验设计与统计分析,唐 启 义Tel: 0571-88982892,http:/浙江大学农业与生物技术学院,1、 数据的基本统计分析 2、 统计检验基本原理及t检验 3、方差分析 4、相关和回归分析 5、多元统计分析(主成分分析和聚类分析),目 录,1.1 数据集中趋势集中趋势是数据分布的中心,描述集中趋势的指标有:算术平均数mean中位数 median众数等 mode,中位数 把一批数按照从小到大的顺序排列,处于数列中点的变量值就是Me 。,1.2 离散程度分析离散程度是数据分布的又一特征,它表明各个变量值的差异,即离散程度。意义:首先,可以衡量算术平均数的代表性。 例:均值都为150的两组

2、数50,100,150,200,250100,125,150,175,200 其次,进行产品质量评价、生产管理和决策。离散程度经常用到的指标有:极差、方差和标准差等,它们也被称为变异指标。,方差与标准差 1、方差与标准差是测定离散程度最常用的指标。标准差是方差的平方根,也称均方差。 2、总体方差和标准差()计算公式:样本方差和标准差(S)要除以n-1。3、变异系数4、方差分析中,均方差MSE即为处理的方差。,(总体)方差的计算,(样本)方差的计算,平均数置信区间估计,平均数差数的标准误,平均数差数置信区间估计,两平均数差异的t检验,标准误,标准误用于统计检验。,标准误随重复增加而下降的曲线,2

3、.1 参数假设检验的过程 a. 问题的提出及特征分析 b. 两个假设(原假设、备择假设) c. 选择适当的统计方法、计算统计量 d. 根据p值进行统计推断,2、统计检验基本原理及检验,某地区某水稻品种产量500kg/亩,施用某种新的肥料之后,10块试验田得到平均产量510kg/亩,标准差20。这个产量的变化,能否是施用这种肥料增产效果? 需要进行统计检验?,由于该品种标准对照是500kg/亩,因此原假设为总体均值等于500kg/亩(标准对照总放在零假设);由于样本均值大于500kg/亩,目的是推断施肥是否有效,故把备选假设定为施肥后产量大于500kg/亩(这种备选假设为单向不等式的检验称为单尾

4、检验(另一种是备选假设为不等号“”的,称为双尾检验)。即:,检验统计量计算,这里是总体方差未知,须用t检验进行检验。公式中0通常表示为零假设中的均值(这里是500),S是样本标准差,等于20。在零假设之下,它有自由度为n-1=9的t分布。代入公式计算计算结果是t=2.3717(也称为t值), 同时得到p-值为0.0209,因p值 时没有出现小概率事件,不能拒绝H0,统计结论“无统计学意义”,简言之,p值就是传统所说的(显著水平)。p值可精确地告诉我们统计检验结果的显著水平,而不用再重复采用不同的水平。根据p值进行统计推断常用标准是: 如果0.01p0.05,则结果被认为没有统计显著性(有时记为

5、NS); 但是,如果0.05p0.10,则有时注记为有倾向性的统计显著。,2.2 判断两组的总体均数是否不等,成组t检验(根据实际问题,选用双侧检验 ) H0:12,H1:12,比较两作物品种某微量元素含量差异,各品种该微量元素含量为 品种A 0.709 0.755 0.655 0.705 0.723 品种B 0.617 0.608 0.623 0.635 0.593 0.684 0.695 0.718 0.606 0.618,H0:12,dfn1+n2-2,检验总体均数是否相等称成组t检验,检验公式 (1)分子:均值差异; (2)分母:方差和(离散程度)的大小; (3)样本数n大小。显著性差

6、异的结果不仅仅取决于均值本身的差异大小,而且还取决于试验中试验方差和样本数。在实际农业生产中不重要的微小的差异在统计上可能显著。所以,在应用时,如果要求处理比对照(增加)显著,那么对增加幅度最好有所规定。另一方面,由于某种原因,统计上对较大的差异检验不出显著性,但这样的差异对农业生产或科研或许是很重要的。,以0.01水准的双侧检验拒绝H0,接受H1;有统计学意义,可认为该元素在两品种中的含量有差异。,2.3 配对t检验,如果实验是配对设计,若两处理因素效应无差别,那么差值d的总体均数d应该为0,故可将该检验理解为样本均数与总体均数d =0作比较。,H0:d0,两方法(仪器)检验结果相同; H1

7、:d0,两方法(仪器)检验结果不同。 双侧 =0.05。按 = n-1=12-1=11查t值表,得t0.20,11=1.363,t0.10,11=1.796,t0.10,11tt0.20,11,则0.20P0.10,差别无统计学意义,尚不能认为两种(方法)仪器检查的结果不同。,3、多个处理的统计检验 ( 方差分析),方差分析:检验两组以上总体均数是否全都相等。,方差分析应用理论上的条件 独立性:各样本是相互独立随机的样本 正态性:各样本都来自正态总体 方差齐性:各样本的总体方差相等,A、B、C和D四种工艺,测量产品某指标结果如下:,均值 总均值 差值 A 62 60 63 59 63 59 6

8、1 64 -3 B 63 67 71 64 65 66 66 64 +2 C 68 66 71 67 68 68 68 64 +4 D 56 62 60 61 63 64 61 64 -3,3.1 单因素方差分析原理,如果处理效果相同,那么有H0:1=2=3 =4,也即组样本均数来自同一总体。 如果4处理效果完全相同,那么处理间变异等于0;整个变异都是处理内(随机误差)引起的。 如果处理,每处理各次重复间没有差异,则总变异都是处理间变异,处理内(随机误差)为0; 上面是极端情况,一般情况是,处理间和处理内都有变异存在。这时计算处理间均方与处理内均方的比值: F= MS处理间 /MS处理内,方差

9、分析表 变异来源 平方和 自由度 均方 F值 p值 处理间 228 3 76 13.57 0.00 处理内 112 20 5.6 总变异 340 23,根据值大小,下结论。,一般用Tukey法和LSD法。但注意:目前国内目前的农药实验要求Duncan 法。,数据转换:如数值相差几个数量级,可用对数转换;如许多小区值为0,则可用平方根转换;如指标是百分数,且大部分数值大于70或小于30,可用反正弦平方根转换。,数据描述:均值和标准差是必须的,处理样本数也要说明。方差分析:F值、自由度和P值;如P0.05则差异显著,如P“随机区组设计”下面的“单因素实验统计分析”。,数据转换:如数值相差几个数量级

10、,可用对数转换;如许多小区值为0,则可用平方根转换;如指标是百分数,且大部分数值大于70或小于30,可用反正弦平方根转换。,一般用Tukey法和LSD法。但注意:目前国内目前的农药实验要求Duncan 法。,结果描述及数据分析与完全随机实验设计相同,就当是区组间那一行不存在,4. 相关与回归分析,1、多变量数据特征描述(相关分析) 2、变量间定量关系(回归分析) 3、复合中心试验设计及优化分析,53,4.1 数值特征描述(相关),相关系数置信区间及偏相关,基本统计(卡方图) 离群值样本是否有异常,基本统计 (box图指标是否有异常值),4.2 回归分析如产量肥料反应函数,4.2.1 回归分析简

11、介,回归(regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。 直线回归是回归分析中最基本、最简单的一种,直线回归方程是Y= a + bX 中,a、b 是决定直线的两个系数.,59,施肥量与产量的关系,一般有: 线性: y=a+bx 二次曲线: y=a+bx+cx2 Mitscherlich方程: y=a(1-10-bx) 幂函数/Cobb-Douglas方程: y=axb 指数曲线 y=aebx,施肥量与产量的关系(多为非线性),拟合二次多项式回归模型(反应面分析),多元线性回归,4.2.2 DPS下回归分析数据格式,根据试验数据建立回归方程,在DPS里,建立回归方程数据格式:一行一个样本一列一个变量因变量放在最右边。建立回归方程,样本个数要大于总变量个数。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号