方差分析及matlab实现

上传人:shaoy****1971 文档编号:115799921 上传时间:2019-11-14 格式:PPT 页数:90 大小:1.30MB
返回 下载 相关 举报
方差分析及matlab实现_第1页
第1页 / 共90页
方差分析及matlab实现_第2页
第2页 / 共90页
方差分析及matlab实现_第3页
第3页 / 共90页
方差分析及matlab实现_第4页
第4页 / 共90页
方差分析及matlab实现_第5页
第5页 / 共90页
点击查看更多>>
资源描述

《方差分析及matlab实现》由会员分享,可在线阅读,更多相关《方差分析及matlab实现(90页珍藏版)》请在金锄头文库上搜索。

1、第第1 1章章 方差分析(方差分析(analysis of variance)analysis of variance) 1 单因素方差分析 1.1 数学模型 1.2 统计分析 1.3 方差分析表 1.4 Matlab实现 2 双因素方差分析 2.1 数学模型 2.2 无交互影响的双因素方差分析 2.3 有交互影响的双因素方差分析 2.4 Matlab实现 第1章 方差分析 在工农业生产和科学研究中,经常遇到这样 的问题:影响产品产量、质量的因素很多,我们 需要了解在这众多的因素中,哪些因素对影响 产品产量、质量有显著影响.为此,要先做试验 ,然后对测试的结果进行分析.方差分析就是分 析测试结

2、果的一种方法. 在方差分析中,把在试验中变化的因素称为 因子,用A、B、C、.表示;因子在试验中所取 的不同状态称为水平,因子A的r个不同水平用 A1、A2、.、Ar表示. 1 单因子方差分析 1.1 基本概念与数学模型 水平观测值 A1x11x12.x1n1 A2x21x22x 2n2 Arxr1xr2x rnr 例:为寻求适应本地区的高产油菜品种,今选了 五种不同品种进行试验,每一品种在四块试验田上 得到在每一块田上的亩产量如下: 我们要研究的问题是诸不同品种的平均亩 产量是否有显著差异. 试验的目的就是要检验假设 H0:1=2=3=4=5 是否成立.若是拒绝 ,那么我们就认为这五种品种

3、的平均亩产量之间有显著差异;反之,就认为各品 种间产量的不同是由随机因素引起的.方差分析就 是检验假设的一种方法. 在本例中只考虑品种这一因子对亩产量的影响 ,五个不同品种就是该因子的五个不同水平.由于 同一品种在不同田块上的亩产量不同,我们可以认 为一个品种的亩产量就是一个总体,在方差分析中 总假定各总体独立地服从同方差正态分布,即第i 个品种的亩产量是一个随机变量,它服从分布 N(i,2), i=1,2,3,4,5. 设在某试验中,因子A有r个不同水平 A1,A2,.,Ar,在Ai水平下的试验结果Xi服从正态 分布N(i,2),i=1,2,.,r,且X1,X2,.,Xr间 相互独立.现在水

4、平Ai下做了ni次试验,获得了ni 个试验结果Xij,j=1,2,.,ni这可以看成是取自Xi 的一个容量为ni的样本,i=1,2,.,r. 实际上,方差分析是检验同方差的若干正态总体 均值是否相等的一种统计方法. 在实际问题中影响总体均值的因素可能不止一 个.我们按试验中因子的个数,可以有单因子方差 分析,双因子分析,多因子分析等.例中是一个单因 子方差分析问题. 水平观测值 A1x11x12.x1n1 A2x21x22x 2n2 Arxr1xr2x rnr 由于XijN(i,2) ,故Xij与i的差可以看成一个 随机误差ijN(0,2) .这样一来,可以假定Xij具有下 述数据结构式: 为

5、了今后方便起见,把参数的形式改变一下,并 记 称为一般平均,i为因子A的第i 个水平的效应. Xij= i+ ij,i=1,2,.,r;j=1,2,.,ni 其中诸ijN(0,2),且相互独立.要检验的假设是 H0:1=2=r 在这样的改变下,单因子方差分析模型中的数 据结构式可以写成: 所要检验的假设可以写成: 为了导出检验假设的统计量,下面我们分析一 下什么是引起诸Xij 波动的原因. 平方和分解公式:引起诸Xij 波动的原因有两个 :一个是假设H0为真时,诸Xij的波动纯粹是随机性 引起的;另一个可能是假设H0不真而引起的.因而我 们就想用一个量来刻划诸Xij之间的波动,并把引起 波动的

6、两个原因用另两个量表示出来,这就是方差 分析中常用的平方和分解法. 1.2 统计分析 其中交叉乘积项 下面我们来看各式的意义 检验统计量的构造: 对于各组样本有 因此 一般,当FF0.01时,称因子的影响高度显著,记为 “*”;当F0.01FF0.05时,称因子的影响显著,记为 “*”; 当FF0.05时,称因子无显著影响,即认为因 子各水平间无差异. 检验过程: 1.3 方差分析表 例:为寻求适应本地区的高产油菜品种,今选了 五种不同品种进行试验,每一品种在四块试验田上 得到在每一块田上的亩产量如下: 我们要研究的问题是诸不同品种的平均亩 产量是否有显著差异. 解:先列表计算 例: 下面给出

7、了随机选取的, 用于计算器的四种 类型的电路的响应时间(以毫秒计). 表: 电路的响应时间 类型I类型II类型III类型IV 19 15 22 20 18 20 40 21 33 27 16 17 15 18 26 18 22 19 这里试验的指标是电路的响应时间. 电路类型为因素. 这一因素有四个水平, 试验的目的是要考察各类型电 路对响应时间的影响. 设四种类型电路的响应时间的总体均为正态, 且各总体方差相同, 但参数均未知. 又设各样 本相互独立. 解 分别以m1,m2,m3,m4记类型I,II,III,IV四种电路 响应时间总体的平均值. 我们需检验(a=0.05) H0:m1=m2=

8、m3=m4, H1:m1,m2,m3,m4不全相等. 现在n=18, s=4, n1=n2=n3=5, n4=3, 试验号12345和和平方 类型I1915222018948836 类型II204021332714119881 类型 III 1617151826928464 类型IV182219593481 ST,SA,SE的自由度依次为17,3,14 表:方差分析表 方差来源 平方和 自由度均方F值显著性 因素318.983106.333.76* 误差395.461428.25 总和714.4417 因F0.95(3, 14)=3.34 X=2.1650 3.6961 1.5538 3.64

9、00 4.9551 1.6268 2.0591 2.2988 3.8644 4.2011 1.0751 3.7971 4.2460 2.6507 4.2348 1.3516 2.2641 2.3610 2.7296 5.8617 0.3035 2.8717 3.5774 4.9846 4.9438; p=anova1(X) p =5.9952e-005 例. 某水产研究所为了比较四种不同配合饲料对鱼 的饲喂效果,选取了条件基本相同的鱼20尾,随 机分成四组,投喂不同饲料,经一个月试验以后 ,各组鱼的增重结果列于下表。 表 饲喂不同饲料的鱼的增(单位:10g) 饲料鱼的增重(xij) A131.

10、927.931.828.435.9 A224.825.726.827.926.2 A322.123.627.324.925.8 A427.030.829.024.528.5 四种不同饲料对鱼的增重效果是否显著 ? 解:这是单因素均衡数据的方差分析,Matlab程序 如下: A=31.927.9 31.8 28.4 35.9 24.825.7 26.8 27.9 26.2 22.123.6 27.3 24.9 25.8 27.030.8 29.0 24.5 28.5; %原始数据输入 B=A; % 将矩阵转置,Matlab中要求各列为不同水平 p=anova1(B) 运行后得到一表一图,表是方差

11、分析表(重要);图 是各列数据的盒子图,离盒子图中心线较远的对应于 较大的F值,较小的概率p. Source 方差来源 SS 平方和 df 自由度 MS均方差F统计 量P值 Columns (因素A组间 ) SSAr-1SS/(r-1)7.140.0029 Error误差( 组内) SSEn-rSS/(n-r) Total 总和 SSTn-1 表中所列出的各项意义如下: 因为p=0.0029F0.99时,称因子的影响高度显著,记为 “*”;当F0.99FF0.95时,称因子的影响显著,记为 “*”; 当FF0.95时,称因子无显著影响,即认为因 子各水平间无差异. 例:为了考察蒸馏水的pH值和

12、硫酸铜溶液浓度对 化验血清中白蛋白与球蛋白的影响,对蒸馏水的 pH值(A)取了4个不同水平,对硫酸铜溶液浓度(B) 取了3个不同水平,在不同水平组合(Ai,Bj)下各测一 次白蛋白与球蛋白之比,其结果列于计算表的左上 角.试检验两因子对化验结果有无显著差异. 解 查F-分布表得:F0.95(3,6)= 4.76, F0.95(2,6)= 5.14 , F0.99(3,6)=9.78, F0.99(2,6)=10.9, 由此可知FA F0.99(3,6); FB F0.99(2,6).所以因子A及 因子B的不同水平对化验结果有高度显著影响. 2.3 有交互作用的双因子方差分析 其中n=rst 仍

13、然用平方和分解的思想来给出检验用的统计 量,先引入下述记号: 由此可知 总的偏差平方和可作如下的分解: 其中各偏差平方和表达式如下: 各偏差平方和的意义: SE表示试验的随机波动引起的误差,称为误差 平方和; SA除了反映了试验的随机波动引起的误差外,还反 映了因子A的效应间的差异,称为因子A的偏差平方和 ; SB除了反映了试验的随机波动引起的误差外,还反映 了因子B的效应间的差异,称为因子B的偏差平方和; SAB除了反映了试验的随机波动引起的误差外,还 反映了交互效应的差异所引起的波动,称为交互作 用的偏差平方和. 同无交互作用的情况类似可得: 检验统计量及显著性检验: 这就是用来检验假设H

14、01,H02,H03,的统计量.按照显 著性假设检验程序,对给定的显著性水平, 当FAF1-(r-1,rs(t-1)时拒绝H01; 当FBF1-(s-1,rs(t-1)时拒绝H02; 当 FABF1-(r-1)(s-1),rs(t-1)时拒绝H03. 具体的计算过程,各偏差平方和的计算也可用下 面简化的表达式,且可列成一张计算表和方差分析 表. 一般,当FF0.99时,称因子的影响高度显著,记为“*”;当 F0. 99FF0.95时,称因子的影响显著,记为“*”;当FF0.95 时, 称因子无显著影响,即认为因子各水平间无差异. 例:在某化工生产中为了提高收率,选了三种不同浓 度,四种不同温度

15、做试验.在同一浓度与同一温度组合 下各做二次试验,其收率数据如下而计算表所列(数据 均已减去75).试检验不同浓度,不同温度以及它们间的 交互作用对收率有无显著影响. 解: 查表知F0.95(2,12)=3.89, F0.99(2,12)=6.93; F0.95(3,12)=3.49, F0.99(3,12)=5.95; F0.95(6,12)=3.00, F0.99(6,12)=4.81. 由此知F0.95 X=5.5 4.5 3.5 5.5 4.5 4.0 6.0 4.0 3.0 6.5 5.0 4.0 7.0 5.5 5.0 7.0 5.0 4.5; p=anova2(X,3) p =

16、0.0000 0.0001 0.7462 *MATLAB和R软件83 例 一火箭使用了4种燃料,3种推进器作射程试验, 每种燃料与每种推进器的组合各发射火箭2次, 得到结果如下: B1B2B3 A158.2,52.6 56.2,41.265.3,60.8 A249.1,42.854.1,50.551.6,48.4 A360.1,58.370.9,73.239.2,40.7 A475.8,71.5 58.2,51.048.7,41.4 试在水平0.05下,检验不同燃料(因素A)、 不同推进器(因素B )下的射程是 否有显著差异?交互作用是否显著? 84 解 编写程序如下: clc,clear x0=58.2,52.6 56.2,41.2 65.3,60.8 49

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 职业教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号