第一节-方差分析的基本原理与步骤

上传人:F****n 文档编号:99557634 上传时间:2019-09-19 格式:DOC 页数:20 大小:418.50KB
返回 下载 相关 举报
第一节-方差分析的基本原理与步骤_第1页
第1页 / 共20页
第一节-方差分析的基本原理与步骤_第2页
第2页 / 共20页
第一节-方差分析的基本原理与步骤_第3页
第3页 / 共20页
第一节-方差分析的基本原理与步骤_第4页
第4页 / 共20页
第一节-方差分析的基本原理与步骤_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《第一节-方差分析的基本原理与步骤》由会员分享,可在线阅读,更多相关《第一节-方差分析的基本原理与步骤(20页珍藏版)》请在金锄头文库上搜索。

1、第一节 方差分析的基本原理与步骤 方差分析有很多类型,无论简单与否,其基本原理与步骤是相同的。本节结合单因素试验结果的方差分析介绍其原理与步骤。一、线性模型与基本假定 假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如表6-1所示。表6-1k个处理每个处理有n个观测值的数据模式 处理 观测值合计平均A1x11x12x1jx1nA2x21x22x2jx2nAixi1xi2xijxinAkxk1xk2xkjxknxk.合计表中表示第i个处理的第j个观测值(i=1,2,k;j=1,2,n);表示第i个处理n个观测值的和;表示全部观测值的总和;表示第i个处理的平

2、均数;表示全部观测值的总平均数;可以分解为(6-1)表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将再进行分解,令(6-2)(6-3)则(6-4)其中表示全试验观测值总体的平均数,是第i个处理的效应(treatmenteffects)表示处理i对试验结果产生的影响。显然有(6-5)ij是试验误差,相互独立,且服从正态分布N(0,2)。(6-4)式叫做单因素试验的线性模型(linearmodel)亦称数学模型。在这个模型中表示为总平均数、处理效应i、试验误差ij之和。由ij相互独立且服从正态分布N(0,2),可知各处理Ai(i=1,2,k)所属总体亦应具正态性,即服从正态分布N(i

3、,2)。尽管各总体的均数可以不等或相等,2则必须是相等的。所以,单因素试验的数学模型可归纳为:效应的可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。这也是进行其它类型方差分析的前提或基本假定。若将表(6-1)中的观测值xij(i=1,2,k;j=1,2,n)的数据结构(模型)用样本符号来表示,则(6-6)与(6-4)式比较可知,、分别是、(i-)=、(xij-)=的估计值。(6-4)、(6-6)两式告诉我们:每个观测值都包含处理效应(i-或),与误差(或),故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。 二、平方和与

4、自由度的剖分 我们知道,方差与标准差都可以用来度量样本的变异程度。因为方差在统计分析上有许多优点,而且不用开方,所以在方差分析中是用样本方差即均方(meansquares)来度量资料的变异程度的。表6-1中全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。(一)总平方和的剖分在表6-1中,反映全部观测值总变异的总平方和是各观测值xij与总平均数的

5、离均差平方和,记为SST。即因为其中所以(6-7)(6-7)式中,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即(6-7)式中,为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即于是有SST=SSt+SSe(6-8)(6-7),(6-8)两式是单因素试验结果总平方和、处理间平方和、处理内平方和的关系式。这个关系式中三种平方和的简便计算公式如下:(6-9)其中,C=x2/kn称为矫正数。(二)总自由度的剖分在计算总平方和时,资料中的各个观测值要受这一条件的约束,故总自由度等于资

6、料中观测值的总个数减一,即kn-1。总自由度记为dfT,即dfT=kn-1。在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处理数减一,即k-1。处理间自由度记为dft,即dft=k-1。在计算处理内平方和时,要受k个条件的约束,即(i=1,2,k)。故处理内自由度为资料中观测值的总个数减k,即kn-k。处理内自由度记为dfe,即dfe=kn-k=k(n-1)。因为所以(6-10)综合以上各式得:(6-11)各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为(MST或)、MSt(或)和MSe(或)。即(6-12)总均方一般不等于处理间均方加处理内均方

7、。【例6.1】某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。表6-2饲喂不同饲料的鱼的增重(单位:10g) 饲料 鱼的增重(xij)合计平均A131.927.931.828.435.9155.931.18A224.825.726.827.926.2131.426.28A322.123.627.324.925.8123.724.74A427.030.829.024.528.5139.827.96合计=550.8这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下:矫正

8、数总平方和处理间平方和处理内平方和总自由度处理间自由度处理内自由度用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方MSe。因为方差分析中不涉及总均方的数值,所以不必计算之。三、期望均方 如前所述,方差分析的一个基本假定是要求各处理观测值总体的方差相等,即(i=1,2,k)表示第i个处理观测值总体的方差。如果所分析的资料满足这个方差同质性的要求,那么各处理的样本方差S21,S22,S2k都是2的无偏估计(unbiasedestimate)量。(i=1,2,k)是由试验资料中第i个处理的n个观测值算得的方差。显然,各的合并方差(以各处理内的自由度n-1为权的加权平均数)也是

9、2的无偏估计量,且估计的精确度更高。很容易推证处理内均方MSe就是各的合并。其中SSi、dfi(i=1,2,k)分别表示由试验资料中第i个处理的n个观测值算得的平方和与自由度。这就是说,处理内均方MSe是误差方差2的无偏估计量。试验中各处理所属总体的本质差异体现在处理效应的差异上。我们把称为效应方差,它也反映了各处理观测值总体平均数的变异程度,记为。(6-13)因为各未知,所以无法求得的确切值,只能通过试验结果中各处理均数的差异去估计。然而,并非的无偏估计量。这是因为处理观测值的均数间的差异实际上包含了两方面的内容:一是各处理本质上的差异即i(或i)间的差异,二是本身的抽样误差。统计学上已经证

10、明,是+2/n的无偏估计量。因而,我们前面所计算的处理间均方MSt实际上是n+2的无偏估计量。因为MSe是2的无偏估计量,MSt是n+2的无偏估计量,所以2为MSe的数学期望(mathematicalexpectation),n+2为MSt的数学期望。又因为它们是均方的期望值(expectedvalue),故又称期望均方,简记为EMS(expectedmeansquares)。当处理效应的方差=0,亦即各处理观测值总体平均数(i=1,2,,k)相等时,处理间均方MSt与处理内均方一样,也是误差方差2的估计值,方差分析就是通过MSt与MSe的比较来推断是否为零即是否相等的。四、F分布与F检验 (

11、一)F分布设想我们作这样的抽样试验,即在一正态总体N(,2)中随机抽取样本含量为n的样本k个,将各样本观测值整理成表6-1的形式。此时所谓的各处理没有真实差异,各处理只是随机分的组。因此,由(6-12)式算出的和都是误差方差的估计量。以为分母,为分子,求其比值。统计学上把两个均方之比值称为F值。即(6-14)F具有两个自由度:。若在给定的k和n的条件下,继续从该总体进行一系列抽样,则可获得一系列的F值。这些F值所具有的概率分布称为F分布(Fdistribution)。F分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线,其形态随着df1、df2的增大逐渐趋于对称,如图6-1所示。F

12、分布的取值范围是(0,+),其平均值=1。用表示F分布的概率密度函数,则其分布函数为:(6-15)因而F分布右尾从到+的概率为:(6-16)附表4列出的是不同df1和df2下,P(F)=0.05和P(F)=0.01时的F值,即右尾概率=0.05和=0.01时的临界F值,一般记作,。如查附表4,当df1=3,df2=18时,F0.05(3,18)=3.16,F0.01(3,18)=5.09,表示如以df1=dft=3,df2=dfe=18在同一正态总体中连续抽样,则所得F值大于3.16的仅为5%,而大于5.09的仅为1%。(二)F检验附表4是专门为检验代表的总体方差是否比代表的总体方差大而设计的

13、。若实际计算的F值大于,则F值在=0.05的水平上显著,我们以95%的可靠性(即冒5%的风险)推断代表的总体方差大于代表的总体方差。这种用F值出现概率的大小推断两个总体方差是否相等的方法称为F检验(F-test)。在方差分析中所进行的F检验目的在于推断处理间的差异是否存在,检验某项变异因素的效应方差是否为零。因此,在计算F值时总是以被检验因素的均方作分子,以误差均方作分母。应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。在单因素试验结果的方差分析中,无效假设为H0:1=2=k,备择假设为HA:各i不全相等,或H0:=0,HA:0;F=MSt/MSe,也就是要判断处理

14、间均方是否显著大于处理内(误差)均方。如果结论是肯定的,我们将否定H0;反之,不否定H0。反过来理解:如果H0是正确的,那么MSt与MSe都是总体误差2的估计值,理论上讲F值等于1;如果H0是不正确的,那么MSt之期望均方中的就不等于零,理论上讲F值就必大于1。但是由于抽样的原因,即使H0正确,F值也会出现大于1的情况。所以,只有F值大于1达到一定程度时,才有理由否定H0。实际进行F检验时,是将由试验资料所算得的F值与根据df1=dft(大均方,即分子均方的自由度)、df2=dfe(小均方,即分母均方的自由度)查附表4所得的临界F值,相比较作出统计推断的。若F,即P0.05,不能否定H0,统计学上,把这一检验结果表述为:各处理间差异不显著,在F值的右上方标记“ns”,或不标记符号;若F,即0.01P0.05,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异显著,在F值的右上方标记“*”;若F,即P0.01,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异极显著,在F值的右上方标记“*”。对于【例6.1】,因为F=MSt/MSe=38.09/5.34=7.13*;根据df1=dft=3,df2=dfe=16查附表4,得FF0.01(3,16)=5.29,P0.01,表明四种不同饲料对鱼的增重效果差异极显著,用不同的饲料饲喂,增重是

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号