第十章协方差分析

上传人:M****1 文档编号:569445661 上传时间:2024-07-29 格式:PPT 页数:82 大小:2.32MB
返回 下载 相关 举报
第十章协方差分析_第1页
第1页 / 共82页
第十章协方差分析_第2页
第2页 / 共82页
第十章协方差分析_第3页
第3页 / 共82页
第十章协方差分析_第4页
第4页 / 共82页
第十章协方差分析_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《第十章协方差分析》由会员分享,可在线阅读,更多相关《第十章协方差分析(82页珍藏版)》请在金锄头文库上搜索。

1、第十章第十章 协方差分析协方差分析 第一节第一节 协方差分析的意义协方差分析的意义 一是测验多个线性方程中回归系数的差异显著一是测验多个线性方程中回归系数的差异显著性;性;二是对试验进行统计控制,矫正处理平均数并测二是对试验进行统计控制,矫正处理平均数并测验矫正平均数间的差异显著性;验矫正平均数间的差异显著性;三是对协方差组分进行估计;三是对协方差组分进行估计;现分述如下。现分述如下。测验多个线性方程中回归系数测验多个线性方程中回归系数的差异显著性;的差异显著性;如果各bi没有显著差异,则表明各回归线具有相同的斜率;因而可进而求得一个合并的b值,以增加估计的精确性。如果各bi有显著差异,则表明

2、各回归线的斜率不同,不存在共同的b值。对对试验进行统计控制试验进行统计控制为了提高试验的精确性和准确性为了提高试验的精确性和准确性 ,对处理,对处理以外的一切条件都需要采取有效措施严加以外的一切条件都需要采取有效措施严加控制,使它们在各处理间尽量一致,这叫控制,使它们在各处理间尽量一致,这叫试验控制试验控制。但在有些情况下,即使作出很大努力也难但在有些情况下,即使作出很大努力也难以使试验控制达到预期目的。以使试验控制达到预期目的。例如:研究几种配合饲料对猪的增重效例如:研究几种配合饲料对猪的增重效果,希望试验仔猪的初始重相同,因为果,希望试验仔猪的初始重相同,因为仔猪的初始重不同,将影响到猪的

3、增重。仔猪的初始重不同,将影响到猪的增重。经研究发现:经研究发现:增重与初始重之间存在线性回归关系。增重与初始重之间存在线性回归关系。但是,在实际试验中很难满足试验仔猪初始重但是,在实际试验中很难满足试验仔猪初始重相同这一要求。相同这一要求。 这时可利用仔猪的初始重这时可利用仔猪的初始重(记记为为x)与其增重与其增重(记为记为y)的回归关系,的回归关系, 将仔猪增重将仔猪增重都矫正为初始重相同时的增重,于是初始重不都矫正为初始重相同时的增重,于是初始重不同对仔猪增重的影响就消除了。同对仔猪增重的影响就消除了。由于矫正后的增重是应用统计方法将初始重控由于矫正后的增重是应用统计方法将初始重控制一致

4、而得到的,故叫制一致而得到的,故叫统计控制统计控制。统计控制是试验控制的一种辅助手段。统计控制是试验控制的一种辅助手段。若若 y y 的变异主要由的变异主要由x x的不同造成的不同造成( (处理没有显著效应处理没有显著效应) ),则各矫正后的,则各矫正后的 间将没有显著差异间将没有显著差异( (但原但原y y间的差间的差异可能是显著的异可能是显著的) )。若。若 y y的变异除掉的变异除掉x x不同的影响外,不同的影响外, 尚存在不同处理的显著效应,则可期望各尚存在不同处理的显著效应,则可期望各 间将有间将有显著差异显著差异 ( (但原但原y y间差异可能是不显著的间差异可能是不显著的) )。

5、此外,矫。此外,矫正后的正后的 和原和原y y的大小次序也常不一致。所以,的大小次序也常不一致。所以, 处处理平均数的回归矫正和矫正平均数的显著性检验,能理平均数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试够提高试验的准确性和精确性,从而更真实地反映试验实际。这种验实际。这种将回归分析与方差分析结合在一起,对将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做协方差分析试验数据进行分析的方法,叫做协方差分析(analysis of covariance)(analysis of covariance)。 二、估计协方差组分二、估计协方差组分 在

6、前面曾介绍过表示两个相关变量线性相关性质与程度的相在前面曾介绍过表示两个相关变量线性相关性质与程度的相关系数的计算公式:关系数的计算公式: 若将公式右端的分子分母同除以自由度若将公式右端的分子分母同除以自由度(n-1),得,得 其中其中 是是x的均方的均方MSx,它是,它是x的的 方差方差 的无偏估计量;的无偏估计量; 是是y的均方的均方MSy,它是,它是y的的 方差方差 的无偏估计量;的无偏估计量; 称为称为x与与y的平均的离均差的平均的离均差的乘积和,简称均积,记为的乘积和,简称均积,记为MPxy,即,即 (10-2) 与与 均均 积积 相相 应应 的的 总总 体参体参 数数 叫叫 协协

7、方方 差差(covariance),记为),记为COV(x,y)或或 。统计学证明了,。统计学证明了,均积均积MPxy是总体协方差是总体协方差COV(x,y)的无偏估计量,即的无偏估计量,即 EMPxy= COV(x,y)。 于是,样本相关系数于是,样本相关系数r可用均方可用均方MSx、MSy,均积,均积MPxy表示为:表示为: (10-3) 相应的总体相关系数相应的总体相关系数可用可用x与与y的总体标准的总体标准差差 、 ,总体协方差,总体协方差COV(x,y)或或 表示如下:表示如下: (10-4) 均积与均方具有相似的形式均积与均方具有相似的形式 , 也有相似的性质。也有相似的性质。在方

8、差分析中,一个变量的总平方和与自由度可按在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也可统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。按变异来源进行剖分而获得相应的均积。这种这种把两个变量的总乘积和与自由度按变异来源进把两个变量的总乘积和与自由度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分行剖分并获得获得相应均积的方法亦称为协方差分析。析。 在随机模型的方差分析中,根据均方在随机模型的方差分析中,根据均方MS 和期望均方和期望均方 E

9、MS的关系,的关系, 可以得到不同变异来源的方差组分的估可以得到不同变异来源的方差组分的估计值。计值。同样,在随机模型的协方差分析中,根据均积同样,在随机模型的协方差分析中,根据均积 MP 和期和期望均积望均积 EMP 的关系,可的关系,可 得得 到到 不同变异来源的协方差不同变异来源的协方差组分的估计值。组分的估计值。有了这些估计值,就可进行相应的总体相关分析。这些有了这些估计值,就可进行相应的总体相关分析。这些分析在遗传、育种和生态、环保的研究上是很有用处的。分析在遗传、育种和生态、环保的研究上是很有用处的。 由于篇幅限制由于篇幅限制 , 本章只介绍对试验进行统控制的本章只介绍对试验进行统

10、控制的协方差分析。协方差分析。 第二节第二节 单因素试验资料的协方差分析单因素试验资料的协方差分析 设有设有k个处理、个处理、n次重复的双变量试验资料,每处理次重复的双变量试验资料,每处理组内皆有组内皆有n对观测值对观测值x、y,则该资料为具,则该资料为具kn对对x、y观观测值的单向分组资料,其数据一般模式如表测值的单向分组资料,其数据一般模式如表101所所示。示。 表表101 kn对观测值对观测值x、y的单向分组资料的一般形式的单向分组资料的一般形式 表表101的的x和和y变量的自由度和平方和的剖分参见变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。其乘积和的剖分单因素试验资

11、料的方差分析方法一节。其乘积和的剖分则为:则为: 总变异的乘积和总变异的乘积和SPT是是xji与与 和和yji与与 的离均差乘的离均差乘积之和,即:积之和,即: (10-5) =kn-1 其中,其中, 有了上述有了上述SP和和df,再加上,再加上x和和y的相应的相应SS,就可进行协方差分析。,就可进行协方差分析。 例10.1 为研究A、B、C三种肥料对于苹果的增产效果,选了24株同龄的苹果树,第一年记下各树的产量(X),第二年将每种肥料随机施于8株苹果树上,再记下其产量。得结果于如下表,试作分析。肥料观察值Ti(X),Ti(Y)xi,yiAXij 475853464956544440750.8

12、75Yij546663515666615046758.375BXij525364585961636647659.5Yij545367626263646949461.75CXij444846505957585341551.875Yij525854617064696649461.75129854.083145560.625变异来源df SS MS F肥料间260.7530.3751肥料内21830.87539.565总变异23891.625对Y进行的方差分析表明,肥料的效应根本不显著。但是,我们现在不能轻易信任这一推断。因为,虽然各树同龄但其基础生产力(X)有较大的差别。如果基础生产力X与Y无关,

13、那当然要接受对Y的方差分析结果;如果有关,则必须消去X的不同对于Y的影响,才能较正确地评价肥料效应是否存在。而这些推断,都需借助于协方差分析,才能获得。肥料nTi(X)X的累加Ti(Y)Y的累加XY的累加A8407208874672755523985B8476285004943072829588C8415217594943081825884总和2412987114614558910179457行号变异来源dfSSXSSYSPX平均Y平均1肥料A7180.875293.875226.37550.87558.3752肥料B7178223.519559.561.753肥料C7230.875313.5

14、257.7551.87561.754肥料内(误差)21589.75830.875679.1255肥料间2356.08360.7586.62554.08360.6256总变异23945.833891.625765.7554.08360.625处理平均数的回归矫正和矫正平均数的假设测验【例例2】 为了寻找一种较好的哺乳仔猪食为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:哺乳仔猪做了以下试验: 试验设对照、配试验设对照、配方方1、配方、配方2、配方、配方3共四个处理,重复共四个处理,重复12 次,选择初始条件尽量相近的长白种

15、母猪次,选择初始条件尽量相近的长白种母猪的哺乳仔猪的哺乳仔猪48头头 ,完全随机分为,完全随机分为4组进行试组进行试验,结果见表验,结果见表102,试作分析。,试作分析。 表表102 不同食欲增进剂仔猪生长情况表不同食欲增进剂仔猪生长情况表 (单位:(单位:kg) 此例,此例, =18.25+15.40+15.65+13.85=63.15 =141.80+130.10+144.80+133.80 =550.50 k=4,n=12,kn=412=48 协方差分析的计算步骤如下:协方差分析的计算步骤如下: (一一)求求x变量的各项平方和与自由度变量的各项平方和与自由度 1、总平方和与自由度、总平方

16、和与自由度 2、处理间平方和与自由度、处理间平方和与自由度 3、处理内平方和与自由度、处理内平方和与自由度 (二二)求求y变量各项平方和与自由度变量各项平方和与自由度 1、总平方和与自由度、总平方和与自由度 2、处理间平方和与自由度、处理间平方和与自由度 3、处理内平方和与自由度、处理内平方和与自由度 (三三) 求求x和和y两变量的各项离均差乘积和与两变量的各项离均差乘积和与自由度自由度 1、总乘积和与自由度、总乘积和与自由度 2、处理间乘积和与自由度、处理间乘积和与自由度3、处理内乘积和与自由度、处理内乘积和与自由度 平方和、乘积和与自由度的计算结果列于表平方和、乘积和与自由度的计算结果列于

17、表103。 表表103 x与与y的平方和与乘积和表的平方和与乘积和表(四四) 对对x和和y各作方差分析各作方差分析(表表104) 表表104 初生重与初生重与50日龄重的方差分析表日龄重的方差分析表 分析结果表明,分析结果表明,4种处理的供试仔猪平均初生种处理的供试仔猪平均初生重间存在着极显著的差异,其重间存在着极显著的差异,其50 日龄平均重差日龄平均重差异不显著。须进行协方差分析,以消除初生重不异不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误差,揭示出可同对试验结果的影响,减小试验误差,揭示出可能被掩盖的处理间差异的显著性。能被掩盖的处理间差异的显著性。 (五五)

18、协方差分析协方差分析 1、误差项回归关系的分析、误差项回归关系的分析 误差项回归关系分析的意义是要从剔除处理间误差项回归关系分析的意义是要从剔除处理间差异的影响的误差变异中找出差异的影响的误差变异中找出50日龄重日龄重(y)与初生与初生重重(x)之间是否存在线性回归关系。计算出误差项之间是否存在线性回归关系。计算出误差项的回归系数并对线性回归关系进行显著性检验,若的回归系数并对线性回归关系进行显著性检验,若显著则说明两者间存在回归关系。这时就可应用线显著则说明两者间存在回归关系。这时就可应用线性回归关系来校正性回归关系来校正y值值(50日龄重日龄重)以消去仔猪初生以消去仔猪初生重重(x)不同对

19、它的影响。然后根据校正后的不同对它的影响。然后根据校正后的y值值(校正校正50日龄重日龄重)来进行方差分析。如线性回归关系不显来进行方差分析。如线性回归关系不显著,则无需继续进行分析。著,则无需继续进行分析。 回归分析的步骤如下:回归分析的步骤如下: (1) 计算误差项回归系数,回归平方和,离计算误差项回归系数,回归平方和,离回归平方和与相应的自由度回归平方和与相应的自由度 从误差项的平方和与乘积和求误差项回归系从误差项的平方和与乘积和求误差项回归系数:数: (10-10) 误差项回归平方和与自由度误差项回归平方和与自由度 (10-11)误差项离回归平方和与自由度误差项离回归平方和与自由度 1

20、0-12(2) 检验回归关系的显著性检验回归关系的显著性(表表105) 表表105 哺乳仔猪哺乳仔猪50日龄重与初生重的日龄重与初生重的 回归关系显著性检验表回归关系显著性检验表 F检验表明,误差项回归关系极显著,表明检验表明,误差项回归关系极显著,表明哺乳仔猪哺乳仔猪50 日龄重与初生重间存在极显著日龄重与初生重间存在极显著的线性回归关系。因此,可以利用线性回的线性回归关系。因此,可以利用线性回归关系来校正归关系来校正y,并对校正后的,并对校正后的y进行方差进行方差分析。分析。 2、对校正后的、对校正后的50日龄重作方差分析日龄重作方差分析 (1)求校正后的求校正后的50日龄重的各项平方和及

21、自由日龄重的各项平方和及自由度度 利用线性回归关系对利用线性回归关系对50日龄重作校正日龄重作校正 ,并由,并由校正后的校正后的50日龄重计算各项平方和是相当日龄重计算各项平方和是相当 麻烦麻烦的,统计学已证明,校正后的总平方和、误差平的,统计学已证明,校正后的总平方和、误差平方和及自由度等于其相应变异项的离回归平方和方和及自由度等于其相应变异项的离回归平方和及自由度,因此,其各项平方和及自由度可直接及自由度,因此,其各项平方和及自由度可直接由下述公式计算。由下述公式计算。 校正校正50日龄重的总平方和与自由度,即日龄重的总平方和与自由度,即总离回归平方和与自由度总离回归平方和与自由度 (10

22、-13) 校正校正50日龄重的误差项平方和与自由度,日龄重的误差项平方和与自由度,即误差离回归平方和与自由度即误差离回归平方和与自由度 (10-14) 上述回归自由度均为上述回归自由度均为1,因仅有一个自,因仅有一个自变量变量x。 校正校正50日龄重的处理间平方和与自由度日龄重的处理间平方和与自由度 (2) 列出协方差分析表,对校正后的列出协方差分析表,对校正后的50日龄日龄重进行方差分析重进行方差分析(表表106) 查查F值值: =4.275(由线性内插法计由线性内插法计算算),由于,由于F=7.63 ,P0.01,表明,表明对于校正后的对于校正后的50日龄重不同食欲添加剂配方日龄重不同食欲

23、添加剂配方间存在极显著的差异。故须进一步检验不同间存在极显著的差异。故须进一步检验不同处理间的差异显著性,即进行多重比较。处理间的差异显著性,即进行多重比较。 表表106 表表10-2资料的协方差分析表资料的协方差分析表3、根据线性回归关系计算各处理的校正、根据线性回归关系计算各处理的校正50日龄日龄平均重平均重 误差项的回归系数误差项的回归系数 表示初生重对表示初生重对50日龄重日龄重影响的性质和程度,且不包含处理间差异的影响,影响的性质和程度,且不包含处理间差异的影响,于是可用于是可用 根据平均初生重的不同来校正每根据平均初生重的不同来校正每一处理的一处理的50日龄平均重。校正日龄平均重。

24、校正50日龄平均重计日龄平均重计算公式如下:算公式如下: (10-16) 公式中:公式中: 为第为第i处理校正处理校正50日龄平均重;日龄平均重; 为第为第i处理实际处理实际50日龄平均重日龄平均重(见表见表102); 为第为第i处理实际平均初生重处理实际平均初生重(见表见表102); 为全试验的平均数,为全试验的平均数, 为误差回归系数,为误差回归系数, =7.1848 将所需要的各数值代入将所需要的各数值代入(1016)式中,即可计算出式中,即可计算出各处理的校正各处理的校正50日龄平均重日龄平均重(见表见表 107)。 表表107 各处理的校正各处理的校正50日龄平均重计算表日龄平均重计

25、算表 4、各处理校正、各处理校正50日龄平均重间的多重比较日龄平均重间的多重比较 各处理校正各处理校正50日龄平均重间的多重比较,即各种食欲添加剂日龄平均重间的多重比较,即各种食欲添加剂的效果比较。的效果比较。 (1) t检验检验 检验两个处理校正平均数间的差异显著性,可应用检验两个处理校正平均数间的差异显著性,可应用t检验法:检验法: (10-17) (10-18) 式中,式中, 为两个处理校正平均数间的差为两个处理校正平均数间的差异;异; 为两个处理校正平均数差数标准误;为两个处理校正平均数差数标准误; 为误差离回归均方;为误差离回归均方; n为各处理的重复数;为各处理的重复数; 为处理为

26、处理i的的x变量的平均数;变量的平均数; 为处理为处理j的的x变量的平均数;变量的平均数; SSe(x)为为x变量的误差平方和变量的误差平方和 例如,检验食欲添加剂配方例如,检验食欲添加剂配方1与对照校正与对照校正50日龄平均重间的差异显著性:日龄平均重间的差异显著性: 将上面各数值代入将上面各数值代入(1018)式得:式得: 查查t值表,当自由度为值表,当自由度为43时时 (见表见表106误差自误差自由度由度),t0.01(43)=2.70 (利用线性内插法计算利用线性内插法计算),|t| t0.01(43),P0.01 ,表明对照与食欲添加剂,表明对照与食欲添加剂1号号配方校正配方校正50

27、日龄平均重间存在着极显著的差异,日龄平均重间存在着极显著的差异,这里表现为这里表现为1号配方的校正号配方的校正50日龄平均重极显著日龄平均重极显著高于对照。高于对照。 其余的每两处理间的比较都须另行算其余的每两处理间的比较都须另行算出出 ,再进行,再进行t检验。检验。 (2)最小显著差数法)最小显著差数法 利用利用t检验法进行多检验法进行多重比较,每一次比较都要算出各自的重比较,每一次比较都要算出各自的 ,比,比较麻烦。当误差项自由度在较麻烦。当误差项自由度在 20以上,以上,x变量的变变量的变异不甚大异不甚大(即即x变量各处理平均数间差异不显著变量各处理平均数间差异不显著),为简便起见,可计

28、算一个平均的,为简便起见,可计算一个平均的 采用最采用最小显著差数法进行多重比较。小显著差数法进行多重比较。 的计算公式的计算公式如下:如下: (10-19) 公式中公式中SSt(x)为为x变量的处理间平方和。变量的处理间平方和。 然后按误差自由度查临界然后按误差自由度查临界t值,计算出最小显著值,计算出最小显著差数:差数: (10-20) 本例本例x变量处理平均数间差异极显著,不满变量处理平均数间差异极显著,不满足足“x变量的变异不甚大变量的变异不甚大”这一条件这一条件 ,不应采用此,不应采用此处所介绍的最小显著差数法进行多重比较。为了处所介绍的最小显著差数法进行多重比较。为了便于读者熟悉该

29、方法,仍以本例的数据说明之。便于读者熟悉该方法,仍以本例的数据说明之。 此时此时 由由 =43,查临界查临界t值得:值得: t0.05(43)=2.017,t0.01(43)=2.70于是于是 LSD0.05=2.0170.4353=0.878 LSD0.01 =2.700.4353 =1.175 不同食欲添加剂配方与对照校正不同食欲添加剂配方与对照校正50日龄平均重比较结果见表日龄平均重比较结果见表108。 表表108 不同食欲添加剂配方与对照间的不同食欲添加剂配方与对照间的 效果比较表效果比较表 多重比较结果表明:多重比较结果表明: 食欲添加剂配方食欲添加剂配方1、2、3号与对照号与对照比

30、较,比较, 其校正其校正50 日龄平均重间均存在日龄平均重间均存在极极 显显 著的差异,这著的差异,这 里里 表表 现现 为为 配配 方方1、2、3号的校正号的校正50日龄平均重均极日龄平均重均极显著高于对照。显著高于对照。 (3) 最小显著极差法最小显著极差法 当误差自由度在当误差自由度在20以上,以上,x变量的变异不甚变量的变异不甚大,还可以计算出平均的平均数校正标准误大,还可以计算出平均的平均数校正标准误 ,利用利用LSR 法进行多重比较。法进行多重比较。 的计算公式如下:的计算公式如下: (10-21) 然后由误差自由度然后由误差自由度 和秩次距和秩次距k查查SSR表表(或(或q表),

31、计算最小显著极差:表),计算最小显著极差: (10-22) 对于对于【例例10.1】资料,资料, 由于不满足由于不满足“x变量变量的变异不甚大的变异不甚大”这一条件,这一条件, 不应采用此处所介不应采用此处所介绍的绍的LSR法进行多重比较。为了便于读者熟悉该法进行多重比较。为了便于读者熟悉该方法,仍以方法,仍以【例例10.1】的数据说明之。的数据说明之。 =0.8742, n=12,SSt(x)=0.83, SSe(x)=0.92,k=4,代入,代入(1021)式可计算得:式可计算得: SSR值与值与LSR值见表值见表109。 此时此时 表表109 SSR值与值与LSR值表值表 表表1010 各处理校正各处理校正50日龄平均重日龄平均重 多重比较表(多重比较表(SSR法)法) 多重比较结果表明:多重比较结果表明: 食欲添加剂配方食欲添加剂配方3、2、1号的哺号的哺乳仔猪校正乳仔猪校正 5 0 日龄平均重极显著日龄平均重极显著高于对照高于对照 ,不同食欲添加剂配方间,不同食欲添加剂配方间哺乳仔猪校正哺乳仔猪校正50日龄平均重差异不日龄平均重差异不显著。显著。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号