概率论与数理统计(茆诗松)第二版课后第八章

上传人:n**** 文档编号:89401382 上传时间:2019-05-24 格式:PDF 页数:38 大小:440.81KB
返回 下载 相关 举报
概率论与数理统计(茆诗松)第二版课后第八章_第1页
第1页 / 共38页
概率论与数理统计(茆诗松)第二版课后第八章_第2页
第2页 / 共38页
概率论与数理统计(茆诗松)第二版课后第八章_第3页
第3页 / 共38页
概率论与数理统计(茆诗松)第二版课后第八章_第4页
第4页 / 共38页
概率论与数理统计(茆诗松)第二版课后第八章_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《概率论与数理统计(茆诗松)第二版课后第八章》由会员分享,可在线阅读,更多相关《概率论与数理统计(茆诗松)第二版课后第八章(38页珍藏版)》请在金锄头文库上搜索。

1、 1 第八章 方差分析与回归分析 第八章 方差分析与回归分析 本章前三节研究方差分析,讨论多个正态总体的比较,后两节研究回归分析讨论两个变量之间的相 关关系 8.1 方差分析 8.1.1 问题的提出 上一章讨论了单个或两个正态总体的假设检验,这里讨论多个正态总体的均值比较问题 通常为了研究某一因素对某项指标的影响情况,将该因素在多种情形下进行抽样检验,作出比较一 般将该因素称为一个因子,所检验的每种情形称为水平在每个水平下需要考察的指标都分别构成一个总 体,比较它们的总体均值是否相等对每一个总体都分别抽取一个样本,样本容量称为重复数 如果只对一个因子中的多个水平进行比较,称为单因子方差分析,对

2、多个因子的水平进行比较,称为 多因子方差分析本章只进行单因子方差分析 例 在饲料养鸡增肥的研究中,现有三种饲料配方:A1 , A2 , A3 ,为比较三种饲料的效果,特选 24 只相似 的雏鸡随机均分为三组,每组各喂一种饲料,60 天后观察它们的重量实验结果如下表所示: 饲料 鸡重/g A1 1073 1009 1060 1001 1002 1012 1009 1028 A2 1107 1092 990 1109 1090 1074 1122 1001 A3 1093 1029 1080 1021 1022 1032 1029 1048 在此例中,就是要考察饲料对鸡增重的影响,需要比较三种饲料

3、对鸡增肥的作用是否相同这里,饲 料就是一个因子,三种饲料配方就是该因子的三个水平,每种饲料喂养的雏鸡 60 天后的重量分别构成一 个总体,这里共有 3 个总体,每一个总体抽取样本的重复数都是 8,比较这 3 个总体的均值是否相等 8.1.2 单因子方差分析的统计模型 设因子 A 有 r 个水平 A1 , A2 , , Ar ,在每个水平下需要考察的指标都构成一个总体,即有 r 个总体, 分别记为 Y1 , Y2 , , Yr ,对每一个总体都分别抽取一个样本,首先考虑重复数相等的情形,设重复数都是 m,总体 Yi的样本 Yi1 , Yi2 , , Yim ,i = 1, 2, , r作出以下假

4、定: (1)每一个总体都服从正态分布,即riNY iii , 2, 1),( 2 L=; (2)各个总体的方差都相等,即 22 2 2 1r =L,都记为 2; (3)各个总体及抽取的样本相互独立,即 Yij相互独立,i = 1, 2, , r,j = 1, 2, , m 需要比较它们的总体均值是否相等,即检验的原假设与备择假设为 H0: 1 = 2 = = r vs H1: 1 , 2 , , r不全相等, 如果 H0成立,就可以认为这 r 个水平下的总体均值相同,称为因子 A 不显著;反之,如果 H0不成立,就 称为因子 A 显著 在水平 Ai下的样品 Yij与该水平下的总体均值 i之差

5、ij = Yij i为随机误差由于 Yij N ( i , 2 ), 因此随机误差 ij N (0 , 2 )对所有 r 个水平下的总体均值求平均,即 = =+= r i ir rr 1 21 1 )( 1 L 称为总均值每个水平 Ai下的总体均值 i与总均值 之差 a i = i 称为该水平 Ai下主效应显然所有 主效应 a i之和等于 0,即 0 1 = = r i i a, 2 检验所有水平下的总体均值是否相等,也就是检验所有主效应 a i是否全等于 0这样单因子方差分析在重 复数相等的情形下,统计模型为 = =+= = )., 0( ; 0 ;, 2, 1, 2, 1, 2 1 N a

6、 mjriaY ij r i i ijiij 相互独立,且都服从 LL 检验的原假设与备择假设为 H0:a 1 = a 2 = = a r = 0 vs H1:a 1 , a 2 , , a r不全等于 0 8.1.3 平方和分解 一试验数据 对于 r 个总体下的试验数据 Yij , i = 1, 2, , r,j = 1, 2, , m ,记 Ti表示第 i 个总体下试验数据总和, i Y表示第 i 个总体下样本均值,n = rm 表示总的样本容量,T 表示总的试验数据总和,Y表示总的样本均 值,即 = = m j iji YT 1 , = = m j ij i i Y mm T Y 1 1

7、 , i = 1, 2, , r, = = r i m j ij r i i YTT 111 , = = = r i i r i m j ij Y r Y rm T n Y 111 111 , 用 i Y作为 i的点估计,Y作为 的点估计又记 i 表示第 i 个总体下随机误差平均值,表示总的随机误 差平均值,即 = = m j iji m 1 1 , i = 1, 2, , r, = = = r i i r i m j ij rn 111 11 显然有 += iii Y,+=Y 在单因子方差分析中通常将试验数据及基本计算结果写成表格形式 因子水平 试验数据 和 和的平方 平方和 A1 Y11

8、Y12 Y1m T1 2 1 T 2 1j Y A2 Y21 Y22 Y2m T2 2 2 T 2 2 j Y Ar Yr1 Yr2 Yrm Tr 2 r T 2 rj Y T = r i i T 1 2 = r i m j ij Y 11 2 3 二组内偏差与组间偏差 数据 Yij与样本总均值Y之差YYij称为样本总偏差,可以分成两部分之和: )()(YYYYYY iiijij += , 其中 =+= iijiiijiiij YY)()( 是第 i 个总体内数据与该总体内样本均值的偏差,称为组内偏差,反映第 i 个总体内的随机误差; +=+= iiiii aYY)()( 是第 i 个总体内样

9、本均值与总样本均值的偏差,称为组间偏差,反映第 i 个总体的主效应 三偏差平方和及其自由度 在统计学中,对于 k 个独立数据 Y1 , Y2 , , Yk ,平均值 = = k i i Y k Y 1 1 ,称 Yi与Y之差为偏差,所有偏差 的平方和 = = k i i YYQ 1 2 )( 称为这 k 个数据的偏差平方和,反映这 k 个数据的分散程度由于所有偏差之和 0)( 11 = = YkYYY k i i k i i , 即这 k 个偏差由 k 个独立数据受到一个约束条件形成,可以证明它们与 k 1 个独立(随机)变量可以相互 线性表示,称之为等价于 k 1 个独立(随机)变量一般地,

10、若 k 个独立数据受到 r 个不相关的约束条件, 则它们等价于 k r 个独立(随机)变量在统计学中,把形成平方和的变量所等价的独立变量个数,称为 该平方和的自由度,通常记为 f如上述偏差平方和 Q 的自由度为 k 1,即 fQ = k 1 由于平方和的大小与变量个数(或自由度)有关,为了对偏差进行比较,通常考虑偏差平方和与其自 由度之商,称为均方和,记为 MS,反映一组数据的平均分散程度,如样本方差 = = n i i XX n S 1 22 )( 1 1 就 是样本数据偏差的均方和 四总平方和分解公式 总偏差平方和记为 ST或 SST,其自由度记为 fT ,有 = = r i m j ij

11、T YYS 11 2 )(,fT = rm 1 = n 1; 组内偏差平方和记为 Se或 SSE,其自由度记为 fe ,有 = = r i m j iije YYS 11 2 )(,fe = r (m 1) = n r; 组间偏差平方和记为 SA或 SSA,其自由度记为 fA ,有 = = = r i i r i m j iA YYmYYS 1 2 11 2 )()(,fA = r 1 4 组内偏差平方和反映所有总体内的随机误差,组间偏差平方和反映所有总体的主效应 定理 总偏差平方和 ST可以分解为组内偏差平方和 Se与组间偏差平方和 SA之和,其自由度也可作相应的 分解,即 ST = Se

12、+ SA ,fT = fe + fA ,称之为平方和分解公式 证: = = += r i m j iiij r i m j ijT YYYYYYS 11 2 11 2 )()()( = = = += r i m j iiij r i m j i r i m j iij YYYYYYYY 1111 2 11 2 )(2)()( AeAe r i iAe r i m j iijiAe SSSSYYSSYYYYSS+=+=+=+= = = 00)(2 )()(2 111 , 且显然有 fT = n 1 = (n r) + (r 1) = fe + fA 8.1.4 检验方法 由于组内偏差平方和反映所

13、有总体内的随机误差,组间偏差平方和反映所有总体的主效应,通过比较 组内偏差平方和与组间偏差平方和检验因子的显著性下面将证明在假设所有主效应都等于 0 成立的条件 下,它们的均方和之商服从 F 分布 定理 在单因子方差分析模型中,组内偏差平方和 Se与组间偏差平方和 SA满足 (1)E(S e) = (n r) 2,且)( 2 2 rn Se ; (2) = += r i iA amrS 1 22 ) 1()E(,且当 H0:a 1 = a 2 = = a r = 0 成立时,) 1( 2 2 r SA ; (3)Se与 SA相互独立 证:根据第五章的定理结论知: 设 X1 , X 2 , ,

14、Xn相互独立且都服从正态分布 N ( , 2 ),记 = = n i i X n X 1 1 , = = n i i XXS 1 2 0 )(, 则X与 S0相互独立,且) 1( 2 2 0 n S (1) = = r i m j iije YYS 11 2 )(,Yi1 , Yi2 , , Yim相互独立且都服从正态分布 N ( i, 2 ), = = m i iji Y m Y 1 1 , 则 = m j iij YY 1 2 )(与 i Y相互独立,且) 1()( 1 2 1 2 2 = mYY m j iij , 因在不同水平下的样本都相互独立, 则 = r i m j iij YY 11 2 )(与 r YYY, 21 L也相互独立,且根据独立 2变量的可加性知 )()( 1 2 11 2 2 rrmYY r i m j iij = , 故)()( 1 2 11 2 22 rnYY S r i m j iij e = = ,即得 E(S e) = (n r) 2; 5 (2) = = = = +=+= r i ii r i i r i i r i ii r i iA ammamamYYmS 11 2 1 2 1 2 1 2 )(2)()()(, 因 ij (i = 1, 2, , r,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号