方差分析和回归分析

上传人:s9****2 文档编号:551657113 上传时间:2023-09-02 格式:DOC 页数:15 大小:277.50KB
返回 下载 相关 举报
方差分析和回归分析_第1页
第1页 / 共15页
方差分析和回归分析_第2页
第2页 / 共15页
方差分析和回归分析_第3页
第3页 / 共15页
方差分析和回归分析_第4页
第4页 / 共15页
方差分析和回归分析_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《方差分析和回归分析》由会员分享,可在线阅读,更多相关《方差分析和回归分析(15页珍藏版)》请在金锄头文库上搜索。

1、第八章 方差分析和回归分析教学目的和要求:1、熟悉单因子方差分析;2、理解回归分析的基本思想,掌握一元线性回归模型。 教学重点和难点重点:单因子方差分析和一元线性回归分析 难点:方差分析的运用及线性回归模型的建立和其显著性检验8.1 方差分析一.单因子方差分析1. 提出问题设某因子有r个水平,即为A ,.,A,在每一水平下各作m次独立重复试1r验,若记第 i 个水平下第 j 次重复的实验结果为 y ,所有试验的结果可列于表ij如下:因子水平试验数据和平均Ayy . yTy11112 1m11A2y21y. y22 2mT2y2Ayy . yTyrr1r2rmrr合计Ty对这个试验要研究的问题是

2、:r个水平A,.,A间有无显著差异。 1r2. 基本假定(1 )第i个水平下的数据y,y,y是来自正态总体N(卩Q 2), i1 i2 im i ii = 1,2,.,r,的一个样本。(2) r个方差相同,即Q 2 = Q 2 =c 2 = Q 2 12r( 3)诸数据 y 都相互独立ij在这三个基本假定下,要检验的假设是H :卩=卩=卩 o H :卩,卩,卩不全相等0 1 2 r 1 1 2 r方差分析就是在方差相等的条件下,对若干个正态均值是否相等的假设检验。3. 平方和分解式其中,记yi S = S + S , f = f + fT A e T A e1 y=y y , mijj=1i

3、y y i y - y = yy y =_y y rmi=1 j=1j ri 口i=1注意几个概念:其自由度f二n -1TS =yy (y- y称为总平方和,Tiji=1 j=1 S = my (y - y )2称为组间平方和或因子A的平方和,其自由度f = r -1Ai Ai=1 S = yy (y y )称为组内平方和或误差平方和,其自由度f = n reiji ei=1 j=14. 方差分析表来源平方和自由度均方和F比因子s =丄 y t 2A mii=1T 2rmf = r -1AMS = S / fAAAF = MS / MSAe误差S = S -SeTAf = r (m -1)eM

4、S = S / f ee e总和S =yrym y2Tiji =1 j =1T 2rmf = rm -1T5. 判断在H 成立的条件下,F = MS /MS F (f , f ),对给定的显著水平 0 A e A ea (0 a F (f , f ),其中F (f , f )可查表1-a A e1-a A e若F F (f , f ),则可以认为因子A显著,即诸正态均值间有显著差异; 1-a A e若F F (f , f ),则说明因子A不显著,即保留原假设H。1 -a A e0二数据结构式及其参数估计1. 数据结构式y =p + a +e , i = 1,2,,r;j = 1,.,miji

5、ij其中卩为总均值,a为第i个水平的效应,且乞a = 0 , e为试验误差,i i iji=1所有e可作为来自N(Oq 2)的一个样本,在上述数据结构式下,ijy N(卩+ a Q2)。要检验的假设检验可改写为ij iH : a = a = = a = 0 o H : a ,a,,a 不全为 00 1 2 r 1 1 2 r2. 点估计总均值卩的估计为n = y ;水平均值卩的估计h = y , i = 1,2,r ;ii i 主效应a的估计a = y 一 y, i = 1,2,., rii i 误差方差b 2的估计2 = MS = S /fe e e3. 1 -a的置信区间p的1-a的置信区

6、间是y bt(f)/mii 1-a/2 e4. 单因子试验的统计分析可以知道如下三个结果1、因子 A 是否显著2、试验误差方差b 2的估计3、诸水平均值p的点估计与区间估计(此项在因子A不显著时无需进行)i三.重复数不等情形下的方差分析1. 获得数据设因子A有r个水平A,并且第r个水平A下重复进行m次试验,1rii可得如下数据:因子水平重复数试验数据和平均Amyy . yTy11 1112 1m111口Amyy . yTy22 21222m222 Armryr1yr2yrmrTryr 合计nTy2. 基本假定、平方和分解、方差分析和判断准则都和前面一样,只是因子 A 的 平方和S的计算公式略有

7、不同:记n = m,则Aii=1A m n i =1i3. 数据结构式及参数估计式基本同前,需要注意下面两点:1r(1 )总均值卩=一丫 m卩;ni ii=1(2 )主效应约束条件为 ma = 0ii i=18.2 线性回归分析一.一元情形以前我们所研究的函数关系是完全确定的,但在实际问题中,常常会遇到两 个变量之间具有密切关系却又不能用一个确定的数学式子表达,这种非确定性的 关系称为相关关系。通过大量的试验和观察,用统计的方法找到试验结果的统计 规律,这种方法称为回归分析。一元回归分析是研究两个变量之间的相关关系的方法。如果两个变量之间的 关系是线性的,这就是一元线性回归问题。一元线性回归问

8、题主要分以下三个方 面:(1)通过对大量试验数据的分析、处理,得到两个变量之间的经验公式即 一元线性回归方程。(2)对经验公式的可信程度进行检验,判断经验公式是否可信。(3)利用已建立的经验公式,进行预测和控制。1散点图与回归直线在一元线性回归分析里,主要是考察随机变量 y 与普通变量 x 之间的关系 通过试验,可得到 x、y 的若干对实测数据,将这些数据在坐标系中描绘出来 所得到的图叫做散点图。例1 在硝酸钠(NaNO )的溶解度试验中,测得在不同温度x (C )下,溶3解于100份水中的硝酸钠份数y的数据如下:xi0410152129366168y.i66. 771. 076. 380.

9、685. 792. 999. 4113. 6125. 1给出散点图并试建 x 与 y 的经验公式。解 将每对观察值( x , y )在直角坐标系中描出,得散点图如图 1 所示。 ii从图1 可看出,这些点虽不在一条直线上,但都在一条直线附近。于是,很自然 会想到用一条直线来近似地表示 x 与 y 之间的关系,这条直线的方程就叫做 y 对x的一元线性回归方程。设这条直线的方程为y =a+bx其中a、b叫做回归系数(y表示直线上y的值与实际值y不同)。i图1散点图130. 00120. 00110. 00100. 00Y90. 0080. 0070. 0060. 000. 0010. 0020.

10、0030. 0040. 0050. 0060. 0070. 00X下面是怎样确定a和b,使直线总的看来最靠近这几个点。2最小二乘法在一次试验中,取得 n 对数据( x , y ),其中 y 是随机变量 y 对应于 x 的 观察值。我们所要求的直线应该是使所有i y - y I之和最小的一条直线,其中 iy =a+bx。由于绝对值在处理上比较麻烦,所以用平方和来代替,即要求a、b ii的值使Q= (y - y )2最小。利用多元函数求极值的方法求回归系数a、b,得ii其中x=1 Xx , y =1工ynii=1 八a = y - b xv 入 Lb = Lxx,L =工(x - x)2 =工 x

11、2 - nx2xxiii=1i =1nii=1L =工(y - y)2 =工 y2 - ny2,L =工(x - x)(y - y)=工yyiixyiii=1i =1i=1i =1八八从而得到一元线性回归方程y = a + b x。其中a, b称为参数a、 估计,上述方法叫做最小二乘估计法。x y - nxyiib 的最小二乘下面计算例1中y对x的一元线性回归方程。这里n=9, ( x , y )由例1给出,计算出x =26 ,iiL = i x2 9x2 =10144 - 9 x 262=4060xxii=1L = iy2 -9y2 =76218.17 - 9 x 90.14442=3083

12、.9822yyii=1L = Xx y -9xy =24628.6 - 9 x 26 x 90.1444=35 34.8xy i i i=1入 L 3534 8入-b = = 3534.8 =0.8706 a = y - b x =90.1444 - 0.8706 x 26=67.5078 L 4046xy故所求回归方程为y =67.5078+0.8706x3. 回归方程的显著性检验一般的情况下,给定n对数组,总能建立一个方程,但是这个方程是否有效, 还需作检验,也就是说回归的显著不显著需要检验。若回归方程中 b =0,则回 归方程变成 y = a, 不再与 x 有关,因此检验的原假设与备择假

13、设为:y =90.1444,H :b = 0 吕 H :b 丰 0 ,0 1为了寻求检验的统计量。我们把总体平方和分解,令y = a + bxii s =X(y -y)2 =X(y -y )2 + 工(y -y)2总ii iii=1i=1i=1令i/)2 = s ,称为剩余平方和。工(y -y)2 = s称为回归平方和i回i i剩i=1i=1再来分析它们的分布,X(y. - y)2X(y. - y.)24咒2(n 一 1),若能求出41的自由度,a2i+=1a 2丫( y -刃2则4的自由度也就知道了。 为了求X( y - y )24的自由度,只要求出 (y - y )2的数学期望就可。iii =1由于E(y - y )2iii=1=En(y - y)2 - Eb2lixxi=1=(n 1)2 + b2 L cy2 b2 Lxx x

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 活动策划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号