[VIP专享]第十一章多元线性回归和相关分析

上传人:新** 文档编号:457803223 上传时间:2024-01-19 格式:DOC 页数:8 大小:294.50KB
返回 下载 相关 举报
[VIP专享]第十一章多元线性回归和相关分析_第1页
第1页 / 共8页
[VIP专享]第十一章多元线性回归和相关分析_第2页
第2页 / 共8页
[VIP专享]第十一章多元线性回归和相关分析_第3页
第3页 / 共8页
[VIP专享]第十一章多元线性回归和相关分析_第4页
第4页 / 共8页
[VIP专享]第十一章多元线性回归和相关分析_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《[VIP专享]第十一章多元线性回归和相关分析》由会员分享,可在线阅读,更多相关《[VIP专享]第十一章多元线性回归和相关分析(8页珍藏版)》请在金锄头文库上搜索。

1、第十一章多元线性回归和相关分析第一节多元回归分析依变量依两个或两个以上自变量的回归,称为多元回归或复回归(multiple regression)主要内容: 1、确定各个自变量对依变量的综合效应和单独效应,即建立由各自变量描述和预测依变量反应量的多元回归方程; 2、对上述综合效应和单独效应的显著性进行测验,建立最优多元回归方程;评价各自变量对依变量的相对重要性。一、多元回归方程1、多元回归的线性模型和多元回归方程式一个 m元线性回归总体的线性模型为:yj = 0 +1x1j +2x2j +mxmj+ j其中, j N( 0,2)一个 元线性回归样本观察值的组成为:myj = b 0 +b1x1

2、j +b2 x2 j +bmxmj+ej同理一个 m元线性回归方程可给定为:0 是x1 、x2、x都为 0时y的点估计值;bm1 是by1.23的简写,它是在 x2 ,x3,xm皆保持一定时(取常量), x1 每改变一个单位时对 y的b m效应,称为 x2,x3,xm不变时, x1 对y的偏回归系数( partial regression coefficient)。2、多元回归统计数的计算多元线性回归资料的数据结构如下表:个自变量与依变量的回归方程为:my根据最小二乘法原理,b0、b1、 b2 、 bm应使全部观察值 y与回归估计值的偏差平方和为最小,即使根据微分学中的极值原理,分别对 b0

3、、 b1、 b2、 bm偏导,并令其为 0,即该方程组称为正规方程组,可尽一步化为N b0 + b 1x1 + b 2x2 + b 3b0x1+ b 1x12 + b 21 2 + bx xb0x2+ b 1x1x2+ b 2x22 + b3x3 + + b m xm =y1 y1x3 + + b m1 m =xxx x3x2x3 + + b mx2xm =x2 yb0xm+ b 1x1xm+ b 2x2xm + b 3x3 xm + + b mxm2 =xmy写成矩阵形式:AbB系数矩阵偏回归系数矩阵常数项矩阵即Ab = B系数矩阵 A = XX,n组数据的称为结构矩阵或数据矩阵这样一来,正

4、规方程组的矩阵形式是()=XYAb = BX X b或其中 b= ( b0 , b1 , b2, bm) 是正规方程组中的未知数。在系数矩阵满秩的条件下( 这个条件在一般情况是容易满足的 ) ,A的逆阵存在,因而=-1=() -1X Yb A B XXC=A-1 =( XX) -1 称为相关矩阵( 例11.1) 通过 12个北方春玉米杂交种的测定数据( 见表 11.3) ,研究在相同密度下每穗粒数1 ,( X粒) 、百粒重 ( X2 ,g) 、株高 ( X3 ,cm)与每公顷玉米籽粒产量 ( Y, kg/hm2) 的关系。试建立每穗总粒数、百粒重、株高对每公顷玉米产量的多元线性回归方程;解:用

5、矩阵法求解多元线性回归方程 写出结构矩阵或数据矩阵X及依变量列矩阵 Y 利用公式 A =X X ,B = X Y,求得系数矩阵 A和常数项矩阵 B 求系数矩阵 A的逆矩阵 C求解偏回归系数矩阵b = ( b0、 b1、 b2、 、bm) 即 b0 = 2829.29147072 ,b1 = 14.94880992 ,b2 = 238.15014040 ,b3 = 15.29653995 写出线性回归方程1对应的偏回归系数b1=14.9 ,表明在百粒重 ( 2) 、株高 ( 3) 保持平均水平 (=式中:自变量 XXXx2 / n = 403/12 = 33.55g;= x3/ n = 3401

6、/12 = 283.4cm)时,每穗总粒数 ( X1 ) 每增加 1( 粒) ,将使每公顷玉米籽粒产量 ( ) 平均增加 14.9(kg) ;Y同理, b2 =238.2 ,表明在每穗总粒数 ( X1 )、株高 ( X3 ) 保持平均水平 (= x1/ n = 6177/12 = 514.8粒; = 283.4cm) 时,百粒重 (X2) 每增加 1(g),将使每公顷玉米产量 ( ) 平均增加 238.2 (kg) ;b3Y= 15.3 ,表明在每穗总粒数 ( X1) 、百粒重 ( X2) 保持平均水平 (= 514.8粒; = 33.55g ) 时,株高( X3) 每增加 1(cm) ,将使

7、每公顷玉米产量 ( Y) 平均减少 15.3(kg) 。如果此回归关系是真实的 ( 见下文 ) ,则该方程可用于描述表 11.3 的资料。但是,推断的量值处在观察值区间之内,才是可信的。 X1 的区间是 455.0 , 594.5 ,X2的区间是 24.1 ,40.3 ,X3 的区间是 268 ,294 。二、多元线性回归的假设检验1、多元回归方程的假设检验检验 m个自变量综合对 Y的效应是否显著 , 即检验各自变量的总体偏回归系数 j ( j = 1 ,2,) 是否同时为零。总变异平方和及自由度分解。自由度 df Y =n 1SSY =UY/12 m + QY/12 mdf Y =df U

8、+ df Q其中,离回归平方和(或剩余平方和)= Y Y b ( X Y )自由度 df Q = n ( m + 1)它与自变量 X无关,仅反映除依变量与 m个自变量间存在线性关系以外的其他因素包括试验误差所引起的变异。回归平方和=b ( X Y ) (1 Y ) 2 / n自由度 df U =m。它是由 m个自变量 Xj 的不同引起的,即是依变量 Y受m个自变量综合线性影响所引起的变异 F检验若FF( ,m 1) ,那么我们可以在显著水平下,认为多元线性回归方程是成立的,是m n有显著意义的。反之, F F 0.01 (3 , 8) = 7.591 ,说明 P(H0) F 0.01 (1,8

9、) = 11.26 ;说明 H0: 1 = 0 、 2 = 0应被否定,即每穗总粒数F( X1) 、百粒重 ( X2 ) 对每公顷玉米产量 ( Y) 的偏回归都是极显著的。 F3= 0.85 1,说明 H0: 3 = 0应被接受,即株高 ( X3) 对每公顷玉米产量 ( Y) 的偏回归不显著。将结果与三元回归方程的假设检验结果一并做成方差分析表于表 11.4 。11.3 的X1和X2与Y有真实的二元线性回归关系;综合二元回归方程及偏回归系数假设检验结果,表每穗总粒数 ( X1 ,粒 ) 、百粒重 ( X2,g) 对每公顷玉米产量 ( Y,kg) 的偏回归也都是极显著的。二元线性回归方程= 6012.3 + 13.9x 1 + 219.6x 2为表 11.3 资料的最优多元线性回归方程。第二节多元相关和偏相关在M=m+1个变

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号