第十一章多元线性回归和相关分析.doc

上传人:枫** 文档编号:550904618 上传时间:2022-10-17 格式:DOC 页数:7 大小:124KB
返回 下载 相关 举报
第十一章多元线性回归和相关分析.doc_第1页
第1页 / 共7页
第十一章多元线性回归和相关分析.doc_第2页
第2页 / 共7页
第十一章多元线性回归和相关分析.doc_第3页
第3页 / 共7页
第十一章多元线性回归和相关分析.doc_第4页
第4页 / 共7页
第十一章多元线性回归和相关分析.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《第十一章多元线性回归和相关分析.doc》由会员分享,可在线阅读,更多相关《第十一章多元线性回归和相关分析.doc(7页珍藏版)》请在金锄头文库上搜索。

1、第十一章 多元线性回归和相关分析第一节 多元回归分析 依变量依两个或两个以上自变量的回归,称为多元回归或复回归(multiple regression) 主要内容:1、确定各个自变量对依变量的综合效应和单独效应,即建立由各自变量描述和预测依变量反应量的多元回归方程;2、对上述综合效应和单独效应的显著性进行测验,建立最优多元回归方程;评价各自变量对依变量的相对重要性。一、多元回归方程 1、多元回归的线性模型和多元回归方程式 一个m元线性回归总体的线性模型为: yj= b0+ b 1x1j+ b 2x2j+ b mxmj+ej 其中,ejN( 0,se2) 一个m元线性回归样本观察值的组成为: y

2、j= b0+b1x1j+b2x2j+bmxmj+ej 同理一个m元线性回归方程可给定为: b0是x1、x2、xm都为0时y的点估计值; b1是by1.23m的简写,它是在x2,x3,xm皆保持一定时(取常量),x1每改变一个单位时对y的效应,称为x2,x3,xm不变时,x1对y的偏回归系数(partial regression coefficient) 。2、多元回归统计数的计算 多元线性回归资料的数据结构如下表: m个自变量与依变量y的回归方程为: 根据最小二乘法原理, b0 、b1、 b2、bm应使全部观察值y与回归估计值 的偏差平方和为最小,即使 根据微分学中的极值原理,分别对b0 、b

3、1、 b2、bm偏导,并令其为0,即 该方程组称为正规方程组,可尽一步化为N b0 + b1Sx1 + b2Sx2 + b3Sx3 + + bmSxm =Syb0Sx1+ b1Sx12+ b2Sx1x2 + b3Sx1x3 + + bmSx1xm =Sx1yb0Sx2+ b1Sx1x2+ b2Sx22 + b3Sx2x3 + + bmSx2xm =Sx2y b0Sxm+ b1Sx1xm+ b2Sx2xm + b3Sx3xm + + bmSxm2 =Sxmy 写成矩阵形式: A b B 系数矩阵 偏回归系数矩阵 常数项矩阵即 Ab = B系数矩阵A = X X,n组数据的称为结构矩阵或数据矩阵这

4、样一来,正规方程组的矩阵形式是(XX)b = X Y或 Ab = B 其中b = (b0, b1, b2, bm)是正规方程组中的未知数。在系数矩阵满秩的条件下(这个条件在一般情况是容易满足的),A的逆阵存在,因而b=A-1B=(X X)-1X YC=A-1=(X X)-1称为相关矩阵 (例11.1)通过12个北方春玉米杂交种的测定数据(见表11.3),研究在相同密度下每穗粒数(X1,粒)、百粒重 (X2,g)、株高(X3,cm)与每公顷玉米籽粒产量(Y,kg/hm2)的关系。试建立每穗总粒数、百粒重、株高对每公顷玉米产量的多元线性回归方程; 解:用矩阵法求解多元线性回归方程 写出结构矩阵或数

5、据矩阵X及依变量列矩阵Y 利用公式A =X X ,B = X Y,求得系数矩阵A和常数项矩阵B 求系数矩阵A的逆矩阵C 求解偏回归系数矩阵b = ( b0、b1、b2、bm) 即 b0 = 2829.29147072,b1 = 14.94880992,b2 = 238.15014040,b3 = 15.29653995 写出线性回归方程 式中:自变量X1对应的偏回归系数b1 = 14.9,表明在百粒重(X2)、株高(X3)保持平均水平(= x2/n = 403/12 = 33.55g;= x3/n = 3401/12 = 283.4cm)时,每穗总粒数(X1)每增加1(粒),将使每公顷玉米籽粒

6、产量(Y)平均增加14.9 (kg); 同理,b2 =238.2,表明在每穗总粒数(X1) 、株高(X3)保持平均水平(= x1/n = 6177/12 = 514.8粒; = 283.4cm)时,百粒重(X2)每增加1(g),将使每公顷玉米产量(Y)平均增加238.2 (kg);b3 = 15.3,表明在每穗总粒数(X1) 、百粒重(X2)保持平均水平(= 514.8粒; = 33.55g )时,株高(X3)每增加1(cm),将使每公顷玉米产量(Y)平均减少15.3(kg)。如果此回归关系是真实的(见下文),则该方程可用于描述表11.3的资料。但是,推断的量值处在观察值区间之内,才是可信的。

7、X1的区间是455.0,594.5,X2的区间是24.1,40.3,X3的区间是268,294。二、多元线性回归的假设检验 1、多元回归方程的假设检验 检验m个自变量综合对Y的效应是否显著 ,即检验各自变量的总体偏回归系数bj (j = 1,2,)是否同时为零。 总变异平方和及自由度分解。自由度dfY = n 1 SSY = UY/12m + QY/12m dfY = dfU + dfQ 其中,离回归平方和(或剩余平方和) = Y Y b (X Y ) 自由度dfQ = n (m + 1) 它与自变量X无关,仅反映除依变量与m个自变量间存在线性关系以外的其他因素包括试验误差所引起的变异。 回归

8、平方和 =b (X Y ) (1Y )2 /n 自由度dfU = m。它是由m个自变量Xj的不同引起的,即是依变量Y受m个自变量综合线性影响所引起的变异 F检验 若 F Fa (m,n m 1),那么我们可以在显著水平a下,认为多元线性回归方程是成立的,是有显著意义的。反之,F F0.01 (3,8) = 7.591,说明P(H0) F0.01 (1,8) = 11.26;说明H0:b1 = 0、b2 = 0应被否定,即每穗总粒数(X1)、百粒重(X2)对每公顷玉米产量(Y)的偏回归都是极显著的。F3 = 0.85 F0.01 (2,9) = 8.02,表明RY12极显著(实际P0.0002)。 若用查Ra值法,则由df2 = n m 1 =9与M = m + 1 = 2 + 1 = 3,查附表9得R0.01(9,3) = 0.800,因为RY12 = 0.9239 R0.01 = 0.800,故P 0.01,二元相关系数RY12极显著,与F检验法结论完全一致。 假设检验结果表明:每公顷玉米籽粒产量(Y)与每穗总粒数(X1)、百粒重(

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号