多元线性回归中的假设检验和预测

上传人:s9****2 文档编号:490205983 上传时间:2023-06-20 格式:DOC 页数:18 大小:353KB
返回 下载 相关 举报
多元线性回归中的假设检验和预测_第1页
第1页 / 共18页
多元线性回归中的假设检验和预测_第2页
第2页 / 共18页
多元线性回归中的假设检验和预测_第3页
第3页 / 共18页
多元线性回归中的假设检验和预测_第4页
第4页 / 共18页
多元线性回归中的假设检验和预测_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《多元线性回归中的假设检验和预测》由会员分享,可在线阅读,更多相关《多元线性回归中的假设检验和预测(18页珍藏版)》请在金锄头文库上搜索。

1、5.5 多元线性回归中的假设检验和预测线性回归的显著性检验问题:对于模型(5.4-3),要检验自变量与因变量之间是否显著地具有这种线性联系,做法如下(1)在模型上作假设由组观察值对假设是否成立进行判断,接受则认为,即与无关,线性回归不显著;拒绝则认为线性回归显著。(2)找出检验统计量先做平方和分解总离差平方和为,(即),取(经验回归平面上对应于第i次观测点处的y值),则其中步骤(*)的推导:由(5.4-7)式得 从而(*)前的各项均为0. 于是 记称为剩余(残差)平方和;称为回归平方和。则有平方和分解 其中是由引起的;是由线性回归引起的。构造成立时的检验统计量由定理4.4.2知, 其中为回归参

2、数的个数。当成立时,于是且相互独立,. 故有由抽样分布定理知 由(5.5-3)、(5.5-4)、(5.5-5)及分解定理知 且相互独立,则其中,. 即 以为检验统计量。值的计算,故,从而(3)给定,确定拒绝域无论回归显著与否,不变;回归越显著时,越小,就越大,从而也就越大。故应在值偏大时拒绝,认为回归显著。即:给定显著水平后,取拒绝域为 (4)列方差分析表来源平方和自由度均方离差F显著性回归剩余总和pn-p-1n-1例5.5-1(续例5.4-1)取,检验线性回归的显著性。解:假设MATLAB程序x1=152 183 171 165 158 161 149 158 170 153 164 190

3、 185;x2=50 20 20 30 30 50 60 50 40 55 40 40 20;x=ones(1,13);x1;x2;y=120 141 124 126 117 125 123 125 132 123 132 155 147;b=inv(x*x)*x*y;qt=(13-1)*var(y)qs=(y-x*b)*(y-x*b)qh=qt-qsn=13;p=2;f=(qh/p)/(qs/(n-p-1)qt = 1512qs = 81.4301qh = 1.4306e+003f = 87.8404查表知拒绝域的临界值,故有来源平方和自由度均方离差F显著性回归剩余总和P=2n-p-1=10

4、n-1=12显著即在人的身高相等的条件下,其血压与体重,年龄得线性回归显著。回归系数的显著性检验 问题:当拒绝时,认为回归显著,即回归系数不全为0。那么是否每个自变量都对起作用?因此需要检验是否显著为0.(1)在模型上作假设(2)寻找检验统计量由定理5.4.3知其中 是矩阵的第个主对角元素。当成立时, 以为检验统计量。(3)给定,确定拒绝域当成立时,其估计值应该很接近0,故取拒绝域为 注:要对进行次检验。回归系数检验表j变量显著性12p例5.5.2(续例5.5.1)MATLAB程序c=inv(x*x);for j=1:2t(j)=b(j)/sqrt(qs/(n-p-1)*c(j+1,j+1);

5、endtt = -718.1760 12.8380j变量显著性121.06830.4002-718.1760 12.8380显著显著即在人的身高相等的条件下,体重与年龄均对血压起作用。多重相关系数的另一表达式故有说明:越接近1,回归引起的离差平方和占总离差平方和的比率越大,表示回归模型与子样(试验值)拟合得好,即模型合理。(事实上,上述matlab命令的使用,只是为了便于说明多元线性回归的思想方法,如果只为求解一个具体问题,使用regress命令会更高效。例5.5.1的matlab求解 x1=152 183 171 165 158 161 149 158 170 153 164 190 185

6、; x2=50 20 20 30 30 50 60 50 40 55 40 40 20; x=ones(1,13);x1;x2; y=120 141 124 126 117 125 123 125 132 123 132 155 147; b,bint,e,eint,stats=regress(y,x)b = -62.9634 1.0683 0.4002bint = -100.8412 -25.0855 0.8729 1.2636 0.2148 0.5856e = 0.5741 0.4640 -3.7167 0.6908 -0.8312 -4.0404 2.7768 -0.8355 -2.65

7、27 0.5048 3.7569 -1.0183 4.3274eint = -5.5068 6.6550 -5.3336 6.2615 -8.6643 1.2309 -5.4431 6.8248 -6.4259 4.7634 -9.4998 1.4190 -2.5255 8.0791 -7.0515 5.3804 -8.7044 3.3990 -5.4962 6.5057 -2.0378 9.5517 -4.8938 2.8571 -0.4144 9.0693stats = 0.9461 87.8404 0.0000 8.1430即:多重相关系数r平方为0.9461,检验统计量的值F=87.8

8、404,回归的显著性检验的p值为0.0000,的无偏估计值为8.1430. 故由p值知应认为回归显著;回归系数为b =-62.9634 1.0683 0.4002,从而y=-62.9634+1.0683x1+0.4002x2bint的各个分量是各回归系数的置信区间(借此可以判断回归系数的显著性);e的各个分量是各次误差的估计值;eint的各个分量是各次误差的置信区间。(在旧版本中, stats只返回前三个值. 若要求,只要对e的各个分量求平方和: Qmin=sum(e.2)Qmin = 81.4301若要求,其中是数据阵 x 的行数,是x 的列数,则可以n,m=size(x);sigma2=Q

9、min/(n-m)sigma2 = 8.1430)多元线性回归中的预测问题:当时,求的点估计(点预测)和区间估计(区间预测)。(1)点预测在处,取,。即经验回归平面上对应于点处的y值。(2)区间预测定理5.5.1: 在处,记,则 以此为枢轴量,并取 则可推出的置信概率为的预测区间是: 例5.5.3(续例5.5.2) 当时,求血压的点预测和区间预测。解:延续前面使用regress命令的程序,可有如下结果x0=1 160 25;y0=x0*b %求y0的点估计y0 = 117.9667 alpha=0.05; n,m=size(x); t0=tinv(1-alpha/2,n-m);%求t分布的/2上侧分位数 d0=sqrt(1+x0* inv(x*x)*x0); s=sqrt(sum(e.2)/(n-m); %求S剩 L= t0*s*d0; y0int=y0-L y0+L %求y0的区间估计y0int = 110.4965 125.4369 即:的点预测为117.9667;区间预测(110.4965 125.4369).

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号