应用回归分析第七章答案综述

上传人:m**** 文档编号:466006782 上传时间:2023-12-26 格式:DOCX 页数:18 大小:178.88KB
返回 下载 相关 举报
应用回归分析第七章答案综述_第1页
第1页 / 共18页
应用回归分析第七章答案综述_第2页
第2页 / 共18页
应用回归分析第七章答案综述_第3页
第3页 / 共18页
应用回归分析第七章答案综述_第4页
第4页 / 共18页
应用回归分析第七章答案综述_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《应用回归分析第七章答案综述》由会员分享,可在线阅读,更多相关《应用回归分析第七章答案综述(18页珍藏版)》请在金锄头文库上搜索。

1、第七章岭回归1 .岭回归估计是在什么情况下提出的?答:当解释变量间出现严重的多重共线性时,用普通最小二乘法估计模型参数,往往参数估计方差太大,使普通最小二乘法的效果变得很不理想,为了解决这一问题,统计学家从模型和数据的角度考虑,采用回归诊断和自变量选择来克服多重共线性的影响,这时,岭回归作为一种新的回归方法被提出来了。2 .岭回归估计的定义及其统计思想是什么?答:一种改进最小二乘估计的方法叫做岭估计。当自变量间存在多重共线性,IXXI0时,我们设想给XX加上一个正常数矩阵kI(k0),那么XX+kI接近奇异的程度小得多,考虑到变量的量纲问题,先对数据作标准化,为了计算方便,标准化后的设计阵仍然

2、用x表示,定义为?()=(XX、1)Xy,称为口的岭回归估计,其中k称为岭参数。3 .选择岭参数k有哪几种主要方法?答:选择岭参数的几种常用方法有1.岭迹法,2.方差扩大因子法,3.由残差平方和来确定k值。4 .用岭回归方法选择自变量应遵从哪些基本原则?答:用岭回归方法来选择变量应遵从的原则有:(1)在岭回归的计算中,我们假定设计矩阵X已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小,我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量。(2)当k值较小时标准化岭回归系数的绝对值并不是很小,但是不稳定,随着k的增加迅速趋于零。像这样的岭回归系数不稳定,震动趋于零的自变量,我们

3、也可以予以删除。(3)去掉标准化岭回归系数很不稳定的自变量,如果有若干个岭回归系数不稳定,究竟去掉几个,去掉哪几个,这并无一般原则可循,这需根据去掉某个变量后重新进行岭回归分析的效果来确定。5.对第5章习题9的数据,逐步回归的结果只保留了3个自变量x1,x2,x5,用y对这3个自变量做岭回归分析。答:依题意,对逐步回归法所保留的三个自变量做岭回归分析。程序为:includeC:ProgramFilesSPSSEVALRidgeregression.sps.ridgeregdep=y/enterx1x2x5/start=0.0/stop=1/inc=0.01.岭迹图如下:RIDGETRACE4.

4、0000003.0000002.0000001.0000000.000000-1.000000-2.000000Kx1Kx2Kx5Kx1Kx2Kx5K计算结果为:0000099603-105933-1492733541407010009864209313G329129562109,02000.98539191S19.341587.452B40.030009s492230163.3402704126110400098461260816337780391239.05000.98437263529.335371.377736.060009s416271990.33319156S26907000983

5、94277911331219361151,080009837328219532941S355522.0900D.98351.2S5360.327744.35089710000983282S7729326179346982110009830J2S961132469S343538.12000.93279.290350.323286.340588130009S252291S45.321931337a94140009822429256932062433544215000.98195.293075.319357.3331S7.1600098164293404.318126.331092170009813

6、229358831692632913018000.98099293650.315752.327232为3白1P31门二RSQX1X2X5可以看到,变量XI、X2迅速由负变正,X5迅速减小,在0.01-0.1之间各回归系数的岭估计基本稳定,重新做岭回归。岭迹图如下:先取k=0.08语法命令如下:includeC:ProgramFilesSPSSEVALRidgeregression.sps.ridgeregdep=y/enterx1x2x5/k=0.08.运行结果如下:*RidgeRressionwithk=008*MultR991日293RSquare.9037253AdjRSqu980853

7、3SE3608&50487ANOVAtabledfSSMSRegress3.0001338355144461103SResidual170002214169.0130245.24FvalueSigFM252183纲0000000VariablesintheEquationBelaB/SE0).2021945117306313329415116.37U1013555222268706207BSE(0)x1.1601053一013G486x2.07970860043688x50641667002480000000006.39S&437Constant73S8441562115.4688705得到回

8、归方程为:y?=0.16x10.08x20.06x3738.84再取k=0.01:语法命令如下:includeC:ProgramFilesSPSSEVALRidgeregression.sps.ridgeregdep=y/enterx1x2x5/k=0.01.运行结果:*RidgeRegressionwithk=0.01*MultR.9931857RSquare.9864179AdjRSqu.9840210SE329.6916494ANOVAtabledfSSMSRegress3.00013420184144733947Residual17.0001847841.9108696.58Fvalu

9、eSigF411.5487845.0000000VariablesintheEquationBSE(B)BetaB/SE(B)x1.0556780.0615651.0981355.9043751x2.0796395.0218437.32912933.6458814x5.1014400.0108941.56210889.3114792Constant753.3058478121.7381256.00000006.1879205回归方程为:y=753.3058-0.05568x10.0796x20.1014x5从上表可看出,方程通过F检验,R检验,经查表,所有自变量均通过t检验,说明回归方程通过检

10、验。从经济意义上讲,x1(农业增加值)、x2(工业增加值)x5(社会消费总额)的增加应该对y(财政收入)有正方向的影响,岭回归方程中三个自变量的系数均为正值,与实际的经济意义相符。比逐步回归法得到的方程有合理解释。6 .对习题3.12的问题,分别用普通最小二乘和岭回归建立GDP对第二产业增加值x2,和第三产业增加值x3的二元线性回归,解释所得到的回归系数?答:(1)普通最小二乘法:ModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)4352.859679.0656.410.00

11、0第二产业增加值1.438.151.7759.544.000第三产业增加值.679.244.2262.784.017Coefficientsaa.DependentVariable:GDP根据上表得到y与x2,x3的线性回归方程为:?=4352.859+1.438x2+0.679x3上式中的回归系数得不到合理的解释.典的数值应该大于1,实际上,x3的年增长幅度大于Xi和x2的年增长幅度,因此合理的区的数值应大于1。这个问题产生的原因仍然是存在共线性,所以采用岭回归来改进这个问题。(2)岭回归法:程序为:includeC:ProgramFilesSPSSEVALRidgeregression.s

12、ps.ridgeregdep=GDP/enterx2x3/start=0.0/stop=0.5/inc=0.01.根据岭迹图(如下图)可知,胤(k)和%(k)很不稳定,但其和大体上稳定,说明x2和x3存在多重共线性。取k=0.1,SPSS输出结果为:MultR.998145,RSquare.996294AdjRSqu.995677,SE2364.837767ANOVAtabledfSSMSRegress2.0001.80E+0109.02E+009Residual12.000671094925592457.7FvalueSigF1613.140715.000000VariablesintheE

13、quationBSE(B)BetaB/SE(B)x2.907990.021842.48906741.571133x31.393800.035366.46364939.410560Constant6552.3059861278.903452.0000005.123378RIDGETRACE0.8000000.7000000.6000000.5000000.4000000.3000000.2000000.000000.100000.200000.300000.400000.500000.60000Kx2Kx3。K岭M逢纵伺彳27嘎5飙琳9静石+1坳翻隹:及13保持不变时,第三产业增加值X3每增加1

14、亿元GDP增加1.227亿元,这不解释是合理的。?7 .一家大型商业银行有多家分行,近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法,表7.5是该银行所属25家分行2002年的有关业务数据。(1)计算y与其余四个变量的简单相关系数。(2)建立不良贷款y对4个自变量的线性回归方程,所得的回归系数是否合理?(3)分析回归模型的共线性。(4)采用后退法和逐步回归法选择变量,所得回归方程的回归系数是否合理,是否还存在共线性?(5)建立不良贷款y对4个自变量的岭回归。(6)对第4步剔除变量后的回归方程再做岭回归。(7)某研究人员希望做y对各项贷款余额,本年累计应收贷

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 营销创新

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号