统计分析与方法-第七章回归分析2-异方差与自相关

上传人:宝路 文档编号:48365934 上传时间:2018-07-14 格式:PPT 页数:65 大小:391.16KB
返回 下载 相关 举报
统计分析与方法-第七章回归分析2-异方差与自相关_第1页
第1页 / 共65页
统计分析与方法-第七章回归分析2-异方差与自相关_第2页
第2页 / 共65页
统计分析与方法-第七章回归分析2-异方差与自相关_第3页
第3页 / 共65页
统计分析与方法-第七章回归分析2-异方差与自相关_第4页
第4页 / 共65页
统计分析与方法-第七章回归分析2-异方差与自相关_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《统计分析与方法-第七章回归分析2-异方差与自相关》由会员分享,可在线阅读,更多相关《统计分析与方法-第七章回归分析2-异方差与自相关(65页珍藏版)》请在金锄头文库上搜索。

1、回归分析 异方差与自相关分析应用最小二乘法的前提符合高斯假设n只有满足高斯假设,用最小二乘法估计出 来的回归参数才是无偏的,有效的。n高斯假设主要是针对随机误差项的。回归模型的基本假设n假定随机误差项 具有相同的 方差,独立或不相关,即对于所有样本点 ,有n但在建立实际问题的回归模型时,经常存 在与此假设相违背的情况,一种是计量经 济建模中常说的异方差性,异方差性和自相关性n即:n另一种是自相关性,即:n如果违背了模型中的残差项上述假定时, 则我们所利用的最小二乘法估计出来参数 就不是有效估计!异方差性和自相关性n如何判断这些假设是否成立?即如何判断 回归模型是否有异方差性和自相关性?n最简单

2、的直观方法就是利用残差图。残差概念与残差图n残差就是实际观测值y与通过回归方程给出 的回归值之差:n残差可以看做是误差项的估计值,n残差:n误差项:n比较两个表达式可以正确区分残差与误差 项的异同。回归模型满足基本假设的残差图残差在e=0附近随机变化残差中存在异方差Y和x之间呈非线性关系 或y存在自相关蛛网现象y具有自相关残差的计算nSpss中的参残差计算:n在回归分析中:nStatisticsRegressionLinearn选择Save对话框,点选Residuals下的nUnstandardied选项即可。违背基本假设的情况n异方差性n自相关性异方差性产生的背景和原因n例如:在研究城镇居民

3、收入与购买量的关系时,居 民收入与消费水平有密切关系。n用表示第i户的收入量,表示第i户的消费额,n则消费模型为:n因为各户的收入不同,消费观念和习惯的差异,通 常存在明显的异方差性。n一般情况下,低收入的家庭购买差异比较小,大都 买生活必需品,但高收入的家庭购买行为差异就很 大,导致消费模型的随机项具有不同的方差。n又如:利用某行业的不同企业的截面样本 数据估计C-D生产函数n由于这里的 表示了不同企业的设备、工 艺、地理条件、工人素质、管理水平的差 异以及其他因素,对于不同企业,这些因 素对产出影响的程度不同,引起偏离均值 的程度不同,出现了异方差。n引起异方差的原因很多,当样本数据为截

4、面数据时容易出现异方差性。异方差性带来的问题n当一个回归问题存在异方差性时,如果仍 用普通最小二乘法估计未知参数,将会导 致最小二乘估计量不再具有最小方差的优 良性,即最小二乘估计的有效性被破坏了 。n进一步来说,异方差性会导致回归系数的t 检验值高估,可能造成本来不显著的某些 回归系数变成显著。异方差性带来的问题n当存在异方差时,普通最小二乘估计存在 以下问题:n参数估计值虽是无偏的,但不是最小方差 线性无偏估计;n参数的显著性检验失效;n回归方程的应用效果极不理想。异方差性的检验n残差图分析法n等级相关系数残差图分析法n当回归模型存在异方差时,n残差图上的点的散布呈现n出相应的趋势。n另外

5、,残差e值也可能随y值n的增大而减小,这种情况同n样属于异方差。等级相关系数法n第一步:进行y关于x的普通最小二乘回归 ,求出残差的估计值,即 的值;n第二步 :取 的绝对值,即 ,将 和 进行等级相关系数的计算;n第三步:进行等级相关系数的显著性检验 。n如果相关性显著,则说明存在异方差性。消除异方差性的方法加权最小二乘法n在等方差的条件下,平方和中的每一项的地位 是相同的。然而,在异方差的条件下,平方和 的地位是不相同的,误差项大的项,平方和的 作用就偏大,因而普通最小二乘估计的回归线 就被拉向方差大的项,而方差小的拟合程度就 差。n加权最小二乘估计的方法是在平方和中加入一 个适当的权数,

6、以调整各项在平方和中的作用 。一元加权最小二乘估计n普通最小二乘法的离差平方和为:n加权最小二乘的离差平方和为:一元加权最小二乘法例题 n某地区的居民收入与储蓄额的历史统计数据如下表:残差图误差随着x的增加而增加!Spearman等级相关系数相关性显著,所以存在异方差性加权最小二乘法-寻找最优权数n可以利用spss软件寻找最优权数nStatisticsRegression Weight Estimationn将因变量y与自变量x各自选入各自的变量 框,再把x选入Weight变量框,幂指数( power)取默认值,得出以下结果:寻找最优权数Source variable. 居民收入 Depend

7、ent variable. 储蓄Log-likelihood Function = -224.258830 POWER value = -2.000 Log-likelihood Function = -221.515008 POWER value = -1.500 Log-likelihood Function = -218.832193 POWER value = -1.000 Log-likelihood Function = -216.252339 POWER value = -.500 Log-likelihood Function = -213.856272 POWER value

8、 = .000 Log-likelihood Function = -211.773375 POWER value = .500 Log-likelihood Function = -210.185972 POWER value = 1.000 Log-likelihood Function = -209.316127 POWER value = 1.500 Log-likelihood Function = -209.379714 POWER value = 2.000The Value of POWER Maximizing Log-likelihood Function = 1.500n

9、Multiple R .96744nR Square .93595nAdjusted R Square .93374nStandard Error .12532加权最小二乘法的运算结果普通最小二乘法运算结果nAnalysis of Variance:n DF Sum of Squares Mean SquarenRegression 1 6.6548981 6.6548981nResiduals 29 .4554477 .0157051nF = 423.74135 Signif F = .0000加权最小二乘法的运算结果普通最小二乘法运算结果T检验结果n- Variables in the E

10、quation -nVariable B SE B Beta T Sig Tn居民收入 .087931 .004272 .967443 20.585 .0000n(Constant) -719.12 78.316 - 9.182 .0000加权最小二乘法的运算结果普通最小二乘法运算结果多元加权最小二乘估计n多元线性回归有多个自变量,通常取权函 数W为某个自变量的幂函数n但是应该取哪一个自变量呢?n这只需计算每个自变量与普通残差的等级 相关系数,选取等级相关系数最大的自变 量构造权函数。多元加权最小二乘估计例题n研究北京市各经济开发区经济发展与招商 投资的关系n因变量y:各开发区的销售收入(百万

11、元)n自变量x:n x1为各开发区累计招商数目n x2为招商企业注册资本(百万元 )自变量与误差绝对值之间的等级相关系数因此选取注册资本构造权函数最优权数的幂指数确定Source variable. 注册资本 Dependent variable. 销售收入Log-likelihood Function = -125.581891 POWER value = -2.000 Log-likelihood Function = -122.148284 POWER value = -1.500 Log-likelihood Function = -118.756247 POWER value = -

12、1.000 Log-likelihood Function = -115.440464 POWER value = -.500 Log-likelihood Function = -112.257523 POWER value = .000 Log-likelihood Function = -109.297553 POWER value = .500 Log-likelihood Function = -106.695645 POWER value = 1.000 Log-likelihood Function = -104.627066 POWER value = 1.500 Log-li

13、kelihood Function = -103.261903 POWER value = 2.000 Log-likelihood Function = -102.682848 POWER value = 2.500 Log-likelihood Function = -102.833168 POWER value = 3.000The Value of POWER Maximizing Log-likelihood Function = 2.500模型的评估nMultiple R .92163nR Square .84941nAdjusted R Square .82431nStandard Error .03238方差分析Analysis of Variance:DF Sum of Squares Mean Square Regression 2 .07096521 .03548261 Residuals 12 .01258145 .00104845F = 33.84278 Signif F = .0000T检验- Variables in the Equation - Variable B SE B Beta T Sig T 招商数目 1.696439 .404370 .587146 4.195 .0012 注册资本 .470312 .149306

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号