文档详情

多元线性回归共线性异方差自相关

博****1
实名认证
店铺
PPT
227.50KB
约31页
文档ID:585668353
多元线性回归共线性异方差自相关_第1页
1/31

多元线性回归 南开大学商学院周宝源 回归模型诊断 第一节 多重共线性 一、基本概念一、基本概念(一)完全多重共线性(一)完全多重共线性n指线性回归模型中的若干解释变量或全部指线性回归模型中的若干解释变量或全部解释变量的样本观察值之间具有某种严格解释变量的样本观察值之间具有某种严格的线性关系的线性关系二)近似多重共线性(二)近似多重共线性n指线性回归模型中的若干解释变量或全部指线性回归模型中的若干解释变量或全部解释变量的样本观察值之间存在着近似的解释变量的样本观察值之间存在着近似的线性关系线性关系 二、多重共线性的产生原因n1、经济变量间的内在关系、经济变量间的内在关系n2、经济变量在时间上有同方向变动的趋、经济变量在时间上有同方向变动的趋势势n3、分布滞后变量模型的广泛应用、分布滞后变量模型的广泛应用n4、模型设定的偏误、模型设定的偏误n5、其他、其他 三、多重共线性的后果n随着多重共线性程度的提高,参数方差会急剧上升到很大的水平,理论上使最小二乘法估计的有效性、可靠性和价值都受到影响,实践中参数估计的稳定性和可靠程度下降n1、具有较大的方差与协方差,难以得到精确、具有较大的方差与协方差,难以得到精确的估计的估计n2、使得参数估计值很不稳定、使得参数估计值很不稳定n3、使得、使得t检验得出误导性的结果检验得出误导性的结果n4、产生有偏的预测置信区间,使预测失效、产生有偏的预测置信区间,使预测失效。

四、四、多重共线性的诊断(一)方差扩大因子(二)容忍度(三)状态指数 (一)方差扩大因子(一)方差扩大因子方差扩大因子VIFn对每个解释变量Xk,可以计算VIFkn通常认为方差扩大因子大于10时,第 个解释变量存在较强的、必须加以处理的多重共线性 (二)容忍度容忍度(tolerance),也称为容许度,它是方差膨胀因子的倒数因此,一般认为容忍度小于0.1时(对应于VIF大于10),相应自变量存在较强的、必须加以处理的多重共线性 (二)状态指数(二)状态指数状态指数(condition index):通常简称为CIn通常认为:nCI值介于10与30之间时,认为存在中等程度的多重共线性nCI值在30以上时,认为存在严重多重共线性 例:分析以Y为因变量,X1和X2为自变量的回归模型是否存在多重共线性问题 SPSS操作n从Analyze → Regression → Linear 打开Linear 线性回归主对话框n将自变量与因变量分别选入相应框中n点击“Statistics”按钮,在新打开的对话框中选中“Collinearity diagnostic”,n点击“Continue”n点击“OK” 两个自变量对应的VIF均显著超过10( tolerance 均小于0.1),所以回归模型存在严重的多重共线性。

最大的CI显著超过30,表明回归模型模型存在严重的多重共线性 多重共线性的其他诊断方法多重共线性的其他诊断方法n1. R2很高,Y与各自变量的相关系数也很高,但自变量的回归系数均不显著或显著不为零的回归系数较少;n2.某两个自变量的相关系数较高;n3.从直观上知,某自变量与其他自变量存在函数关系n4.回归系数估计结果在符号上与有关理论或经验相反n5 . 其他方法 第二节 异方差性 一、异方差的概念一、异方差的概念 二、异方差产生的原因二、异方差产生的原因n(一)数据质量原因(一)数据质量原因n(二)模型设定原因(二)模型设定原因n1、因变量的测量误差、因变量的测量误差n2、省略某些自变量、省略某些自变量n3、模型数学形式设定错误、模型数学形式设定错误n4、随机系数模型、随机系数模型n5、异常值的出现、异常值的出现 三、异方差性的后果三、异方差性的后果 1 1、回归系数估计结果误差较大、回归系数估计结果误差较大 2 2、有关统计检验失去意义、有关统计检验失去意义 3 3、模型的预测失效、模型的预测失效 n例:变量例:变量X、、Y的部分的部分数据如右表所示。

数据如右表所示n下面运用图示法进行下面运用图示法进行分析模型是否存在严分析模型是否存在严重的异方差现象重的异方差现象 n从Analyze → Regression → Linear 打开Linear 线性回归主对话框n将自变量与因变量分别选入相应框中n点击“Plot”按钮,在新打开的对话框中将“DEPENDNT”选入“X”框中,将“*ZRESID”选入“Y”框中.n点击“Continue”n点击“OK” n该图表明本回归模型存在严重的已方差问题n方差越来越小 第三节第三节 自相关自相关 一、问题和原因一、问题和原因 (一(一))自相关概念自相关概念n各随机误差项之间不独立,则称其存在自相关或序列各随机误差项之间不独立,则称其存在自相关或序列相关性二)原因(二)原因n1、经济变量的惯性、经济变量的惯性n2、模型设定偏琦:省略解释变量的影响、模型设定偏琦:省略解释变量的影响n3、模型设定偏琦:错误的函数形式的影响、模型设定偏琦:错误的函数形式的影响n4、滞后效应、滞后效应n5、其他原因、其他原因 二、自相关主要后果二、自相关主要后果n很可能高估很可能高估R2nt-检验与检验与F-检验结果都变得无效。

检验结果都变得无效n其他其他 三、三、杜宾-瓦森检验检验误差序列正自相关性——D-W检验区域图 一阶自相关 无法判断无法判断 无一阶自相关性无一阶自相关性 无法判断无法判断 一阶负自相关粗略地说:当D-W指标在2附近,即可认为模型不存在明显的(一阶)自相关 四、自相关诊断举例n自变量X与因变量Y如右表所示 n从Analyze → Regression → Linear 打开Linear 线性回归主对话框n将自变量与因变量分别选入相应框中n点击“Statistics”按钮,在新打开的对话框中选中“Durbin-Watson”,n点击“Continue”n点击“OK” n查D-W 检验统计表知:nN=25(样本容量);k=1(自变量个数) dL=1.288 dU=1.454n由于D-W值为0.353,小于dL,所以认为存在一阶正自相关 结 束 。

下载提示
相似文档
正为您匹配相似的精品文档