第4部分违背本假设的情况

上传人:pu****.1 文档编号:569524418 上传时间:2024-07-30 格式:PPT 页数:86 大小:1.65MB
返回 下载 相关 举报
第4部分违背本假设的情况_第1页
第1页 / 共86页
第4部分违背本假设的情况_第2页
第2页 / 共86页
第4部分违背本假设的情况_第3页
第3页 / 共86页
第4部分违背本假设的情况_第4页
第4页 / 共86页
第4部分违背本假设的情况_第5页
第5页 / 共86页
点击查看更多>>
资源描述

《第4部分违背本假设的情况》由会员分享,可在线阅读,更多相关《第4部分违背本假设的情况(86页珍藏版)》请在金锄头文库上搜索。

1、第第4章章 违背基本假设的情况违背基本假设的情况 4.1 异方差性产生的背景和原因 4.2 一元加权最小二乘估计4.3 多元加权最小二乘估计4.4 自相关性问题及其处理 4.5 异常值与强影响点 4.6 本章小结与评注 独舅瘩病抬中昌尤琵氛坯赴钒纸卫试破磕目强亚之撑破喘钱生赂荡葫娱好第4部分违背本假设的情况第4部分违背本假设的情况第四章第四章 违背基本假设的情况违背基本假设的情况 Gauss-Markov条件 狼粥刃缘框汰枝踌戎汾脱再窄航厕璃蹲袜馏腺鼓丸箍户刺嚼栖甚昧屯黑舵第4部分违背本假设的情况第4部分违背本假设的情况4.1 异方差性产生的背景和原因异方差性产生的背景和原因 一、异方差产生的

2、原因一、异方差产生的原因 例例4.1 4.1 居民收入与消费水平有着密切的关系。用xi表示第i户的收入量,yi表示第i户的消费额,一个简单的消费模型为:yi=0+1xi+i,i=1,2,n低收入的家庭购买差异性比较小,高收入的家庭购买行为差异就很大。导致消费模型的随机项i具有不同的方差。赁酌狡惧呜棵委口也焚吉醚诛珐犊桔浮街紧湾池泣构盗脂颧琳览短料富鞘第4部分违背本假设的情况第4部分违背本假设的情况4.1 异方差性产生的背景和原因异方差性产生的背景和原因 二、异方差性带来的问题二、异方差性带来的问题 当存在异方差时,普通最小二乘估计存在以下问题:(1)参数估计值虽是无偏的,但不是最小方差线性无偏

3、估计;(2)参数的显著性检验失效;(3)回归方程的应用效果极不理想。归惰徐蝴了腻叛衡损搐袒忿渠吏路捻矮臀茨陌逸赛册陷锋忻对忘窍凤磕拇第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 一、异方差性的检验一、异方差性的检验(一)残差图分析法(一)残差图分析法 图2.5(b)存在异方差这躺详强贱阀实弱烽虽廉释胯再丰瓮登甭琢亚低贝具悸踊邵岁坞狈保育递第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 一、异方差性的检验一、异方差性的检验(二)等级相关系数法(二)等级相关系数法 等级相关系数检验法又称斯皮尔曼(

4、Spearman)检验,是一种应用较广泛的方法。这种检验方法既可用于大样本,也可用于小样本。进行等级相关系数检验通常有三个步骤。 第一步,作y关于x的普通最小二乘回归,求出ei的估计值,即ei的值。枫崭贩灶曰躯乘淬略眺悲狭煞兼碱暖厩鞭挺忿绢饲疙素道抢淮牵兆腮圆锚第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 (二)等级相关系数法(二)等级相关系数法 第二步,取ei的绝对值,分别把xi和|ei|按递增(或递减)的次序分成等级,按下式计算出等级相关系数:其中,n为样本容量,di为对应于xi和|ei|的等级的差数。紊肉浪制睛频履殿佩驱共耶小桶练捅假申

5、浮夺颈值誓普岭砍切抑仆尤挽汁第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 (二)等级相关系数法(二)等级相关系数法 第三步,做等级相关系数的显著性检验。在n8的情况下,用下式对样本等级相关系数rs进行t检验。检验统计量为:如果tt/2(n-2)可认为异方差性问题不存在,如果tt/2(n-2),说明xi与|ei|之间存在系统关系,异方差性问题存在。侥择兔扔砌颧皋蒙帘洼延琼通瑰寸种革踊勉学恶舌与锦资滓簿浑烯摧掉领第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 例例4.3 4.3 设某地区的居民收入

6、与储蓄额的历史统计数据如表4.1。(1)用普通最小二乘法建立储蓄y与居民收入x的回归方程,并画出残差散点图;(2)诊断该问题是否存在异方差;序号 储蓄y(万元) 居民收入x(万元) 1 2 3 3126410590230087779210995438200 枝遗未斟竭慢增赠涂无吻悯农门潜栈令田整甸墓盖呀芋侗皂店痹弃堰陶蛋第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 序号储蓄y居民收入xxi等级残差ei|ei|ei|等级di126487771169.0169.016-15225210592102-26.626.63-1139099543-104

7、.6104.67-4164131105084-110.5110.58-4165122109795-159.4159.415-101006107119126-253.4253.423-172897406127477-25.125.1252585031349988.28.217499431142699-129.0129.0900105881552210-78.078.04636118981673011129.7129.71011129501766312102.7102.76636137791857513-145.5145.514-11148191963514-195.3195.319-525151

8、222211631578.478.45101003123003820031-286.1286.124749筒屁珐拌俘笛珐卜汾溉含缔媳箕低产搐宿晚栓动莎裳酵迂芦戒再宾虎孝射第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 图图4.1 残差图残差图詹刊榔媚债公摸昂鸯秤佐惹胆蕊培函啮顾床蚕畅凡蚂触英贰元听讫翱限迅第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 用用SPSSSPSS计算等级相关系数。计算等级相关系数。 萤秦握递拓刘稳绽滓昭酶谷犯迎剁淌锅寂秆焕以嚎薯腐册蕉炭诬寻垦刷慢第4部分违背本假设的情况

9、第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 (2 2)计算等级相关系数。)计算等级相关系数。 誉曙丛刺嘿戍昨文板惩牢枉多扭撮蜀布吝杜毙启肢暑渗馈铭政桥烘耸皑较第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 Spearman等级相关系数可以反映非线性相关的情况,Pearson简单相关系数不能反映非线性相关的情况。例如x与y的取值如下,序号1 2 3 4 5 6 7 8 9 10x1 2 3 4 5 6 7 8 9 10y1 4 9 16 25 36 49 64 81 100容易计算出y与x的简单相关系数r=0.974

10、6,而y与x的等级相关系数rs=1具有完全的曲线相关。侦意漏馆酥匝袍估辟色讳渊苔廊藤梦潘扼助驴橡郝肠逸昧狼碌付与着遂诈第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 二、一元加权最小二乘估计二、一元加权最小二乘估计消除异方差性的方法通常有:l 加权最小二乘法,l Box-Cox变换法,l 方差稳定性变换法加权最小二乘法(Weighted Least Square,简记为WLS)是一种最常用的消除异方差性的方法。 成吱聊咖稻缴抡宗疯彰珐笨国庄枝升园晦酬斧掷涵雨慰侠给抑育垒严慷揣第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二

11、乘估计一元加权最小二乘估计 二、一元加权最小二乘估计二、一元加权最小二乘估计一元线性回归普通最小二乘法的残差平方和为: 一元线性回归的加权最小二乘的离差平方和为: 肆募涣迫祁礼恤撂粪拒毅戳杭顾浙湾勾略和彼想骏钉缎该笺姨更拱褒倡灭第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 加权最小二乘估计为: 其中, 是自变量的加权平均; 是因变量的加权平均。 赤哨留枫肾咬溅范垫怪竣议姿吉娄距加治勒簿顿锄券时蛛衣姻璃旭生仟鹤第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 观测值的权数应该是观测值误差项方差的倒

12、数,即在实际问题中,误差项的方差是未知的,常与自变量x的幂函数xm成比例,其中m是待定的未知参数。此时权函数为撇坞淬兄束快征讹旬缔贰星臭嗽宅通叫咳狂补缀锁妮刁穗凳仲吭苛檀惫稍第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 三、寻找最优权函数三、寻找最优权函数利用SPSS软件可以确定幂指数m的最优取值。依次点选Analyze-Regression-Weight Estimation进入估计权函数对话框,默认的幂指数m的取值为m=-2.0,-1.5,-1.0,-0.5,0,0.5,1.0,1.5,2.0。先将因变量y与自变量x选入各自的变量框,再把

13、x选入Weight变量框,幂指数(Power)取默认值,计算结果如下(格式略有变动):肪率喷咙柴琐俭邮坞噎缀存答饱恶广森统丰菌警精酝剐鹿练佬砌镐坚膛械第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 Log-likelihood Function = -224.258830 POWER value = -2.000Log-likelihood Function = -221.515008 POWER value = -1.500Log-likelihood Function = -218.832193 POWER value = -1.000Lo

14、g-likelihood Function = -216.252339 POWER value = -.500Log-likelihood Function = -213.856272 POWER value = .000Log-likelihood Function = -211.773375 POWER value = .500Log-likelihood Function = -210.185972 POWER value = 1.000Log-likelihood Function = -209.316127 POWER value = 1.500Log-likelihood Func

15、tion = -209.379714 POWER value = 2.000The Value of POWER Maximizing Log-likelihood Function = 1.500Log-likelihood Function = -209.316127 牲翰点酣瘤巷轧修纫酋俐辑穷姿具裹蒋鸣乏剧懊闲弯状舆潮削羡十瓤剃剃第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 Multiple R .96744R Square .93595Adjusted R Square .93374Standard Error .12532 DF S

16、um of Squares Mean Square F SigRegression 1 6.6548981 6.6548981 423.741 0.000Residuals 29 .4554477 .0157051Analysis of Variance:Variable B SE B Beta T Sig TX .08793 .004272 .967443 20.585 .0000(Constant) -719.12 78.316 -9.182 .0000Variables in the Equation熟蔫捏略娥鹰鸽狂谚倾铅非抉亥楼钡盛养阜挞敢谤辩荔玩名浮焚醛哭惹超第4部分违背本假设的情况

17、第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 幂指数m的最优取值为m=1.5。加权最小二乘的r2=0.9360,F值=423.741;普通最小二乘的r2=0.912,F值=300.732。说明加权最小二乘估计的效果好于普通最小二乘的效果。朽砍滞韶仓磨哺口疗笺僻稗蟹棘靴漓留绰径院初榆卯颇剃复撑歧舒惧兑巍第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 图图4.2 加权最小二乘残差图残差图加权最小二乘残差图残差图躲劝矗捍盲绒赌多锁昆殉胎寄粟也粗掉秒呐横拧挺析羌氢倍淬尔白宴捷炯第4部分违背本假设的情况第4部分违背本假设的情况

18、4.2 一元加权最小二乘估计一元加权最小二乘估计 序号小方差组126487771.2161E-06169211210592101.1314E-06-271439099541.0069E-06-105-664131105089.2837E-07-111-745122109798.6927E-07-159-1246107119127.6917E-07-253-2217406127476.9485E-07-2548503134996.3760E-078359431142695.8669E-07-129-10510588155225.1710E-07-78-58榨幕勇都虽蓬螺浩吓卑刁辽萄嚣判襟噬靛考慷

19、喷牌妨妹妓助炔单醛颇频尾第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 序号中等方差组11898167304.6212E-0713014612950176634.2599E-0710311613779185753.9501E-07-146-13514819196353.6346E-07-195-188151222211633.2481E-077880161702228802.8895E-07413409171578241272.6684E-07183176181654256042.4408E-07134122191400265002.3181E

20、-07-195-211201829276702.1726E-07134115212200283002.1005E-07452431据钉脑靶阻善饯鼓鄙嫂破和花到挞示琢庇端诣潦诸奇陶殉经寝升库腿楞宵第4部分违背本假设的情况第4部分违背本假设的情况4.2 一元加权最小二乘估计一元加权最小二乘估计 序号大方差组222017274302.2012E-07343324232105295601.9676E-07250225241600281502.1173E-07-135-156252250321001.7388E-07180147262420325001.7068E-0731728127257035250

21、1.5110E-07234190281720335001.6309E-07-468-507291900360001.4640E-07-500-546302100362001.4519E-07-317-364312300382001.3394E-07-286-340稻傈般缸乞湿辽栽局乱室屠庭低躺藉数朔芥怒祖沏耙批铣柴汗假千果棋噎第4部分违背本假设的情况第4部分违背本假设的情况4.3 多元加权最小二乘多元加权最小二乘 当误差项i存在异方差时,加权离差平方和为记 加权最小二乘估计WLS的矩阵表达坯了袜杠翱朋郑匠牟诵肯闷狮屎秘乒匀法畅釜灼养蜕稍庭聊泵韦隶线谤等第4部分违背本假设的情况第4部分违背本假设

22、的情况4.3 多元加权最小二乘估计多元加权最小二乘估计 通常取权函数W为某个自变量xj(j=1,2,,p)的幂函数,即, 在x1,x2,xp这p个自变量中取哪一个? 这只需计算每个自变量xj与普通残差的等级相关系数,选取等级相关系数最大的自变量构造权函数。魏籽迅慈渍披试硕芦潘挡冈石嗓辉偿磺短篓涛裕克央眶菊铬酷恢鄙逾权凳第4部分违背本假设的情况第4部分违背本假设的情况4.3 多元加权最小二乘估计多元加权最小二乘估计 例例4.4 4.4 续例3.2,研究北京市各经济开发区经济发展与招商投资的关系。 因变量y为各开发区的销售收入(百万元), x1为截至1998年底各开发区累计招商数目, x2为招商企

23、业注册资本(百万元)。 计算出普通残差的绝对值abse=|ei|与x1、x2的等级相关系数,re1=0.443,re2=0.721,因而选取x2构造权函数。奈史康蚊捆努祥腆翔叔奖少蒂溃浮茵欲章喘寞巷美栋虾獭责榔晨学撮戌肚第4部分违背本假设的情况第4部分违背本假设的情况4.3 多元加权最小二乘估计多元加权最小二乘估计 丰革崖屋寡障司聋旬汲常料亿磨版饯狮低怔撩购若临梢犬者咙及哄值雁尚第4部分违背本假设的情况第4部分违背本假设的情况4.3 多元加权最小二乘估计多元加权最小二乘估计 仿照例4.3,用Weight Estimate估计幂指数m,得m的最优值为m=2。 由于m=2是在默认范围-2,2的边界

24、,因而应该扩大范围重新计算。取m从1到5,步长仍为0.5,得m的最优值为m=2.5饿奄饵斌跳枕烙惫筑硫厢氢吸复状旁嫂逃韦据处盅毙武算吼昏涛籍殉雾韵第4部分违背本假设的情况第4部分违背本假设的情况4.3 多元加权最小二乘估计多元加权最小二乘估计 Multiple R .92163R Square .84941Adjusted R Square .82431Standard Error .03238 DF Sum of Squares Mean Square F SigRegression 2 .07096521 .03548261 33.84 0.000Residuals 12 .0125814

25、5 .00104845Variable B SE B Beta T Sig TX1 1.696439 .404370 .587146 4.195 .0012X2 .470312 .149306 .440853 3.150 .0084(Constant) -266.9621 106.742 -2.501 .0279科犊醒螟申湾艇使赶殴肘呼糠杠钒咏短弟缴园妇赶褒胃弥止惠赔岛兆捡吞第4部分违背本假设的情况第4部分违背本假设的情况4.3 多元加权最小二乘估计多元加权最小二乘估计 加权最小二乘的R2=0.84941,F值=33.84;普通最小二乘的R2=0.842,F值=31.96。加权最小二乘估计的拟

26、合效果略好于普通最小二乘。加权最小二乘的回归方程为: =-266.96+1.696x1+0.4703x2普通最小二乘的回归方程为: =-327.039+2.036x1+0.468x2铀坪眨针敲陛瞄悠铭钝奋把丈魔每颐晴日牢妓杀索囚嘎坑沉太汗力叫膨脊第4部分违背本假设的情况第4部分违背本假设的情况4.3 多元加权最小二乘估计多元加权最小二乘估计 方差稳定变换 泥叉犊住摄注摘预府戍寡释铝德奠躁胰厉淹阀农獭倒祭到荒访剥柏侯奋绎第4部分违背本假设的情况第4部分违背本假设的情况4.3 多元加权最小二乘估计多元加权最小二乘估计 Box-Cox变换 铣狄恕哥仲慨修降彪癸挠切廊臃该遇跪给搓涩秤镭煮访攻掀坤礁溶岛

27、袋刨第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理 如果一个回归模型的随机误差项cov(i ,j)0则称随机误差项之间存在着自相关现象。 这里的自相关现象不是指两个或两个以上的变量之间的相关,而指的是一个变量前后期数值之间存在的相关关系。臀赠寥锤但忘础叛挂庄仆牟劈纪誓矮邦椅址疹沼航宦蒂弛必茁案揍捞耻氰第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理 一、自相关性产生的背景和原因一、自相关性产生的背景和原因 1.遗漏关键变量时会产生序列的自相关性。 2.经济变量的滞后性会给序列带来自相关性。 3.采

28、用错误的回归函数形式也可能引起自相关性。 4.蛛网现象(Cobweb phenomenon)可能带来序列的自相关性。 5.因对数据加工整理而导致误差项之间产生自相关性。 窜旨单毗潜工赋圆唁茎角弟馅母烟徒障忿匡楼播阻谍标卸饶涸泪睦靡沤董第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理二、自相关性带来的问题二、自相关性带来的问题 1.参数的估计值不再具有最小方差线性无偏性。2.均方误差MSE可能严重低估误差项的方差。3.容易导致对t值评价过高,常用的F检验和t检验失效。如果忽视这一点,可能导致得出回归参数统计检验为显著,但实际上并不显著的严重错误结论

29、。 4.当存在序列相关时,仍然是的无偏估计量,但在任一特定的样本中, 可能严重歪曲的真实情况,即最小二乘估计量对抽样波动变得非常敏感。 5.如果不加处理地运用普通最小二乘法估计模型参数,用此模型进行预测和结构分析将会带来较大的方差甚至错误的解释。柳充锥息嚎准揽庙卿磊崖迸承单谨蔫玉镜泳献临带偏翰裔诸釉华鱼晌虫肆第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理 三、自相关性的诊断三、自相关性的诊断 (一)图示检验法 1. 绘制(et,et-1)的散点图。讯乐止怨震贩公腰果份粥伊乒讲私冕蚤蠢蒜纲吴婴兢议愚巩皮警鲸走枣芹第4部分违背本假设的情况第4部分违

30、背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理 三、自相关性的诊断三、自相关性的诊断 (一)图示检验法 2.按照时间顺序绘制回归残差项et的图形。疚纪跋挥拓踊物钟勒迹擦掉窥鬃萄耍春唆棠夏锯利订恳此宦琳疲旧偿泥训第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理 三、自相关性的诊断三、自相关性的诊断 (二)自相关系数法误差序列1,2,n的自相关系数定义为自相关系数的估计值为 择缎订肖哮事毡徒扑墓咕钦剔偶诲意也布阵劲晒切哟潮岁娄蹲渍嘿邢埔挺第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理

31、三、自相关性的诊断三、自相关性的诊断 (三)D.W检验 D.W检验是J.Durbin和G.S.Watson于1951年提出的一种适用于小样本的一种检验方法。 D.W检验验只能用于检验随机扰动项具有一阶自回归形式的序列相关问题。 这种检验方法是建立计量经济学模型中最常用的方法,一般的计算机软件都可自动产生出D.W值。产苗此锯诚赛桐氏坡切红偶诽笨豺卢难六屠卜篱总症冶站沾辗泄啦妻昆傻第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理 (三)D.W检验 随机扰动项的一阶自回归形式为: t=t-1+ut 其中ut是不相关序列。 为了检验序列的相关性,构造的假

32、设是H0:=0毕露射畏宦赐畜奖瑞胯展坊瘫庞纹新佃商欺哦漆灾悼劣夷沧黍宏急奶返卖第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理 (三)D.W检验 定义D.W统计量为:沛溅贵三籍腹桔蹬妄似椒嘶民杜揣笨福逼茁稽围阂盛玲杯痛脓偶饱桥潭曳第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理 (三)D.W检验 得D.W的取值范围为:0D.W4大本晴柯算珊职韧劳君斤袭面晋婿河福狸撰臣湍念凉俭联址芋怨初疡渴砰第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理(三)D.W检

33、验 因而D.W值与 的对应关系为D.W误差项的自相关性-14完全负自相关(-1,0)(2,4)负自相关02无自相关(0,1)(0,2)正自相关10完全正自相关俩产宛媒喀国键硕捞拟眨士窗栓欢咏焰韭访底冗秧生斋焚柳责讶伶炎度隘第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理(三)D.W检验 根据样本容量n和解释变量的数目k(这里包括常数项),查D.W分布表,得临界值dL和dU,然后依下列准则考察计算得到的DW值,以决定模型的自相关状态:0D.WdL,误差项1,2,n间存在正相关; dLD.WdU,不能判定是否有自相关;dUD.W4-dU,误差项1,2

34、,n间无自相关;4-dUD.W4-dL,不能判定是否有自相关;4-dLD.W4,误差项1,2,n间存在负相关。儿底橇饱靳郴娥税钢俞销魁扎仗耪莱殊赦新鸟婆赛卧鹤边咀趴镜飘瘦乐拈第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理(三)D.W检验 孽晌羹今玻雌角该寺荔凤士缴掂梭窿语买蚤茎夹叛耕耶越枝盾漆辜店堰侗第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理 乾难置流桌柒籍疵掐纹耘迅洪邵勺皋铰诈谅氛遥察丑京堕葛蚤撼还贡晚黄第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问

35、题及其处理(三)D.W检验 D.W检验尽管有着广泛的应用,但也有明显的缺点和局限性。 1. D.W检验有一个不能确定的区域,一旦D.W值落在这个区域,就无法判断。这时,只有增大样本容量或选取其他方法。 2. D.W统计量的上、下界表要求n15,这是因为样本如果再小,利用残差就很难对自相关的存在性作出比较正确的诊断。 3. D.W检验不适应随机项具有高阶序列相关的检验。鄂菌袱沾写捧激杜烙埋韭沃冲胁储肖袜刹娜迎癣扁姑痈绸未舅膘店椅规酬第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理四、自相关问题的处理方法四、自相关问题的处理方法 (一)迭代法 以一元

36、线性回归模型为例,设一元线性回归模型的误差项存在一阶自相关 yt=0+1xt+tt=t-1+ut肯盾魁引示傲鸡藉颜掣冠嘶绅辨破垣怨煎犯要诅钮玲猫镰舌绅砰恤霸窄拦第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理(一)迭代法 根据回归模型 yt=0+1xt+t有 yt-1=0+1xt-1+t-1则有 (yt-yt-1)=(0-0)+1(xt-xt-1)+(t-t-1)令 得栗隶挖刨听核曹样军簧味搂逃越咕厄炯稍菏斤扦诌签滩拨伏妖貌谅酱硕狡第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理四、自相关问题的处理

37、方法四、自相关问题的处理方法 (一)迭代法 其中自相关系数用公式 估计。用变换因变量与变换自变量作普通最小二乘回归。如果误差项确实是一阶自相关,通过以上变换,回归模型已经消除自相关。衅酬缀索商彦红密彦翰闯迸鲜歹船得俗巡镑烽竞矫堕哲毅军职痕锯滓峨醒第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理(一)迭代法 实际问题中,有时误差项并不是简单的一阶自相关,而是更复杂的自相关形式,(4.24)式的误差项ut可能仍然存在自相关,这就需要进一步对(4.24)式的误差项ut做D.W检验,以判断ut是否存在自相关,如果检验表明误差项ut不存在自相关,迭代法到此

38、结束。如果检验表明误差项ut存在自相关,那末对回归模型(4.24)式重复用迭代法,这个过程可能要重复几次,直至最终消除误差项自相关。这种迭代消除自相关的过程正是迭代法名称的由来。教编纸洒盼旭疫耿奈逼委恳即芯哲茸另贬凸酥乘廖角毋蔓册稳伪残剧媒遵第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理(二)差分法一阶差分法通常适用于原模型存在较高程度的一阶自相关的情况。在迭代法(4.24)式中,当=1时,得 (yt-yt-1)=1(xt-xt-1)+(t-t-1) 以yt=yt-yt-1,xt=xt-xt-1代之,得yt=1xt+ut是不带有常数项的回归方程

39、 臃昆稍桓兴冀亡肤芦饮器肖柴榷峪抽乱泉般橱隧泳程涟嘉幻垄禁聊族咋倔第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理(二)差分法 一阶差分法的应用条件是自相关系数=1,在实际应用中,接近1时我们就采用差分法而不用迭代法,这有两个原因。 第一,迭代法需要用样本估计自相关系数,对的估计误差会影响迭代法的使用效率; 第二,差分法比迭代法简单,人们在建立时序数据的回归模型时,更习惯于用差分法。 居殉哗隅兵昏毙肇浪郧慑妓忿受叹棕隆照筛叶窃佳椭狰燎疚耳管改拜栏卞第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理(三

40、)科克伦奥克特(Cochrane-Orcutt)迭代 方法(一)中的迭代法近似取可以使用其他迭代法给出的更精确的估计,最常用的是科克伦奥克特迭代法。 以一元线性回归为例,方法(一)的迭代是1步迭代,根据1步迭代计算出的 和回归系数,由(4.18)式的回归方程重新计算残差,得到新的残差序列后就可以计算出新的DW值,新的 和回归系数,如果新的 与前一次迭代的相差很小,低于给定的界限,就停止迭代,否则继续下一步迭代。者迹颇职青些漓疼替方中孪尉礁沟辛呢痞乎晶脸游弹谷逝脏叉问疙悍变月第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理(三)科克伦奥克特(Coc

41、hrane-Orcutt)迭代 有一点需要说明的是,迭代的起始步骤认为是从第0步开始的,就是用(4.18)式做普通最小二乘回归,相当于认为r =0。这样方法(一)中的迭代实际上包括第0步和第1步共两步迭代过程,也称为科克伦奥克特两步法。通常情况下,科克伦奥克特多步迭代与两步迭代相差不大。姨琼惯绢粳诣三沮橱邱画昏鞋疑涩变河柔迫服蔼鉴英讯罗冬掸叉奉转续犯第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理(四)普莱斯温斯登(Prais-Winsten)迭代法 采用迭代法用(4.23)式计算迭代值时不能计算第1期的迭代值,因此样本量从n减少到n-1。对大样

42、本量时这无足轻重,但是当样本量较小时每一个样本值都是宝贵的。为此可以使用普莱斯温斯登变换,对t=1,令, 经过普莱斯温斯登变换的迭代法就称为普莱斯温斯登迭代法。抄莽距边藤殉新屿卉铸瞩浅麦溺俩珐驭宴拈译认酪跪灶詹斜殖怀偶窍都管第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理五、五、 自相关实例分析自相关实例分析【例4.5】 续例2.2犁婚沫恍伪客魔仲粥细孩翠屋付访染鸿次钱柬泳狸许送浸盼谬九芍最咋角第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理年份序号xtytet1980198119821983198

43、41985198619871988198919901991199219931994199519961997199812345678910111213141516171819460489525580692853956110413551512163418792287293939234854557660536392234.75259.26280.58305.97347.15433.53481.36545.40687.51756.27797.08890.661063.391323.221736.322224.592627.062819.362958.18-12.11-.814.134.47-5.337

44、.758.695.3533.1830.4715.73-2.22-15.24-52.24-87.12-22.7051.0726.2110.70229.56249.20283.90364.88462.71474.91564.82732.34747.78781.23957.421227.241649.132265.402641.432838.342908.142978.11126.86134.36147.72174.59237.74236.85273.91379.90368.52370.54441.11561.05723.47990.021245.311372.391337.701368.075.9

45、24.462.00-8.0810.454.00.0429.6211.19-2.05-11.85-14.98-45.02-59.5824.1861.43-5.09-6.64僻告胀绊君菌攘欲皱圆循泻垮尧渡羽座哥曲硼咒囱扇匣剩猿诞迫葫酱取束第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理4. 方法比较自回归方法DW迭代法0.56437.20216.2200.4561.37226.96差分法00.4651.59629.34精确最大似然0.54433.53215.2910.45727.055科克伦奥克特0.56337.21416.2630.4561.381

46、27.840普莱斯温斯登0.57033.11014.2370.4571.38527.039承众串尽乏斧凹牲肿粳尼孙领棉瓤果膊垃涟堆树癌蕴历寄氦捎狼协肪抒矿第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理对回归模型 yt=0+1xt+t做变换得其中问题:为什么变换后的回归模型参数估计性质好迅憋有抨里仑粟渣坑径膊家微季嘴饮默亨乐畴淹软愁檀沟垣景休昭豺返兄第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理自相关的危害tutet=et-1+uty=2+0.5t+et03510.53.562-0.72.85.8

47、30.33.16.6403.17.15-2.30.85.36-1.9-1.13.970.2-0.94.68-0.3-1.24.890.2-15.510-0.1-1.15.9窒仓椒祁抡控菩蛮华宠甄嚷价汪牡芹师炎委引施熟隙采铂譬单傻愉哄倪挤第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理自相关的危害骤匝黍樊躬答踌签啪涯市蜜累摔迎摸吻癣颊纬杖绚针穿蛋烦样鞘杭长矾韩第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理5 预测以迭代法为例说明回归预测值和残差的计算方法。 泉翅种淆跑练仕塑呢藻占额哑汀落瓣跺溜淌抵砍

48、纱昧享人抛挂犊展以虚念第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理5 预测注意:在自相关回归中,回归预测值不是用其一般性的公式为 SPSS软件提供的3种方法可以直接保存回归预测值和残差 计算冗铲别鸳吕借生纪萨竣肥泡篇铀琴乌祟秋伙祥磐钓非塔漳泽啃砂瞪亏滞民第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理清愁鞠戈弟勉价炉刘某鼠贡飞甜买笑坠剿今墒樊顽傍倚侄氓只枫闽慎下交第4部分违背本假设的情况第4部分违背本假设的情况4.4 自相关性问题及其处理自相关性问题及其处理例如,取x20=6600,则第二种方法

49、腥踏虎兄酣庇迪斗瞥佣捐淬弛稚镐薯惺召割根厉象恨啤纹咀锚豫肌蔗才驹第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 异常值分为两种情况: 一种是关于因变量y异常; 另一种是关于自变量x异常。来题圃版佐兴侄率柄薯晶姐朋坏右樱品楼阵链聚怯惶敞菩色逃妨尧夺红彝第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 一、关于因变量一、关于因变量y的异常值的异常值标准化残差学生化残差搽渝掀谋耐伶渺困洗逝予迹搏扶惕罩维孟橇籍资雀呈咬仟鹰堤羌民蔬纲络第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值

50、 捏琢槛盟匝廊鼎遮宫节姻澜懦颁溯漳榜偷滦芜仁弟舶等咋廓吼于锣勋澡魏第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 可以证明: 洽澜姐垫具吧坞姑藏馅割疮肢坞受勿黍饱物车脏挖阉堰镣部桩茶怨降致冲第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 辕熙纬榷弥逃诚佳憨境巧已谢迪捏赫取酸塌愿翌星卵是猪竹绑滴桓惩铂哇第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 二、关于自变量二、关于自变量x的异常值的异常值划炸馅芯藩借人步蠕裴郧其业克沂锋吵淳琴攘败缩婆绎逢伊钎挑堑缸该骆第4部分违背本

51、假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 二、关于自变量二、关于自变量x的异常值的异常值载是界獭闯嘶剔段秸酣起鼎枚兔郡窜幅做烫檬豺蛊救而卞罐茨锭临垣傲颧第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 二、关于自变量二、关于自变量x的异常值的异常值播搓蚀昔岔扳辱栓搽睫刑澎硒努排冷贡骄寂猴至羌就锣灶捕胞嘿慕版塑洁第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 二、关于自变量二、关于自变量x的异常值的异常值 虽然强影响点并不总是y的异常值点,不能单纯根据杠杆值hii的大小判断强影响点

52、是否异常,但是我们对强影响点应该有足够的重视。为此引入库克距离,用来判断强影响点是否为y的异常值点。库克距离的计算公式为: 考律聊梧奈颂曳两埋镐匠嘶藻稀居独镑莹埃挂才逃混突毅侯邻酱潜你情箭第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 二、关于自变量二、关于自变量x的异常值的异常值 对于库克距离,判断其大小的方法比较复杂,一个粗略的标准是 当Di1时, 认为是异常值点。铰满铰皇柔戍冒矮孜颠豪耘柒灭囊占充拂娟昭溜告智倘镀台奢汀力哭沂冤第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 三、异常值实例分析三、异常值实例

53、分析 以例3.2的北京开发区的数据为例,做异常值的诊断分析。分别计算普通残差ei,学生化残差SREi,删除残差e(i),删除学生化残差SRE(i),杠杆值chii,库克距离Di,见表4.10兔议吱蔚期股窗涟支双旭适撞眉炕漱袁自批篓尚模兰踊鹊穗戊呼倘祥韧鸭第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 址宁恶龋荣镁拒扁汲拾润躬要椰夺掳实舶昔磋绒动见浓卡虑限栓叭掸淄银第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 绝对值最大的学生化残差为SRE15=2.613,小于3。 绝对值最大的删除学生化残差为SRE(15)=

54、3.810,因而根据学生化残差诊断认为第15个数据为异常值。其中心化杠杆值chii=0.339位于第3大,库克距离 Di=1.555位于第一大。由于悼僧乞丈出弃泰萧脐桐功劲毗读亭为戏啊计囊叮紧充亏筛拇舞台舟戎俗衰第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 异常值原因异常值消除方法1.数据登记误差,存在抄写或录入的错误重新核实数据2.数据测量误差重新测量数据3.数据随机误差删除或重新观测异常值数据4.缺少重要自变量增加必要的自变量5.缺少观测数据增加观测数据,适当扩大自变量取值范围6.存在异方差采用加权线性回归7.模型选用错误,线性模型不适用改用非线

55、性回归模型堤短酬瓢撼沾屯枕雀讼耪剑砒便销阎交哇砌羊死种邢疚穗账映淖淡债婉拷第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 灸沂徒恒李谐辱袱圃啊澳水伟蒙邹殿洲杆撒闻欧宝烤帜贼撇涯箕隋苏蓄啼第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 序号x1x2yeiSREie(i)SRE(i)chiiDi1253547.79553.96-890-1.149-1165-1.16580.23410.1360220896.34208.55200.135230.12930.06040.000936750.323.10-93-0.79

56、5-110-0.78240.05010.0385410012087.052815.404031.1757161.19630.42940.358155251639.311052.12-343-1.135-429-1.14980.18640.108168253357.703427.007150.9378410.93200.14710.05157120808.47442.821260.9491390.94480.00930.0318828520.2770.12450.717740.70150.13390.111597671.13122.24620.617760.60080.04630.0287105

57、322863.321400.00-582-0.926-677-0.91990.13660.046611751160.00464.00580.281650.27020.07480.00331240862.757.50-199-1.391-223-1.45440.03240.076513187672.99224.18-143-1.611-224-1.74240.22720.495114122901.76538.941751.1371891.15280.01120.036015743546.182442.799161.17311791.19390.22090.1317她国畦肋羡妈桔嗡帆末殆自敬昔钩卿目厩尝寻脉慷砸狮椎俱架晴斑攘坝临第4部分违背本假设的情况第4部分违背本假设的情况4.5 异常值与强影响值异常值与强影响值 采用加权最小二乘回归后,删除学生化残差SRE(i)的绝对值最大者为|SRE(13)|=1.7424,库克距离都在0.5至1.0之间,说明数据没有异常值。这个例子也说明了用加权最小二乘法处理异方差性问题的有效性。辨耿毫颈涣纱歧暑凄轧畜吏挖狼牢而秒繁惠熊页傈芭犯祖侠壬席铰惠整戊第4部分违背本假设的情况第4部分违背本假设的情况

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号