第五章___异方差性.doc

上传人:pu****.1 文档编号:549339862 上传时间:2024-02-24 格式:DOC 页数:30 大小:1.02MB
返回 下载 相关 举报
第五章___异方差性.doc_第1页
第1页 / 共30页
第五章___异方差性.doc_第2页
第2页 / 共30页
第五章___异方差性.doc_第3页
第3页 / 共30页
第五章___异方差性.doc_第4页
第4页 / 共30页
第五章___异方差性.doc_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《第五章___异方差性.doc》由会员分享,可在线阅读,更多相关《第五章___异方差性.doc(30页珍藏版)》请在金锄头文库上搜索。

1、第五章 异方差性引子:更为接近真实的结论是什么?改革开放以来,各地区的医疗机构都有了较快发展,不仅政府建立了一批医疗机构,还建立了不少民营医疗机构。各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服务的需求量,而医疗服务需求与人口数量有关。为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。根据四川省2000年21个地市州医疗机构数与人口数资料对模型估计的结果如下: (291.5778) (0.644284) t =(-1.931062) (8.340265) , , 式中表示卫生医疗机构数(个),表示人口数量(万人)。从回归模型估计

2、的结果看,人口数量对应参数的标准误差较小,统计量远大于临界值,说明人口数量对医疗机构确有显著影响,可决系数和修正的可决系数还可以,F检验结果也明显显著。表明该模型的估计效果还不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735个。然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。那末,有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?在现实经济活动中,最小二乘法的基本假定并非都能满足,上一章介绍的多重共线性只是其中一个方面,本章将讨论违背基本假定的另一个方面异方差性。虽然它们都是违背了基

3、本假定,但前者属于解释变量之间存在的问题,后者是随机误差项出现的问题。本章将讨论异方差性的实质、异方差出现的原因、异方差的后果,并介绍检验和修正异方差的若干方法。 第一节 异方差性的概念一、异方差性的实质第二章提出的基本假定中,要求对所有的i(i=1,2,n)都有 (5.1)也就是说具有同方差性。这里的方差度量的是随机误差项围绕其均值的分散程度。由于,所以等价地说,方差度量的是被解释变量Y的观测值围绕回归线=的分散程度,同方差性实际指的是相对于回归线被解释变量所有观测值的分散程度相同。设模型为 (5.2)如果其它假定均不变,但模型中随机误差项的方差为 (5.3)则称具有异方差性。由于异方差性指

4、的是被解释变量观测值的分散程度是随解释变量的变化而变化的,如图5.1所示,所以进一步可以把异方差看成是由于某个解释变量的变化而引起的,则 (5.4) 图5.1 二、产生异方差的原因 由于现实经济活动的错综复杂性,一些经济现象的变动与同方差性的假定经常是相悖的。所以在计量经济分析中,往往会出现某些因素随其观测值的变化而对被解释变量产生不同的影响,导致随机误差项的方差相异。通常产生异方差有以下主要原因:1、模型中省略了某些重要的解释变量异方差性表现在随机误差上,但它的产生却与解释变量的变化有紧密的关系。如果计量模型本来应当为,假如被略去了,而采用了 (5.5)当被略去的与有呈同方向或反方向变化的趋

5、势时,随的有规律变化会体现在(5.5)式的中。如果将某些未在模型中出现的重要影响因素归入随机误差项,而且这些影响因素的变化具有差异性,则会对被解释变量产生不同的影响,从而导致误差项的方差随之变化,即产生异方差性。在第四章已经讨论过,可以通过剔除变量的方法去避免多重共线性的影响,但是如果删除了重要的变量又有可能引起异方差性。这是在建模过程中应当引起注意的问题。2、模型设定误差模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。3、测量误差的变化样本

6、数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。例如生产函数模型,由于生产要素投入的增加与生产规模相联系,在其他条件不变的情况下,测量误差可能会随生产规模的扩大而增加,随机误差项的方差会随资本和劳动力投入的增加而变化。另一方面当用时间序列数据估计生产函数时,由于抽样技术和数据收集处理方法的改进,观测误差有可能会随着时间的推移而降低。4、截面数据中总体各单位的差异通常认为,截面数据较时间序列数据更容易产生异方差。例如,运用截面数据研究消费和收入之间的关系时,如果采取不同家庭收入组的数据,低收入组的家庭用于购买生活必需品的比例相对较大,消费的

7、分散程度不大,组内各家庭消费的差异也较小。高收入组的家庭有更多自由支配的收入,家庭消费有更广泛的选择范围,消费的分散程度较大,组内各家庭消费的差异也较大。这种不同收入组家庭的消费偏离均值程度的差异,最终反映为随机误差项偏离其均值的程度有变化,而出现异方差。异方差性在截面数据中比在时间序列数据中可能更常出现,这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。 以上只是对产生异方差的经验总结,在建立计量经济学模型的过程中,具体是什么原因产生异方差,应对变量的经济意义和数据所表现出的特征进行认真地分析。

8、第二节 异方差性的后果在计量经济分析中,如果模型里存在异方差,则对模型会产生以下后果。一、对参数估计式统计特性的影响1、参数的OLS估计仍然具有无偏性由第二章参数估计的统计特性可知,参数OLS估计的无偏性仅依赖于基本假定中随机误差项的零均值假定(即),以及解释变量的非随机性,异方差的存在并不影响参数估计式的无偏性。2、参数OLS估计式的方差不再是最小的在模型参数的所有线性估计式中,OLS估计方差最小的重要前提条件之一是随机误差项为同方差,如果随机误差项是异方差的,将不能再保证最小二乘估计的方差最小。事实上可以证明,能够找到比OLS估计的方差更小的估计方法,本章第四节将会介绍这类估计方法。也就是

9、说,在异方差存在时,虽然OLS估计仍保持线性无偏性和一致性,但已失去了有效性,即参数的OLS估计量不再具有最小方差。(证明见本章附录5.1)。二、对参数显著性检验的影响在存在异方差时,OLS估计式不再具有最小方差,如果仍然用不存在异方差性时的OLS方式估计其方差,例如在一元回归时仍用去估计参数估计式的方差,将会低估存在异方差时的真实方差,从而低估,这将导致夸大用于参数显著性检验的t统计量。如果仍用夸大的t统计量进行参数的显著性检验,可能造成本应接受的原假设被错误的拒绝,从而夸大所估计参数的统计显著性。三、对预测的影响尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量

10、不是有效的,从而对Y的预测也将不是有效的。在存在异方差时,与的变化有关,参数OLS估计的方差不能唯一确定,Y预测区间的建立将发生困难。而且会增大,Y预测值的精确度也将会下降。异方差性的存在,会对回归模型的正确建立和统计推断带来严重后果,因此在计量经济分析中,有必要检验模型是否存在异方差。第三节 异方差性的检验要检验模型中是否有异方差,需要了解随机误差项的概率分布。由于随机误差很难直接观测,只能对随机误差的分布特征进行某种推测,因此对异方差性的检验还没有完全可靠的准则,只能针对产生异方差不同原因的假设,提出一些检验异方差的经验办法。本节只介绍一些最常用的方法。一、图示检验法1、相关图形分析方差描

11、述的是随机变量相对其均值的离散程度,而被解释变量Y与随机误差项u有相同的方差,所以分析Y与X的相关图形,可以初略地看到Y的离散程度及与X之间是否有相关关系。如果随着X的增加,Y的离散程度有逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。通常在建立回归模型时,为了判断模型的函数形式,需要观测Y与X的相关图形,同时也可利用相关图形大致判断模型是否存在异方差性。例如,用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据(表5.2),绘制出消费支出对纯收入的散点图(图5.2),其中用y1表示农村家庭消费支出,x1表示家庭纯收入。 图5.2 2、残差图形分析虽然随机误差项

12、无法观测,但样本回归的残差一定程度上反映了随机误差的某些分布特征,可通过残差的图形对异方差性作观察。例如,一元线性回归模型,在OLS估计基础上得到残差的平方,然后绘制出对的散点图,如果不随而变化,如图5.3a所示,则表明不存在异方差;如果随而变化,如图5.3b、c、d所示,则表明存在异方差。ba0000dc图5.3 图形法的特点是简单易操作,不足是对异方差性的判断比较粗糙,由于引起异方差性的原因错综复杂,仅靠图形法有时很难准确对是否存在异方差下结论,还需要采用其他统计检验方法。二、戈德菲尔德-夸特(Goldfeld-Quanadt)检验该检验方法是戈德菲尔德和夸特于1965年提出的,可用于检验

13、递增性或递减性异方差。此检验的基本思想是将样本分为两部分,然后分别对两个样本进行回归,并计算比较两个回归的剩余平方和是否有明显差异,以此判断是否存在异方差。1、检验的前提条件(1)此检验只适用于大样本。(2)除了同方差假定不成立外,其它假定均满足。2、检验的具体做法(1)将观测值按解释变量的大小顺序排序。(2)将排列在中间的C个(约1/4)的观察值删除掉,再将剩余的观测值分为两个部分,每部分观察值的个数为(n-c)/2。(3)提出假设。即两部分数据的方差相等; 两部分数据的方差不相等。(4)构造F统计量。分别对上述两个部分的观察值作回归,由此得到的两个部分的残差平方和,以表示前一部分样本回归产

14、生的残差平方和,以表示后一部分样本回归产生的残差平方和,它们的自由度均为(n-c)/2-k,k为参数的个数。在原假设成立的条件下,因分别服从自由度均为(n-c)/2-k的分布 可参阅 美 J.M.伍德里奇著计量经济学导论,中国人民大学出版社,2003,第240页。 ,可导出 (5.7)(5)判断。给定显著性水平,查F分布表,得临界值。计算统计量,如果,则拒绝原假设,不拒绝备择假设,即认为模型中的随机误差存在异方差。反之,如果,则不拒绝原假设,认为模型中随机误差项不存在异方差。 戈德菲尔德-夸特检验的功效,一是与对观测值的正确排序有关;二是与删除数据的个数c的大小有关。经验认为,当n=30时,可以取c=4;当n=60时,可以取c=10为宜。该方法得到的只是异方差是否存在的判断,在多个解释变量的情况下,对判断是哪一个变量引起异方差还存在局限。 三、White检验White检验的基本思想是,如果存在异方差,其方差与解释变量有关系,分析是否与解释变量的某些形式有联系可判断异方差性。但是一般是未知的,可用OLS估计的残差平方作为其估计值。在大样本的情况下,作对常数项、解释变量、解释变量的平方及其交叉乘积等所构成辅助回归

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号