《计量经济学第10章虚拟变量》由会员分享,可在线阅读,更多相关《计量经济学第10章虚拟变量(16页珍藏版)》请在金锄头文库上搜索。
1、第10章 虚拟变量 本章介绍多元回归分析中特殊的解释变量,即虚拟变量(dummy variable)。 一、一、虚拟变量的基本含义虚拟变量的基本含义许多经济变量是可以定量度量可以定量度量的,如:如:商品需求量、价格、收入、产量等。但也有一些影响经济变量的因素无法定量度量无法定量度量,如:如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。 这种“量化”通常是通过引入“虚拟变量”来完成。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量虚拟变量(dumm
2、y variables),记为D。例如例如,反映文程度的虚拟变量可取为,反映文程度的虚拟变量可取为: 1, 本科学历 D= 0, 非本科学历虚虚拟变量用于一下量用于一下场合合1,需要排除数据中的异常值,季节性因素等。2,存在结果性变化。3,需要对难以量化的数据进行处理。计量经济中的虚拟变量,在明确其引入理由基础上,被用于很多的多元回归模型。二,虚拟变量的类型1,临时虚拟,临时虚拟 临时虚拟,也称为突发性虚拟。为了更好的对模型进行估算,经常需要在回归模型中排除一些由突发性事件产生的异常值(outlier),及其对模型的影响,例如战争,地震,内乱,罢工等。 1 异常时期 D= 0 平时 1 发生地
3、震的年份 D1= 0 其他年份 1 发生水灾的年份 D2= 0 其他年份 2,定性数据的虚拟处理定性数据的虚拟处理学历,性别,人种等定性的差异学历,性别,人种等定性的差异 3,季度虚拟季度虚拟(1),定义:季度虚拟是通过回归模型的常数项的变化(斜率回归系数一定)来掌握季度和月度等季节变化,因此,从技术角度成为“常数项虚拟”。 为了消除季节变化,应该设立下列多元回归模型,引入季度虚拟变量。 1 第1季度 D1= 0 其他 1 第2季度 D2= 0 其他 1 第3季度 D3= 0 其他 虽然季度数据共有四个,但是由于虚拟变量是以第四季度为基准,仅用三个就可以。上述模型中,回归系数是共同的。第一季度
4、到第四季度的常数项为: 第一季度: 第二季度: 第三季度: 第四季度: 现在第四季度是基准,分别表示第四季度与各季度之差。 在实际分析当中,根据T检验的结果,将不显著的季度虚拟变量从模型中消除,用剩下的显著的虚拟变量对模型进行估算就足够。(2), 没有常数项的时候,可以设第4季度的季度虚拟。 (3),虚拟变量的陷阱注意注意:如果每个季度都有虚拟变量,又有又有一个常数项一个常数项,将遇到完全共线性的情况,即变量之间出现完全共线性的关系。设想现在增加了第四季度的虚拟变量列,如果将这四个D列水平相加就得到由1构成的一列。由于常数项对每个观测都为1(隐含的),又得到由1构成的一列。就是说这四个D列之和再次生成了常数项列,由此导致了完全共线性。4,系数虚拟 所谓系数虚拟,是为了结构变化之前与之后的回归系数(斜率)的差异(而不是常数项)而采取的虚拟变量处理方法。 1 结构变化之后 D= 0 结构变化以前结构变化之后的回归系数为 结构变化之前的回归系数为 无论哪一种情况下,常数项均为 如果结构变化引起回归系数和常数项双方变化,可以用下面的模型引入系数虚拟变量和常数虚拟变量。 系数虚拟变量和常数项虚拟变量