本科经济计量学第6章(第4版)

上传人:飞*** 文档编号:3632089 上传时间:2017-08-05 格式:PPT 页数:50 大小:547.50KB
返回 下载 相关 举报
本科经济计量学第6章(第4版)_第1页
第1页 / 共50页
本科经济计量学第6章(第4版)_第2页
第2页 / 共50页
本科经济计量学第6章(第4版)_第3页
第3页 / 共50页
本科经济计量学第6章(第4版)_第4页
第4页 / 共50页
本科经济计量学第6章(第4版)_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《本科经济计量学第6章(第4版)》由会员分享,可在线阅读,更多相关《本科经济计量学第6章(第4版)(50页珍藏版)》请在金锄头文库上搜索。

1、第6章 虚拟变量回归模型,6.1 虚拟变量的性质6.2 ANCOVA模型:包含一个定量变量、一个两分定性变量的回归模型6.3 包含一个定量变量、一个多分定性变量的回归6.4 包含一个定量变量、多个定性变量的回归6.5 比较两个回归6.6 虚拟变量在季节分析中的应用6.7 应变量也是虚拟变量的情形:线性概率模型6.8 总结,前面我们考虑的回归模型中的解释变量都是定量变量,本章将介绍在模型中如何引入定性变量并使模型更加丰富和完善。 这类定性变量称为虚拟变量。,6.1 虚拟变量的性质,虚拟变量(dummy variable):一种通常表明了具备或不具备某种性质的定性变量。通常将这类变量取值为0,1。

2、用符号D表示。 方差分析模型(ANOVA): 解释变量仅是虚拟变量的模型。协方差模型(ANCOVA): 回归模型中的解释变量有些是定量的,有些是定性的。,我们来看ANOVA模型的一个例子: Yi=B1+B2Di+ui (6-1)其中, Y=每年食品支出,此时的解释变量仅是一个虚拟变量。假定随机扰动项满足古典线性回归模型的基本假定,根据模型(6-1)得到:,男性食品支出的期望为:,女性食品支出的期望为:,用OLS法很容易检验零假设:男女平均食品支出无显著性差异(即B2=0),并可根据t检验值判定b2是否统计显著。,表6-1 男、女食品支出与税后收入和年龄数据,首先对数据进行整理,得到表6-2。,

3、例6.1 男、女个体消费者每年的食品支出,表6-1给出了20002001年男、女每年食品支出(美元)和税后收入(美元)的数据。,然后利用这些数据建立虚拟变量模型:(Y是食品支出,女性取为1): Yi=B1+B2Di+ui用OLS回归结果如下:,Eviews输出结果如下:,利用EViews软件操作讲解。,从回归结果可以看出,估计的男性的平均食品支出为3176.83美元,女性的平均食品支出为3176.83-503.172673.66美元。 回归结果也表明,b2是统计不显著的,也即男性与女性在食品支出上的差异不显著。 前面已经说过,这类解释变量仅是虚拟变量的模型被称为方差分析模型(ANOVA)。实际

4、上,这类模型的确可以用于判断两组(或多组)均值是否有显著不同。 本例中,男女平均食品支出无显著性差异。,虚拟变量的一些性质:(1)为了区别男、女两类的不同,我们仅引入了一个虚拟变量。一个虚拟变量足可以区分两个不同的种类。 若模型包含截距项,如果模型(6-1)写为: 其中,Y表示食品支出。,由于D1i与D2i存在完全共线性,所以无法估计模型(6-6)。,(6-6),假定有一个样本,该样本包括三个男性,两个女性。其数据矩阵如下:,数据矩阵右边的第一列代表了共同的截距B1。容易验证: D1=(1-D2)或D2=(1-D1)也即D1 和D2完全共线性。陷入虚拟变量陷阱。,一般的规则是:如果一个定性的变

5、量有m类,则要引入(m-1)个虚拟变量。否则就会陷入虚拟变量陷阱(dummy variable trap),就会出现完全多重共线性。(2)虚拟变量的赋值是任意的。(3)赋值为0的一类常称为基准类(base)、对比类(benchmark)、控制类(control)、或遗漏类(omitted category)。基准类的选择也是根据研究的目的而定的。(4)虚拟变量D的系数称为差别截距系数,表明取值为1的类的截距值与基准类截距值的差距。,例6.2 工会化程度与工作权利法,为了研究工作权利法的效果(该法禁止了各种工会保护措施。因此预期通过工作权利法的州比未通过的州工会化程度低),Brennan等人建立

6、了工会会员(属于工会的工人占所有工人的百分比)对工作权利法的函数模型。数据见表6-3(新教材P216)。函数模型如下: PVTi=B1+B2RWLi+Ui其中PVT代表工会化程度,RWL是虚拟变量,通过工作权利法的州赋值为1,未通过的赋值为0。,回归结果如下(见Eviews文件),回归结果表明,通过工人工作权利法的州中,工会化程度平均为10.415,未实施工人权利法的州中,工会化程度平均为19.8。因为虚拟变量的系数显著不为零。所以通过工作权利法的州与未通过的州的工会化程度有显著差异。,6.2 ANCOVA模型:包含一个定量变量、一个两分定性变量的回归模型,一个ANCOVA模型:Yi=B1+B

7、2Di+B3Xi+ui (6-8)其中,Y食品支出X税后收入D,上面模型包含了一个定量变量X和一个定性变量D(性别)。,对模型的解释如下: Yi=B1+B2Di+B3Xi+ui 假定E(ui)=0,则男性平均食品支出为:E(Yi|Xi, Di0)=B1+B3Xi女性平均食品支出为: E(Yi|Xi, Di1)=(B1+B2)+B3Xi 是两条同斜率不同截矩的平行直线。,Eviews输出结果如下:,比较该结果与前例结果。,男性平均食品支出为:,女性平均食品支出为:,(6-10),税后收入,X,Y,食品支出,男性平均食品支出,女性平均食品支出,6.3 包含一个定量变量、一个多分定性变量的回归,考虑

8、表6-4(新教材P219)提供的数据。该表给出了1951年美国50个州的公立学校和哥伦比亚公立学校教师的平均薪水和每个学生的公共教育支出的数据。 现在想知道教师薪水是否有地区差异。地区分为三类:东北和中北部(21个)、南部(17个)、西部(13个)。定义虚拟变量如下:,不考虑学生支出,我们可以考察如下模型: Yi =B1 +B2D2i +B3D3i+ui (6-12),如果考虑学生支出,我们可以考察如下模型: Yi =B1 +B2D2i +B3D3i+B4Xi+u西部地区的公立学教师平均年薪水: E (Yi| D2=0,D3=0,Xi)=B1+B4Xi东北和中北部地区的公立学教师平均年薪水:

9、E (Yi| D2=1,D3=0,Xi)=(B1+B2)+B4Xi 南部地区的公立学教师平均年薪水: E (Yi| D2=0,D3=1,Xi)=(B1+B3)+B4Xi,回归直线是三条同斜率不同截矩的平行直线。,Eviews输出结果如下(未加入每个学生的公共教育支出),加入每个学生的公共教育支出变量,模型的回归结果如下: se= (1395.06) (801.17) (861.12) (0.3176) t=(9.51158) (-2.0888) (-1.3287) (10.3539) p值=(0.0000) (0.0422) (0.1904) (0.0000) R2=0.7227,回归结果表明

10、,在其它条件不变时,每个学生的公共教育支出每增加1美元,公立学校教师平均薪水将增加3.29美元。 在5的显著性水平下,两个虚拟变量统计显著性是不一样的。,6.4 包含一个定量变量和多个定性变量的回归,虚拟变量的技术可以推广到解释变量中有不止一个定性变量的情形。 例如考虑平均小时工资一例,影响因素有:受教育年限、性别和肤色。为了简便,假定肤色有两种:白种和非白种。 模型设为: Yi=B1+B2D2i+B3D3i+B4Xi+ui (6-18) 式中,Y小时工资X受教育年限 D2i D3i,假定E(ui)=0,则:Yi=B1+B2D2i+B3D3i+B4Xi+ui (6-18)白种男性平均小时工资:

11、 E ( Yi | Xi, D=0,D3=0)=B1+B4Xi白种女性平均小时工资: E ( Yi | Xi, D=1,D3=0)=(B1+B2)+B4Xi非白种男性平均小时工资: E ( Yi | Xi, D=0,D3=1)=(B1+B3)+B4Xi非白种女性平均小时工资: E ( Yi | Xi, D=1,D3=1)=(B1+B2+ B3)+B4Xi,我们可以利用OLS法对上面模型进行估计,根据估计结果检验各种假设。例如,若差别截距b3是统计显著的,说明肤色对平均小时工资有显著影响。用528个个体数据估计的回归结果如下:,t(-0.2357)(-5.4873) (-2.1803) (9.9

12、094)R2=0.2032,6.4.1 交互影响,有时,虚拟变量之间可能存在交互影响,考察如下模型:,(6-20),交互影响虚拟变量,此时:白种男性的平均小时工资为: 白种女性的平均小时工资为: 非白种男性的平均小时工资为: 非白种女性的平均小时工资为:,女性的差别效应,非白种的差别效应,非白种女性的差别效应,t (-0.2357)(-5.4873) (-2.1803) (1.7420) (9.9094)R2=0.2032 n=528,利用同样的数据得到如下的回归结果:,6.4.2 模型的一般化,可以将模型推广到包含多个定量变量和多个定性变量的情形。但在设置虚拟变量时应避免陷入虚拟变量陷阱。,

13、例6-3政党对竞选活动的资助(略),Wilhite和Theilmann在研究1982年政党对国会选举的资助中,得到如下回归结果,见表9-4。在这个回归方程中,应变量是PARTY$(政党对当地候选人的资助),$GAP,VGAP和PU是三个定量变量,OPEN,DEMOCRAT 和COMM是三个定性变量,每一个定性变量分为两类。,表6-5 美国政党的总资助,$GAP度量候选人财政VGAP在以前竞选中不同政党获得投票的差距PU根据国会季刊所计算的政党团结指数,回归结果说明,$GAP越大(也即竞争对手有巨额资助),政党对当地候选人的资助就越少。VGAP越大,也即竞争对手在以前的竞选中获胜的次数越多,则国

14、会对该候选人的资助就越少。公开的竞争可能从国会中吸引更多的资助以确保在国会中的席位,该预期与回归结果一致。,6.5 比较两个回归,前面我们介绍的虚拟变量模型,虚拟变量都是以加法形式引入模型,也即模型中存在差别截矩。同时虚拟变量也能以乘法形式引入模型,使模型存在差别斜率:,以加法形式引入,以乘法形式引入,分解的回归模型如下:,差别截矩,差别斜率,根据差别截矩和差别斜率的统计显著性,有如下四种可能情形:,(1)B20,B40;两模型相同,称为一致回归(2)B20,B40;两模型截矩不同斜率相同,平行回归(3)B20,B40;两模型截矩相同斜率不同,并发回归(4)B20,B40;两模型截矩斜率都不同,相异回归,一致回归,平行回归,并发回归,相异回归,仍以食品支出一例来考察。,从上面结果可以看出,差别截矩和差别斜率都是统计不显著的。与前面模型相比较,我们会得到什么结论?,(可通过Eviews文件比较),例6-4:美国19701995年储蓄收入关系,表6-7给出了美国19701995年个人可支配收入(税后收入)和个人储蓄的数据,单位是10亿美元。我们想考察美国这个时间段储蓄(Y)与个人可支配收入(X)的关系。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号