第9章虚拟变量回归模型

上传人:飞*** 文档编号:48603177 上传时间:2018-07-18 格式:PPT 页数:58 大小:2.84MB
返回 下载 相关 举报
第9章虚拟变量回归模型_第1页
第1页 / 共58页
第9章虚拟变量回归模型_第2页
第2页 / 共58页
第9章虚拟变量回归模型_第3页
第3页 / 共58页
第9章虚拟变量回归模型_第4页
第4页 / 共58页
第9章虚拟变量回归模型_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《第9章虚拟变量回归模型》由会员分享,可在线阅读,更多相关《第9章虚拟变量回归模型(58页珍藏版)》请在金锄头文库上搜索。

1、LOGO第九章 虚拟变量回归模型本章将主要介绍经典单方程计量经济学模型中引入虚拟变量并在此基础上对建立单方程计量经济学模型的方法论进行简单的总结与讨论。在前面几章中,主要介绍了经典线性回归模型及其在若干基本假定 下的估计问题,并分析了一个或多个假定不满足时所产生的后果及其可 能的改进措施。然而上述方法还不能解决经济生活中遇到的全部问题。如何考察某一突发事件、性别、季节、受教育程度等对经济行为带来的影响?例如:第九章 虚拟变量回归模型第九章 虚拟变量回归模型 学习目的了解虚拟变量、虚拟变量模型的概念,掌握虚拟变量设置的原则和引入模型的方法。 基本要求1)认识到虚拟变量是建立计量经济学模型经常会遇

2、到的问题;2)了解虚拟变量、虚拟变量模型的概念;3)掌握虚拟变量设置的原则、虚拟变量模型的建模方法及应用。 虚拟变量的性质ANOVA模型第九章 虚拟变量回归模型ANCOVA模型邹至庄检验的虚拟变量方法使用虚拟变量的交互效应季节分析中虚拟变量的使用分段线性回归第九章 虚拟变量回归模型综列数据回归模型虚拟变量方法的某些技术问题第一节 虚拟变量的性质为什么要引入“虚拟变量” ?如商品需求量、价格、收入、产量等许多经济变量是可以定量度量的或者说是可以直接观测的但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售

3、的影响等。 为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将它们人为地“量化”,这种“量化”通常是通过引入“虚拟变量”来完成的。 这种用两个相异数字来表示对被解释变量有重要影响而自身又没有观测数值的一类变量,称为虚拟变量(dummy variables)。虚拟变量也称为哑变量或定性变量。这种变量实质上就是一个将数据区分为相互排斥的类别的工具。虚拟变量的特点是:1虚拟变量是对经济变化有重要影响的不可测变量。2虚拟变量是赋值变量,一般根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D。这是为了便于计算而把定性因素这样数量化的,所以虚拟变量的数值只表示变量

4、的性质而不表示变量的数值。 基础类型和肯定类型取值为1;一般地,在虚拟变量的设置中,比较类型和否定类型取值为0。例如: 1)表示性别的虚拟变量可取为D1=1 男性0 女性2)表示文化程度的虚拟变量可取为D2=1 本科及以上学历0 本科以下学历3)表示地区的虚拟变量可取为D3=1 城市0 农村4)表示消费心理的虚拟变量可取为D4=1 喜欢某种商品0 不喜欢某种商品5)表示天气变化的虚拟变量可取为D5=0 雨天1 晴天第二节 ANOVA模型一个回归归模型所包含的回归归元可以都是虚拟拟或定性变变量。 这这种模型被称为为方差分析(analysis of variance, ANOVA)模 型。见见下例

5、。例9.1 不同地理区域公立学校教师师的薪水表9.1 1986年公立学校教师的州平均薪水 obs 薪水支出D2D3obs 薪水支出D2D3 1 19583.00 3346.000 1.000000 0.000000 26 20627.00 2821.000 0.000000 1.000000 2 20263.00 3114.000 1.000000 0.000000 27 22795.00 3366.000 0.000000 1.000000 3 20325.00 3554.000 1.000000 0.000000 28 21570.00 2920.000 0.000000 1.000000

6、 4 26800.00 4642.000 1.000000 0.000000 29 22080.00 2980.000 0.000000 1.000000 5 29470.00 4669.000 1.000000 0.000000 30 22250.00 3731.000 0.000000 1.000000 6 26610.00 4888.000 1.000000 0.000000 31 20940.00 2853.000 0.000000 1.000000 7 30678.00 5710.000 1.000000 0.000000 32 21800.00 2533.000 0.000000

7、1.000000 8 27170.00 5536.000 1.000000 0.000000 33 22934.00 2729.000 0.000000 1.000000 9 25853.00 4168.000 1.000000 0.000000 34 18443.00 2305.000 0.000000 1.000000 10 24500.00 3547.000 1.000000 0.000000 35 19538.00 2642.000 0.000000 1.000000 11 24274.00 3159.000 1.000000 0.000000 36 20460.00 3124.000

8、 0.000000 1.000000 12 27170.00 3621.000 1.000000 0.000000 37 21419.00 2752.000 0.000000 1.000000 13 30168.00 3782.000 1.000000 0.000000 38 25160.00 3429.000 0.000000 1.000000 14 26525.00 4247.000 1.000000 0.000000 39 22482.00 3947.000 0.000000 0.000000 15 27360.00 3982.000 1.000000 0.000000 40 20969

9、.00 2509.000 0.000000 0.000000 16 21690.00 3568.000 1.000000 0.000000 41 27224.00 5440.000 0.000000 0.000000 17 21974.00 3155.000 1.000000 0.000000 42 25892.00 4042.000 0.000000 0.000000 18 20816.00 3059.000 1.000000 0.000000 43 22644.00 3402.000 0.000000 0.000000 19 18095.00 2967.000 1.000000 0.000

10、000 44 24640.00 2829.000 0.000000 0.000000 20 20939.00 3285.000 1.000000 0.000000 45 22341.00 2297.000 0.000000 0.000000 21 22644.00 3914.000 1.000000 0.000000 46 25610.00 2932.000 0.000000 0.000000 22 24624.00 4517.000 0.000000 1.000000 47 26015.00 3705.000 0.000000 0.000000 23 27186.00 4349.000 0.

11、000000 1.000000 48 25788.00 4123.000 0.000000 0.000000 24 33990.00 5020.000 0.000000 1.000000 49 29132.00 3608.000 0.000000 0.000000 25 23382.00 3594.000 0.000000 1.000000 50 41480.00 8349.000 0.000000 0.000000 51 25845.00 3766.000 0.000000 0.000000 注:D2=1,若该州位于东北和中北部;0,其他地区。 D3=1,若该州位于南部;0,其他地区。考虑虑

12、如下模型:其中Yi=第i 个州公立学校教师师的平均薪水D2i =1若该该州位于东东北和中北部=0否则则D3i =1若该该州位于南部=0否则则 假定误误差项满项满 足通常的OLS假定,则对则对 上式两边边取期望得: 东东北和中北地区教师师薪水均值为值为 :南部教师师薪水均值为值为 :西部教师师薪水均值值:西部学校教师师薪水由截距 给给出,而斜率系数 和 表示中东东 北地区和南部地区薪水的均值值与西部地区的差别别。得到如下回归结归结 果:西部教师师薪水约为约为 26158美元,东东北和中北教师师薪水约约低1734美元 为为24424美元,南部教师师薪水约约低3265美元为为22894美元。从回归归

13、中看出,东东中部地区的估计计系数在统计统计 上的不显显著的,p值值 为为23%;南部地区是显显著的,p值为值为 3.5%。因此,结论结论 是,西部地区和东东中部地区教师师薪水的均值值大致相同, 而南部地区教师师薪水的均值则统计值则统计 上显显著的略低3265美元。注意:1. 若定性变变量有m个类别类别 ,则则只需引入(m-1)个虚拟变拟变 量。否则则 会陷入虚拟变拟变 量陷阱,即完全共线线性或完全多重共线线性的情况 。因此,若在例9.1中有教师师性别别的信息,就应该应该 再加一个( 而非两个)虚拟变拟变 量,对对女性取值为值为 1对对男性取值为值为 0。2. 不指定其虚拟变拟变 量的那一组组被

14、称为为基(base)组组、基准 (benchmark)组组、控制(control)组组、比较较(comparison)组组、参照 (reference)组组。所有其他的组组都与基准组进组进 行比较较。3. 截距值值 代表了基准组组的均值值。例9.1中基准组为组为 西部地区。4. 虚拟变拟变 量的系数称为为级级差截距系数。它告诉诉我们们取值为值为 1的地 区的截距值值与基准组组的截距值值之间间的差别别。如-1734、-3265.5. 基准组组的选择选择 完全取决于研究者。第三节 含有两个变量的ANOVA模型例9.2 小时时工资资与婚姻状况和居住地的关系从1985年5月的一个528人的样样本中得到

15、如下结论结论 :其中Y=小时时工资资(美元),D2 = 婚姻状况;1=已婚,0 = 其他D3 = 居住地;1 = 南部,0 = 其他D2 = 婚姻状况;1=已婚,0 = 其他D3 = 居住地;1 = 南部,0 = 其他基准组组:未婚的非南部居民组组。基准组组的小时时工资资均值约为值约为 8.81美元。与其相比,已婚者的平均小时时工资约资约 高1.10美元,实际实际 平均工资资 为为9.91美元。对对比之下,住在南部的人的平均小时时工资约资约 低1.67美元,实际实际 小 时时工资为资为 7.14美元。所有级级差截距都是统计统计 上显显著的,p值值都相当小。注意:遇到多于一个定性变变量,所有其他

16、组组都是与基组进组进 行比较较 多。第四节 ANCOVA模型同时含有一般解释变量与虚拟变量的模型称为协方差分析 (analysis of covariance, ANCOVA)模型。 在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要是用作解释变量。 例9.3 教师师薪水与区域和对对公立学校每个学生的支出之 间间的关系重新考虑虑例9.1,假设设三个区域的教师师薪水没什么不同,考虑虑地方政府 对对公立学校的支出变变量。Yi=公立学校教师师的平均薪水(美元) Xi=对对公立学校每个学生的支出(美元) D2i =1,若该该州位于东东北和中北部=0,其他 D3i =1,若该该州位于南部=0,其他在这这个回归归中,把西部作为为基准组组,除了两个定性回归归元之外,还还有 一个定量变变量X,在ANCOVA模型下,X被称为为协变协变 量。在其他条件不变变的情况下,公共支

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号