计量经济学-第八章-虚拟变量

上传人:F****n 文档编号:88226593 上传时间:2019-04-21 格式:PPT 页数:63 大小:993.50KB
返回 下载 相关 举报
计量经济学-第八章-虚拟变量_第1页
第1页 / 共63页
计量经济学-第八章-虚拟变量_第2页
第2页 / 共63页
计量经济学-第八章-虚拟变量_第3页
第3页 / 共63页
计量经济学-第八章-虚拟变量_第4页
第4页 / 共63页
计量经济学-第八章-虚拟变量_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《计量经济学-第八章-虚拟变量》由会员分享,可在线阅读,更多相关《计量经济学-第八章-虚拟变量(63页珍藏版)》请在金锄头文库上搜索。

1、计量经济学 理论方法EViews应用 郭存芝 杜延军 李春吉 编著,电子教案,本章将主要介绍经典单方程计量经济学模型中引入虚拟变量的问题。,第八章 虚拟变量模型,在前面几章中,主要介绍了经典线性回归模型及其在若干基本假定下的估计问题,并分析了一个或多个假定不满足时所产生的后果及其可能的改进措施。然而上述方法还不能解决经济生活中遇到的全部问题。,如何考察某一突发事件、性别、季节、受教育程度等对经济行为带 来的影响?,例如:,第八章 虚拟变量模型, 学习目的,了解虚拟变量、虚拟变量模型的概念,掌握虚拟变量设置的 原则和引入模型的方法。, 基本要求,1)认识到虚拟变量是建立计量经济学模型经常会遇到的

2、问题; 2)了解虚拟变量、虚拟变量模型的概念; 3)掌握虚拟变量设置的原则、虚拟变量模型的建模方法及应用。, 虚拟变量,虚拟变量模型,第八章 虚拟变量模型,第一节 虚拟变量,虚拟变量的引入,虚拟变量的设置原则,一、虚拟变量,为什么要引入“虚拟变量” ?,如商品需求量、价格、收入、产量等,许多经济变量是可以定量度量的或者说是可以直接观测的,但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测,如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等。,为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将 它们人为地“量化”,这种“量化”通常是

3、通过引入“虚拟变量”来完成的。,这种用两个相异数字来表示对被解释变量有重要影响而自身又 没有观测数值的一类变量,称为虚拟变量(dummy variables)。,虚拟变量也称为哑变量或定性变量。,虚拟变量的特点是:,1虚拟变量是对经济变化有重要影响的不可测变量。,2虚拟变量是赋值变量,一般根据这些因素的属性类型,构造只取 “0”或“1”的人工变量,通常称为虚拟变量,记为D。这是为了便于计算而 把定性因素这样数量化的,所以虚拟变量的数值只表示变量的性质而不表 示变量的数值。,基础类型和肯定类型取值为1;,一般地,在虚拟变量的设置中,,比较类型和否定类型取值为0。,例如:,1)表示性别的虚拟变量可

4、取为,2)表示文化程度的虚拟变量可取为,3)表示地区的虚拟变量可取为,4)表示消费心理的虚拟变量可取为,5)表示天气变化的虚拟变量可取为,二、虚拟变量模型,同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。,在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要 是用作解释变量。,其中,例如:,三、虚拟变量的引入,虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。,1. 加法方式,上述职工薪金模型(8-1)中性别虚拟变量的引入就采取了加法方式,,女职工的平均薪金为:,男职工的平均薪金为:,从几何意义上看(图8-1),,图8-1 男女职工平均薪金示意图,则两个函数有相同的

5、斜率,但有不同的截距。,例如:,在截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。,教育水平考虑三个层次:高中以下,高中,大学及其以上,这时需要引入两个虚拟变量:,模型可设定如下:,(8-2),高中以下:,E(Yi|Xi,D1i=0,D2i=0)=0+1Xi,高中:,大学及其以上:,E(Yi|Xi,D1i=1,D2i=0)=(0+2 )+1Xi,E(Yi|Xi,D1i=0,D2i=1)=(0+3 )+1Xi,图8-2 不同教育程度人员保健支出示意图,还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。,例如:,在职工薪金模型(8-1)的例子中,再引入学历的虚拟变量,则职工薪金

6、的回归模型可设计如下:,于是,不同性别、不同学历职工的平均薪金分别由下面各式给出:,女职工本科以下学历的平均薪金:,男职工本科以下学历的平均薪金:,女职工本科以上学历的平均薪金:,男职工本科以上学历的平均薪金:,E(Yi|Xi,D1i=0,D2i=0)=0+1Xi,E(Yi|Xi,D1i=1,D2i=0)=(0+2 )+1Xi,E(Yi|Xi,D1i=0,D2i=1)=(0+3 )+1Xi,E(Yi|Xi,D1i=1,D2i=1)=(0+2+3 )+1Xi,2. 乘法方式,斜率的变化,例如:,根据消费理论,消费水平C主要取决于收入水平X。但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自

7、然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。,则消费模型可建立如下:,(8-4),这里,虚拟变量 Dt 以与 Xt 相乘的方式引入了模型中,从而可用来 考察消费倾向的变化。,在E(t)=0的假定下,上述模型所表示的函数可化为:,正常年份:,反常年份:,图8-3 不同年份消费倾向示意图,如果在模型中同时使用加法和乘法两种方式引入虚拟变量, 则回归线的截距和斜率都会改变。,例如:,显然在式(8-5)中,同时使用加法和乘法两种方式引入了虚拟变量。,在E(t)=0的假定下,上述模型所表示的函数可化为:,改革开放以前:,E(Yt|Xt,Dt=0

8、)=0+1Xt,改革开放以后:,则其几何图形如图8-4所示。,E(Yt|Xt,Dt=1)=(0+1) +(1+2 ) Xt,3临界指标的虚拟变量的引入,在经济发生转折时,可通过建立临界指标的虚拟变量模型来反映。,例如:,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后, Y对X的回归关系明显不同。,则进口消费品的回归模型可建立如下:,(8-6),如果用OLS法得到该模型的回归方程为,(8-7),则两个时期进口消费品函数分别为,当tt*=1979时,当tt*=1979时,几何图形如图8-5所示,图8-5 转折期回归示意图,4数值变量作为虚拟变量引入,有些变量虽然是数量变量,即可以获

9、得实际观测值,但在某些特定情 况下把它选取为虚拟变量则是方便的,以虚变量引入计量经济学模型更加 合理。,譬如年龄因素虽然可以用数字计量,但如果将年龄作为资料分组的特 征,则可将年龄选作虚拟变量。,例如:,家庭教育经费支出不仅取决于其收入,而且与年龄因素有关。,按年龄划分为三个年龄组:618岁年龄组(中小学教育);1922岁 年龄组(大学教育);其它年龄组。于是设定虚拟变量,则家庭教育经费支出模型可设定为,(8-8),其中,Yi是第i个家庭的教育经费支出;Xi是第i个家庭的收人; 虚拟变量D1i、D2i分别表示第i家庭中是否有618岁和1922岁的成员。,5. 虚拟变量交互效应分析,当分析解释变

10、量对变量的影响时,大多数情形只是分析了解释变量 自身变动对被解释变量的影响作用,而没有深入分析解释变量间的相互 作用对被解释变量影响。,前面讨论的分析两个定性变量对被解释变量影响的虚拟变量模型中, 暗含着一个假定:,两个定性变量是分别独立地影响被解释变量的,但是在实际经济活动中,两个定性变量对被解释变量的影响可能存在 一定的交互作用,即一个解释变量的边际效应有时可能要依赖于另一个解 释变量。,为描述这种交互作用,可以把两个虚拟变量的乘积以加法形式引入模型。,考虑下列模型,其中,Yi为农副产品生产总收益,Xi为农副产品生产投入,D1i为油菜籽生 产虚拟变量,D2i为养蜂生产虚拟变量。这里,例如:

11、,显然,(8-9)式描述了是否发展油菜籽生产与是否发展养蜂生产的差异对农 副产品总收益的影响。,虚拟解释变量D1i和D2i是以加法形式引入的,那么暗含着假定:,油菜籽生产和养蜂生产是分别独立地影响农副产品生产总收益。,但是,在发展油菜籽生产时,同时也发展养蜂生产,所取得的农副 产品生产总收益可能会高于不发展养蜂生产的情况。即在是否发展油菜 籽生产与养蜂生产的虚拟变量D1i和D2i之间,很可能存在着一定的交互 作用,且这种交互影响对被解释变量农副产品生产总收益会有影响。,为描述虚拟变量交互作用对被解释变量的效应,在(8-9)式中以加法形式引入 两个虚拟解释变量的乘积,即,(1)基础类型:不发展油

12、菜籽生产,也不发展养蜂生产时农副产品生产平均总收益,(2)比较类型:同时发展油菜籽生产和养蜂生产时,农副产品生产平均总收益,1为是否发展油菜籽生产对农副产品生产总收益的截距差异系数; 2为是否发展养蜂生产对农副产品生产总收益的截距差异系数; 3为同时发展油菜籽生产和养蜂生产时对农副产品生产总收益的交互效应系数。 0 3组成截距水平。,其中,关于交互效应是否存在,可借助于交互效应虚拟解释变量系数的显著性检验来加以判断。 如果t 检验表明交互效应D1iD2i在统计意义上显著时,说明交互效应对Yi存在显著影响。,四、虚拟变量的设置原则,每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1, 即如

13、果定性变量有m个类别,则只在模型中引入m-1个虚拟变量。,例如:,已知冷饮的销售量Y除受k个定量变量Xi的影响外,还受一个定性变量季 节即春、夏、秋、冬四季变化的影响。要考察该四季的影响,只需引入三个 虚拟变量即可:,则冷饮销售量的模型为,(8-13),在上述模型中,若再引入第四个虚拟变量,则冷饮销售模型变量为,(8-14),其矩阵形式为,(8-15),如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次 观测值,则其中,所谓的“虚拟变量陷阱”,第二节 虚拟被解释变量,当虚拟变量作为被解释变量时,其作用是对某一经济现象 或活动进行“是”与“否”的判断或决策。,研究是否购买商品住房、是否

14、参加人寿或财产保险、是否 能按期偿还贷款、新产品在市场上是否畅销、对某一改革措施 所持的态度等。,例如:,例如:,假定我们要从一个截面样本度量汽车所有权的决定因素。,某些人有汽车,而其他人没有。假定这种所有权函数的决定因素是 收入和职业,则可设定模型为:,(8-16),其中,Xi表示收入,,显然,这个模型中被解释变量是一个虚拟变量。,特征:,被研究的对象(即被解释变量)在受到多种因素影响时,其取值 只有两种状态:“是”与“否”。,“二元型响应”现象,如何处理二元型响应被解释变量模型的估计、推断问题?,一、线性概率模型(LPM),二、Logit模型,一、线性概率模型(LPM),1什么是线性概率模

15、型,其中,Xi为住户的收入;Yi为一虚拟变量,表示住户购买商品住房的情况,问题:,我们前面讨论的回归分析主要是研究E(Yi|Xi)=0+1 Xi的问题, 即研究条件均值轨迹的问题,而在上述模型中,被解释变量是某种属性 发生与否的状况,怎样把被解释变量某种属性发生与否的概率问题同条 件均值的轨迹研究联系起来?,另外,若概率问题与条件均值轨迹能够联系起来的话,那么,我们 所讨论的线性回归分析会出现什么问题?,由于E(i)=0,由(8-17),,另外,设Y有下列分布:,P(Yi=1)= pi , P(Yi=0)= 1- pi,根据数学期望的定义,注意到事件Y=1是在给定收入X的条件下发生的,因此E(

16、Yi)= E(Yi |Xi),于是有,表明购买商品用房的概率是收入的线性函数。,像(8-17)式那样,以虚拟变量作为被解释变量的模型的条件期望实际上等于 随机变量Yi取值为1的条件概率。,即当住户的收入水平为X时,其购买商品住房的概率可表示成X的线性函 数,故(8-17)式也被称为线性概率模型(LPM)。,显然,只要得到(8-17)式中0和1的估计量后,就可以估计出不同收入 水平住户购买商品住房的概率。,2线性概率模型的估计,从形式上看,(8-17)式与普通的线性计量经济模型相似,是否能够 运用OLS法直接对其进行估计呢?,答案是否定的。,因为直接采用OLS法对(8-17)式那样的模型进行估计,将会遇到一 些特殊的问题,使得估计结果失去了合理的经济解释,因而需要寻求 相应的处理方法。,问题:,(1) 随机扰动项i的非正态性,在线性概率模型中,因为,显然,关于i的正态性假设不再成立。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号