第8虚拟变量模型讲课教案

上传人:yulij****0329 文档编号:138583566 上传时间:2020-07-16 格式:PPT 页数:86 大小:1.03MB
返回 下载 相关 举报
第8虚拟变量模型讲课教案_第1页
第1页 / 共86页
第8虚拟变量模型讲课教案_第2页
第2页 / 共86页
第8虚拟变量模型讲课教案_第3页
第3页 / 共86页
第8虚拟变量模型讲课教案_第4页
第4页 / 共86页
第8虚拟变量模型讲课教案_第5页
第5页 / 共86页
点击查看更多>>
资源描述

《第8虚拟变量模型讲课教案》由会员分享,可在线阅读,更多相关《第8虚拟变量模型讲课教案(86页珍藏版)》请在金锄头文库上搜索。

1、第8章 虚拟变量模型,一、虚拟变量的基本含义 二、虚拟变量的设置原则 三、虚拟变量作用 四、虚拟变量的引入 五、虚拟变量的特殊应用 六、虚拟被解释变量模型,一、虚拟变量的基本含义,许多经济变量是可以定量度量的,其取值可用数值表示,如:商品需求量、价格、收入、产量等 但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等,反映这些定性因素的变量被称为品质变量 ,这些变量由于各种原因不能计量 。 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”.,这种“量化”通常是通过人为地虚构出来一种特殊

2、的变量来完成的。即根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables),文献中习惯用 表示。,例如,反映性别这个属性的虚拟变量可取为:,一般地,在虚拟变量的设置中:用1表示这种属性或特征存在,用0表示这种属性或特征不存在。或者说,设置虚拟变量时,将比较类型、肯定类型取值为1;而将基础类型、否定类型取值为0。,再如:,虚拟变量模型概念:,把包含虚拟变量的模型称为虚拟变量模型(Dummy Variable Model),若仅有解释变量中包含虚拟变量,称为虚拟解释变量模型;若被解释变量是虚拟变量,称为虚拟被解释变量模型,或称为离散选择模型。 一

3、个以性别为虚拟变量考察企业职工薪金的模型:,其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。,虚拟变量陷阱,二、虚拟变量的设置原则,虚拟变量的个数须按以下原则确定: 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果定性变量有m个类型,只在模型中引入m-1个虚拟变量。 每个虚拟变量定义为:,当第i种属性类型出现时,第i,个虚拟变量取1,其它,都取0时,则表示出现第,种属性类型。,虚拟变量皆取0,而当所有,例:虚拟变量反映季节变动的影响,已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三

4、个虚拟变量即可:,则冷饮销售量的模型为:,在上述模型中,若再引入第四个虚拟变量,则冷饮销售模型变量为:,其矩阵形式为:,如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的:,显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。 这就是所谓的“虚拟变量陷阱”,应避免。,1.可以检验和度量用文字所表示的定性因素的影响 例如,为了反映甲、乙两种不同的工艺过程对产 量的影响,可以在生产函数中引入描述甲、乙两 种不同的工艺过程的虚拟变量: 通过对模型中 的显著性检验来确定甲、乙两 种不同的工艺过程是否对产量有显著影响。,三、虚拟变量的作用

5、,2. 可以测量变量在不同时期的影响,例如:研究我国国民生产总值Y随时间X而增长的过程,需要考虑反常年份这一特殊因素的影响。若定义 则引入虚拟变量的模型为 通过对参数 进行 检验,可以检验反常年份对社会总产值有无显著影响,就把受反常年份影响的时期从总过程中区分出来,3. 可以用来处理异常数据的影响。,例如,变量Y和X在长期中基本满足线性回归模型的各个假设,但在时刻有一个突发情况,使得Y出现一个k单位的暂时性波动。如果用线性回归模型 分析这两个变量的关系,其误差项的均值是 解决的办法是引进一个针对性 的虚拟变量,其定义为 新的回归模型为: 解决了均值非0的问题,其中,四、虚拟变量的引入方式,在计

6、量经济模型中引入虚拟解释变量,一般地有三种方式:加法方式、乘法方式和混合方式。 1.加法方式: 所谓加法方式,即将虚拟变量直接作为一个解释变量引入模型,它同其他解释变量之间是相加的关系。当不同类型模型的斜率相同,截距不相同时,可考虑以加法形式引入虚拟变量。 以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属性和引入虚拟变量的个数。,(1)解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性; (2)解释变量分别为一个定性变量(两种属性)和一个定量解释变量; (3)解释变量分别为一个定性变量(两种以上属性)和一个定量解释变量; (4)解释变量分别为两个定性变量(各自分别是两

7、种属性)和一个定量解释变量;,加法方式分为四种情形讨论:,(1)一个两种属性定性解释变量而无定量变量的情形,(2) 一个定性解释变量(两种属性)和一个定量解释变量的情形,几何意义:两个函数有相同的斜率,但有不同的截距,Y,X,(3)一个定性解释变量(三种属性)和一个定量解释变量的情形,在工资模型中如果我们考虑的是员工的受教育程度,比如可以将员工的分为:高中以下,高中毕业和大学及其以上三种。如果虚拟变量设为 高中以下 其他 高中毕业 其他 大学及其以上 其他,则,将会出现多重共线性,因此需要去掉一个虚拟变量。,假设模型为:,高中 其他 大学及其以上 其他,模型变为:,估计出的回归方程为:,高中以

8、下: 高中: 大学及其以上:,假定32,其几何意义:,(3)一个定性解释变量(四种属性)和一个定量解释变量的情形,四个季节对某些商品的需求量分别为:,模型中系数 、 、 、 分别反映了四、一、二、三、一季度对该商品的平均影响程度,根据这些系数的统计检验就可以判断季度因素对该商品的需求量是否存在着显著影响。,(4)两个定性解释变量(均为两种属性)和一个定量解释变量的情形,运用OLS得到回归结果,再用t检验讨论因素是否对模型有影响。,各类型居民香烟消费量分别为:,几何意义,加法方式引入虚拟变量的主要作用为: 1.在有定量解释变量的情形下,主要改变方程 截距; 2.在没有定量解释变量的情形下,主要用

9、于方 差分析。,基本思想: 以乘法方式引入虚拟变量时,是在所设立的模型 中,将虚拟解释变量与其它解释变量 的乘积,作 为新的解释变量出现在模型中,以达到其调整设模 型斜率系数的目的。或者将模型斜率系数表示为虚 拟变量的函数,以达到相同的目的。 乘法引入方式的特点: (1)截距不变; (2)斜率发生变化;,2.乘法方式,例:研究文化用品消费支出Y受收入X、居民身份D的影响,模型形式:,截距不变但斜率发生变化的情形:,3.混合方式:截距和斜率均发生变化,例: 同样研究消费支出Y 、收入X 、居民身份D 间的影响关系。模型形式:,几何意义:,虚拟变量的引入小结:,五、虚拟解释变量特殊应用,所谓特殊应

10、用是指将引入虚拟解释变量 的加法方式、乘法方式进行综合使用。 基本分析方式:仍然是条件期望分析。 本课主要讨论 (1)分段回归分析; (2)交互效应分析; (3)结构变化分析,在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映数量因素的不同阶段。 例如,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。 这时,可以t*=1979年为转折期,以1979年的国民收入Xt*为临界值,设如下虚拟变量:,则进口消费品的回归模型可建立如下:,1.分段回归分析,用OLS法得到该模型的回归方程为:,几何意义:,1979年之前,回归模型的斜率为 ; 1979年之前

11、,回归模型的斜率为 ;,若统计检验表明, 显著不为零,则我国居民的消费行为在1979年前后发生了明显改变。,例: 是否发展油菜籽生产与是否发展养蜂生产的差异对农副产品总收益的影响研究。模型设定为: (1)式中, 以加法形式引入虚拟变量暗含何假设?,2.交互效应分析,上式以加法形式引入,暗含的假设为:菜籽生产和养蜂生产是分别独立地影响农副品生产总收益。但是,在发展油菜籽生产时,同时也发展养蜂生产,所取得的农副产品生产总收益,可能会高于不发展养蜂生产的情况。即在是否发展油菜籽生产与养蜂生产的虚拟变量 和 间,很可能存在着一定的交互作用,且这种交互影响对被解释变量农副产品生产收益会有影响。,(1),

12、为了反映交互效应,将(1)变为: 同时发展油菜籽和 养蜂生产: 发展油菜籽生产: 发展养蜂生产: 基础类型:,基本思想:在模型中引入相关的两个变量的乘积,如何检验交互效应是否存在?,3.结构稳定性分析,模型结构的稳定性是指两个不同时期(或不同空间)研究同一性质的问题时所建立的同一形式的回归模型的参数之间有无显著差异,如果存在着差异,则认为模型结构不稳定。 在现实经济生活中,往往由于某些重要因素的影响,解释变量和被解释变量之间关系可能会发生结构变化; 如我国由于经济体制的变化,改革开放前后国民经济总量指标之间的关系都会发生变化;或者研究我国发达地区和不发达地区投资对经济增长的影响,也会因地区不同

13、而产生结构差异等等。 这一问题可通过引入乘法形式的虚拟变量来解决,例:以Y为储蓄,X为收入,为反映1992年前后储蓄与收入之间的结构关系有无明显变化,可引入虚拟变量进行检验。设根据两个样本估计的回归模型分别为:,1992年前: Yi=1+ 1 Xi+1i i=1,2,n1 1992年后: Yi= 2 +2Xi+2i i=1,2,n2 设置虚拟变量: 将样本1和样本2的数据合并,估计以下模型: 然后利用t检验判断 、 的系数的显著性.,于是有:,则有可能出现下述四种情况中的一种:,(1) 1=2 ,且1 =2 ,即两个回归相同,说明两个回归模型之间没有显著差异,称为重合回归(Coincident

14、 Regressions);模型结构是稳定的 . (2) 1 2,但1 =2 ,说明两个回归模型之间的斜率相同,两个回归模型结构的差异仅在其截距,称为平行回归(Parallel Regressions); (3) 1= 2 ,但1 2 ,说明两个回归模型之间的截距相同,两个回归模型结构的差异仅在其斜率,称为汇合回归(Concurrent Regressions); (4) 12 ,且12 ,即两个回归完全不同,存在着结构差异称为相异回归(Dissimilar Regressions)。,不同截距、斜率的组合图形,结构变化小结,结构变化的实质是检验所设定的模型在样本期内是否为同一模型。显然,平行

15、回归、共点回归、不同的回归三个模型均不是同一模型。 平行回归模型的假定是斜率保持不变(加法类型,包括方差分析); 共点回归模型的假定是截距保持不变(乘法类型,又被称为协方差分析); 不同的回归的模型的假定是截距、斜率均为变动的(加法、乘法类型的组合)。,邹氏结构变化的检验,为了检验两个模型的结构是否相同,可提出原假设:两个回归方程的结构相同,然后看看能否拒绝这个假设,这个检验称为Chow检验. 设两个样本待检验回归模型为: 样本1(n1个) 样本2 (n2个) 邹检验的基本假定: 将n1与n2个观察值合并,并用以估计以下回归:,(1).假设原假设为真 (2).用OLS对这两个方程分别进行估计,可得到各自的残差平方和 和 ,并求和 计算合并后的模型的残差平方和 (3).统计量: (4).查F分布表,得临界值 (5).结论:F 的值,则拒绝回归相同的假设,即拒绝结构稳定性假定;另外,若F的P值低,则拒绝结构稳定性假定.,检验步骤:,1.用虚拟变量只需做一个回归。 2.一个回归可以做各种检验。截距检验和斜率检验都可以一次完成。 3.邹至庄检验没有明确告诉是哪一个系数发生变化,而虚拟变量模型则可以很清楚看出这

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号