计量经济学第八章-虚拟变量回归课件

上传人:F****n 文档编号:88471173 上传时间:2019-04-28 格式:PPT 页数:39 大小:334.50KB
返回 下载 相关 举报
计量经济学第八章-虚拟变量回归课件_第1页
第1页 / 共39页
计量经济学第八章-虚拟变量回归课件_第2页
第2页 / 共39页
计量经济学第八章-虚拟变量回归课件_第3页
第3页 / 共39页
计量经济学第八章-虚拟变量回归课件_第4页
第4页 / 共39页
计量经济学第八章-虚拟变量回归课件_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《计量经济学第八章-虚拟变量回归课件》由会员分享,可在线阅读,更多相关《计量经济学第八章-虚拟变量回归课件(39页珍藏版)》请在金锄头文库上搜索。

1、第八章 虚拟变量回归,引子: 1、男女大学生的消费真有差异吗? 对在校生的消费行为进行调查,发现在校生的消费行为呈现多元化的结构。人际交往消费、手机类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。为了了解男、女生在消费支出结构上的差异,应当如何建立模型?,面临的问题:如何把性别(男、女生)这样的非数量变量引入方程?,问题的一般性描述,前面讨论的回归模型中,所遇的变量均为定量变量(可直接测度、数值性)。 例如:GDP,工资,收入、受教育年数,销售额等. 在实际建模时,一些定性变量具有不可忽视的重要影响。 例如:研究某个企业的销售水平,产

2、业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。 面临的问题:在同时考虑定量和定性因素的条件下,依据现有的回归分析知识,如何对非定量因素进行回归分析?,一、基本概念 1、定量因素、定性因素 定量因素:可直接测度、数值性的因素。 定性(属性)因素:表示某种属性存在与否的非数值性因素. 2、虚拟变量的定义 虚拟变量:取值为0、1的人工(特殊)变量 。 注:虚拟变量的同位语有:哑元变量、定性变量等等。通常用字母 D 或DUM加以表示(英文中虚拟或者哑元Dummy的缩写)。,第一节 虚

3、拟变量,问题:直接在回归模型中加入定性因素存在诸多的困难,能否采用“虚拟变量”对定性变量进行量化,以达到定性因素能与定量因素有着相同作用之目的?,虚拟变量的设置规则是在回答“如何”问题。其规则涉及到以下的三个方面: 1、“0”和“1”的选取原则; 2、属性(状态、水平)因素与设置虚拟变量数量的关系; 3、虚拟变量在回归分析中的角色及作用等方面的问题. 具体说明如下:,二、虚拟变量的设置规则(原则),1、虚拟变量的“0”和“1”选取原则 取“0”或“1”应从分析问题的目的出发予以界定。 “0”代表基期(比较的基础,参照物) “1”代表报告期(被比较的效应)。 例如,比较收入时欲考察性别(定性变量

4、)的作用(差异). 当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故设男性为“1”,女性为“0”。,定性因素的属性既可能为两种状态,也可能为多种状态。 例如,性别(男、女两种)、季节(4种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。,2、属性因素(状态、水平)与虚拟变量数量的关系,定性因素D如何选取?其设置规则为:,1)定性因素有m (m=2,3,4,)个相互排斥类型(或特征、水平) ,当回归模型有截距项时,模型中只能引入( m-1)个虚拟变量,否则会陷入“虚拟变量陷阱”(产生完全共线)。(为什么?),2)回归模型无截距项时,则引入m个虚拟变量。,注:“

5、虚拟变量陷阱”的实质:完全多重共线性。,例(一个陷入“虚拟变量陷阱”实例)研究居民住房消费支出Yi 、居民可支配收入Xi之间的数量关系,回归模型设定为:,现在要考虑城镇居民和农村居民之间的差异,如何办?,为了对 “城镇居民”、“农村居民”进行区分,分析各自在住房消费支出 Yi 上的差异,设,只设定一个虚拟变量原因:模型有截距,“居民属性”定性变量只有两个相互排斥的属性状态(m=2),故只设定一个虚拟变量。,则模型为,若在量化只有两个相互排斥属性的“居民属性”定性变量时,引入 m=2 个虚拟变量。,模型为,任一家庭都有:D1+D2=1,即 D1+D2-1=0(完全共线),就 陷入了“虚拟变量陷阱

6、”,产生完全共线。,城镇,农村,第二节 虚拟解释变量的回归,在计量经济学中,通常引入虚拟变量的方式分为:加法方式和乘法方式两种:即,实质: 加法方式引入虚拟变量改变的是截距; 乘法方式引入虚拟变量改变的是斜率。,虚拟变量模型:含有虚拟变量的模型称为虚拟变量模型。,以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属 性和引入虚拟变量的个数。 分为四种情形讨论: (1)解释变量只有一个定性变量而无定量变量,而且定性变量 为两种相互排斥的属性; (2)解释变量分别为一个定性变量(两种属性)和一个定量解 释变量; (3)解释变量分别为一个定性变量(两种以上属性)和一个定 量解释变量; (4)解释变

7、量分别为两个定性变量(各自分别是两种属性)和 一个定量解释变量。,一、加法类型,1、一个两种属性定性解释变量而无定量变量的情形,2、一个定性解释变量(两种属性)和一个定量解释变量的情形,X,Y,共同的特征:截距发生改变,3、一个定性解释变量(两种以上属性)和一个定量解释变量的情形,4、两个定性解释变量(均为两种属性)和一个定量解释变量的情形,X,Y,D1=0,D2=0,D1=1,D2=0,D1=1,D2=0,D1=1,D2=1,加法方式引入虚拟变量的一般表达式:,基本分析方法: 条件期望。,运用OLS得到回归结果,再用t-检验讨论因素是否对模型有影响.,基本思想: 以乘法方式引入虚拟变量时,是

8、在所设立的模型 中,将虚拟解释变量与其它解释变量(Xi 或为Di)的乘积,作为新 的解释变量出现在模型中,以达到其调整设定模型斜率系数的目 的(以下仅讨论虚拟解释变量Di与Xi乘积作为新变量的情况)。,二、乘法类型 目的:调整设定模型的斜率系数。,乘法引入方式可分为两种情形讨论 (1)截距不变; (2)截距和斜率均发生变化; 分析手段:仍然是条件期望。,(1)截距不变的情形,模型形式:,例:研究消费支出Y 受到收入X、年份状况D 的影响。,(2)截距和斜率均发生变化,模型形式:,例:研究消费支出Y 、收入X、年份状况D 间的影响关系。,比较:发生了那些变化?,例:改革开放前、后(平均)“储蓄收

9、入”模型:,加法方式引入D:为了区别改革开放前、后储蓄起点的情况(即两 模型的截距变化),乘法方式引入D:为了区别改革开放前、后“储蓄“关于”收入”的相对变化情况(即两模型的斜率系数变化),三、虚拟解释变量综合应用,所谓综合应用是指将引入虚拟解释变量的加法方式、 乘法方式进行综合使用。 可以讨论: 结构变化分析( 关于两个回归模型的比较); 因素间的交互效应分析; 分段回归分析,以下仅对结构变化分析、分段回归分析进行讨论:,1、结构变化分析(回归模型的比较),通过对模型的参数检验,可以检验模型是否有不同的结构。即 定性变量D的引入,是否影响不同类型(属性)模型的 1)平均水平(截距项)? 2)

10、相对变化(斜率系数)? 3)平均水平(截距项)和相对变化(斜率系数)?,其中: Yi为第 i 个家庭的消费水平; Xi为第 i 个家庭的收入水平。,则D=1: 则D=0:,例如:城镇居民家庭与农村居民家庭的消费函数不仅在截距上 有差异,边际消费倾向可能也会有所不同。模型可以记为,1)城镇、农村居民家庭的消费行为完全一样(截距和斜率系数相等) 2)城镇、农村居民家庭的消费函数是截距变动模型(截距不相等) 3)城镇、农村居民家庭的消费函数是斜率变动模型(斜率系数不相等) 4)城镇、农村居民家庭的消费函数是截距和斜率变动模型(截距、斜率不等),通过对上述两个模型的截距、斜率系数检验(比较),可以判断

11、我们讨论的模型属于以下何种类型:,一般:,分别回归,有以下四种情况:,不同截距、斜率的组合图形,重合回归:截距斜率均相同,平行回归:截距不同斜率相同,共点回归:截距相同斜率不同,交叉(不同)回归:截距斜率均不同,3、分段回归分析(提高模型的描述精度) 虚拟变量也可以用来代表数量因素的不同阶段。分段线性回归就是类似情形中常见的一种。,例: 设Y表示奖金、X表示销售额。当销售额低于X*时,奖金与 销售额呈某种线性关系;当销售额高于X*时,奖金与销售额呈更加 陡峭的线性关系。如图:,.,X* X,Y,例1:中国城镇居民家庭的储蓄函数,根据我国城镇居民家庭19551985年人均收入 和人均储蓄 的数据

12、资料(以1955年的物价水平为100),建立储蓄模型:,第四节 案例分析,用最小二乘法得估计结果为:,模型隐含着一个重要假定,我国城镇居民家庭的储蓄行为在1955年至1985年期间是不变的。 假定未必能够成立,因为与居民储蓄有关的许多重要因素在1979年以后发生了明显变化,主要表现为:,1)在经济体制改革之前,我国居民的收入一直在低水平上徘徊,大多数居民家庭的收入仅能维持温饱,因而平均储蓄倾向很低,积蓄很少; 1979年后,我国居民的收入水平迅速提高,与此同时,居民储蓄也在大幅增长(由此看来前、后两时期,居民的储蓄行为有显著差异);,2)在改革开放前的大多数年份,我国的消费品市场存在严重短缺的

13、现象。消费者既使有钱也难以买到所需的商品,而不得不把钱暂时存起来。因此,这一时期储蓄带有“非自愿”的性质; 1979年之后,消费品市场日趋丰富,消费者储蓄的主要目的之一是购买高档耐用消费品,储蓄不再具有“被迫”性质。,为了验证改革开放前、后城镇居民储蓄行为的变化,引入,建立如下截距和斜率同时变动模型:,用最小二乘法得:,t =(2.18) (8.1) (3.9) (-9.2),1979年以后:,而在19791985年期间,城镇居民边际储蓄倾向高达0.256,即收入增加一元,储蓄平均增加0.256元。,1979年以前:,估计结果表明:1979年之前,我国城镇居民的边际储蓄倾向仅为0.004,即收

14、入增加一元储蓄平均增加4厘;,一、虚拟变量:取值为0、1的人工(特殊)变量(记为D),二、虚拟变量的设置原则,1、定性因素有m个相互排斥的类型或特征,有截距、无截距的模型中分别只能引入 m-1个、 m个虚拟变量,否则会陷入“虚拟变量陷阱”(产生完全共线);,小 结,2、虚拟变量取“0”或“1”应从分析问题的目的出发予以界定 (多以“0”代表基础类);,3、虚拟变量在单一方程中,可以作为解释变量,也可以作为被解释变量。,三、加入虚拟变量的两种基本途径:加法类型、乘法类型。 1、加法类型 其作用:设定模型的截距水平变动 2、乘法类型 其作用:设定模型的斜率变动 特别(加法、乘法):设定模型的截距、斜率同时变动,四、乘法类型引入虚拟变量的主要作用:,1、关于两个回归模型的比较(结构变化); 2、因素间的交互效应影响的分析; 3、提高模型对现实经济现象的描述精度(分段回归分析)。,THANKS,第 八 章 结 束 了!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号