虚拟变量回归模型

上传人:206****923 文档编号:53981651 上传时间:2018-09-06 格式:PPT 页数:68 大小:1,015.50KB
返回 下载 相关 举报
虚拟变量回归模型_第1页
第1页 / 共68页
虚拟变量回归模型_第2页
第2页 / 共68页
虚拟变量回归模型_第3页
第3页 / 共68页
虚拟变量回归模型_第4页
第4页 / 共68页
虚拟变量回归模型_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《虚拟变量回归模型》由会员分享,可在线阅读,更多相关《虚拟变量回归模型(68页珍藏版)》请在金锄头文库上搜索。

1、虚拟变量回归模型,第6章,6.1 虚拟变量的性质 6.2 ANCOVA模型:包含一个定量变量、一个两分定性变量的回归 6.3 包含一个定量变量、一多分定性变量的回归 6.4 包含一个定量变量和多个定性变量的回归 6.5 比较两个回归 6.6 虚拟变量在季节分析中的应用,本章主要内容,6.1 虚拟变量的性质,虚拟变量的基本含义,许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等 但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“

2、量化”,6.1 虚拟变量的性质,这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D。,例如,反映文程度的虚拟变量可取为:,一般地,在虚拟变量的设置中:基础类型取值为0(不具备某种性质);比较类型取值为1(具备某种性质)。,6.1 虚拟变量的性质,虚拟变量模型的类型,根据加入的途径,可以将虚拟变量模型分成两种类型: 加法类型:用虚拟变量表示不同截距的回归,即虚拟变量只可以改变回归方程的截距,是加法类型。 乘法类型:用虚拟变量表示不同斜率的回归,即虚拟变量影响到回归方程的斜率变化,是乘

3、法类型。,6.1 虚拟变量的性质:用虚拟变量表示不同截距的回归-加法类型,方差分析模型(analysis-of-variance models,ANOVA)差别截距系数(differential intercept coefficient),6.1 虚拟变量的性质:用虚拟变量表示不同截距的回归-加法类型,概念:,回归模型只含有定性变量或虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。,6.1 虚拟变量的性质:用虚拟变量表示不同截距的回归-加法类型,一个以性别为虚拟变量考察个体消费者每年的食品支出的模型:(6-1),其中:Yi为每年食品支

4、出(美元),Di=1,若是女性,Di=0,若是男性。,以加法方式引入虚拟变量时,分为四种情形: 情形一:解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量的方差分析模型(见6.1节),6.1 虚拟变量的性质:用虚拟变量表示不同截距的回归-加法类型,男性食品支出的期望:,女性食品支出的期望:,称为差别截距系数(differential intercept coefficient), 它表示了两类截距值的差异。,6.1 虚拟变量的性质:用虚拟变量表示不同截距的回归-加法类型,6.1 虚拟变量的性质:用虚拟变量表示不同截距的回归-加法类型,表 6-2 食品支出与税后收入和性别的关系,6.1

5、虚拟变量的性质:用虚拟变量表示不同截距的回归-加法类型,例 6-1食品支出与性别虚拟变量回归结果(男性为基准类),其中:Yi为每年食品支出 (美元), Di=1,若是女性,Di=0,若是男性。,6.1 虚拟变量的性质:用虚拟变量表示不同截距的回归-加法类型,例 6-1食品支出与性别虚拟变量回归结果(女性为基准类),其中:Yi为每年食品支出 (美元),Di=1,若是男性,Di=0,若是女性。,虚拟变量的设置原则,6.1 虚拟变量的性质:用虚拟变量表示不同截距的回归-加法类型,(1)虚拟变量的赋值是任意的。在这个例子中,令D=0,代表女性;D=1,代表女性;当然,赋值可根据习惯而定。 (2)赋值为

6、0的一类常称为基准类(base),对比类(bench mark),控制类(control)或者遗漏类(omitted category)等等。因此,在模型中男性就是基准类。 (3)虚拟变量D的系数称为差别截距系数(differential intercept coefficient),因为它表明了取值为1类的截距值与基准类截距值的差距。,虚拟变量的设置原则,6.1 虚拟变量的性质:用虚拟变量表示不同截距的回归-加法类型,(4)虚拟变量的个数须按以下原则确定:每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果有m个定性变量,只在模型中引入m-1个虚拟变量。在这个例子中,性别有两类,

7、因而在模型中仅引进一个虚拟变量。如果不遵循这个规则,就会陷入虚拟变量陷阱(dummy variable trap),也即完全多重共线性(perfect multicollinerarity)情形。,虚拟变量的设置原则,回归模型中既包括定量解释变量,又包括定性解释变量,我们把这种回归模型称为协方差分析模型( ANCOVA )。ANCOVA模型能够反映定量解释变量(称为控制变量或协变量)的控制效果。,6.2 ANCOVA模型: 包含一个定量变量,一个两分定性变量的回归模型,以加法方式引入虚拟变量时,分为四种情形: 情形二: ANCOVA模型:包含一个定量变量,一个两分定性变量的回归模型(6.2节

8、),6.2 ANCOVA模型: 包含一个定量变量,一个两分定性变量的回归模型,6.2 ANCOVA模型: 包含一个定量变量,一个两分定性变量的回归模型,考虑例6-1,把可支配收入这个协变量作为解释变量纳入模型:,Y:食品支出(美元) X:税后收入(美元),假定E( )=0,则: 男性平均消费支出:女性平均消费支出:,的解释:,6.2 ANCOVA模型: 包含一个定量变量,一个两分定性变量的回归模型,其中:Yi为每年食品支出 (美元),Di=1,若是女性,Di=0,若是男性。Xi为税后收入,6.2 ANCOVA模型: 包含一个定量变量,一个两分定性变量的回归模型,根据此回归分析,可以推导出两组回

9、归结果:,女性平均消费支出:,男性平均消费支出:,6.2 ANCOVA模型: 包含一个定量变量,一个两分定性变量的回归模型,图6-2 税后食品支出,两条回归线只是截距不同,但斜率相同。问题是:如果考虑性别的影响,男女的边际食品消费倾向之间有差异吗?(6.5),6.2 ANCOVA模型: 包含一个定量变量,一个两分定性变量的回归模型,6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型,以加法方式引入虚拟变量时,分为四种情形: 情形三:包含一个定量变量,一个多分定性变量的回归模型(6.3),6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型美国大学研究生接受

10、率与地区关系,6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型美国大学研究生接受率与地区关系,6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型美国大学研究生接受率与地区关系,6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型美国大学研究生接受率与地区关系,假定想研究美国65所大学的研究生接受率地区之间有显著差异吗? 做回归分析,学校分为三个地区(D) : 南部; 东北和中北部; 西部。建立模型:Y:研究生接受率,例6.3 假设一例(美国大学研究生接受率与地区关系),6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归

11、模型美国大学研究生接受率与地区关系,东北和中北部地区,其他,西部地区,其他,南部作为基准类,6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型美国大学研究生接受率与地区关系,东北部和中北部地区的平均接受率:西部地区的平均接受率:南部地区的平均接受率:,6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型美国大学研究生接受率与地区、学费关系,6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型:美国大学研究生接受率与地区、学费关系,6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型:美国大学研究生接受率与地区、学费关系,

12、6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型美国大学研究生接受率与地区关系,6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型:美国大学研究生接受率与地区、学费关系,6.3 ANCOVA模型:包含一个定量变量,一个多分定性变量的回归模型:美国大学研究生接受率与地区、学费关系,6.4 包含一个定量变量和多个定性变量的回归,以加法方式引入虚拟变量时,分为四种情形: 情形四:解释变量包含一个定量变量和多个定性变量的回归(6.4),6.4 包含一个定量变量和多个定性变量的回归,案例分析: 小时工资(美元)一例,假定除教育(受教育年限),性别和肤色也是重要的

13、决定因素,现假定肤色有两种,白色和非白色,模型可写为:,6.4包含一个定量变量和多个定性变量的回归,Y:小时工资(美元) X:受教育年限,非白种和非西班牙裔人,基准类:白种和/或西班牙裔男性,白种和/或西班牙裔,6.4包含一个定量变量和多个定性变量的回归,根据上述模型,得到不同的平均小时工资函数: 非白种/非西班牙裔女性平均小时工资:非白种/非西班牙裔男性平均小时工资:白种和/西班牙裔女性平均小时工资:白种和/西班牙裔男性平均小时工资:,6.4 包含一个定量变量和多个定性变量的回归,利用528个个体数据,得到的回归结果如下:,模型中隐含了两个方面的假定。从而引出虚拟变量进入模型的第二种方式:乘

14、法类型,6.4 包含一个定量变量和多个定性变量的回归,6.4.2模型的一般化: 多个定量变量和多个定性变量,例6-3模型的一般化: 政党对竞选活动的资助,6.4 包含一个定量变量和多个定性变量的回归,6.5 用虚拟变量表示不同斜率的回归-乘法类型,以乘法形式引入虚拟解释变量,是在设定的计量经济模型中,将虚拟解释变量与其他解释变量相乘作为解释变量,以表示模型中斜率系数的差异。 以乘法形式引入虚拟解释变量的主要作用是:第一:分析因素间的交互影响(见6.4.1交互效应;见教材6.5比较两个回归); 第二:分段线性回归,提高模型对现实经济现象的描述精度(见例 6-4)。,6.5 用虚拟变量表示不同斜率

15、的回归-乘法类型:分析因素间的交互影响,交互效应 交互作用虚拟变量(interaction dummy),第一:分析因素间的交互影响(见6.4.1交互效应),6.4.1交互影响,交互作用虚拟变量,非白种/非西班牙裔女性的平均小时工资函数,6.5 用虚拟变量表示不同斜率的回归-乘法类型:分析因素间的交互影响,6.5 用虚拟变量表示不同斜率的回归-乘法类型:分析因素间的交互影响,6.4.1交互影响,其中:Yi为每年食品支出 (美元), Di=1,若是女性, Di=0,若是男性。 Xi为税后收入,根据此回归结果,可以推导出两组回归结果:,女性平均消费支出:,男性平均消费支出:,第一:分析因素间的交互

16、影响-比较两个回归模型(回顾一下例6-1男女食品平均消费支出),6.5 用虚拟变量表示不同斜率的回归-乘法类型:分析因素间的交互影响,两条回归线只是截距不同,但斜率相同。问题是:如果考虑性别的影响,男女的边际食品消费倾向之间有差异吗?,图6-2 税后食品支出,6.5 用虚拟变量表示不同斜率的回归-乘法类型:分析因素间的交互影响,为回答上面这个问题,我们对食品支出与税后收入、性别的关系考虑下面的模型:,Y每年食品支出 X个人可支配收入(税后收入),女性,男性,6.5 用虚拟变量表示不同斜率的回归-乘法类型:分析因素间的交互影响,假定E( )=0,则: 男性平均消费支出:女性平均消费支出:,的解释:,是差别截距,,是差别斜率,6.5 用虚拟变量表示不同斜率的回归-乘法类型:分析因素间的交互影响,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号