第五章虚拟变量模型课件

上传人:鲁** 文档编号:567310761 上传时间:2024-07-19 格式:PPT 页数:79 大小:618.50KB
返回 下载 相关 举报
第五章虚拟变量模型课件_第1页
第1页 / 共79页
第五章虚拟变量模型课件_第2页
第2页 / 共79页
第五章虚拟变量模型课件_第3页
第3页 / 共79页
第五章虚拟变量模型课件_第4页
第4页 / 共79页
第五章虚拟变量模型课件_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《第五章虚拟变量模型课件》由会员分享,可在线阅读,更多相关《第五章虚拟变量模型课件(79页珍藏版)》请在金锄头文库上搜索。

1、第第2节节 虚拟解释变量模型虚拟解释变量模型一一 、截距变动模型和斜率变动模型、截距变动模型和斜率变动模型 (一)包含一个虚拟变量的截距变动模型(一)包含一个虚拟变量的截距变动模型 假设只有一个定性因素影响被解释变量假设只有一个定性因素影响被解释变量的变化,而且这个因素仅有两种特征,这时的变化,而且这个因素仅有两种特征,这时候只需要引入一个虚拟变量。候只需要引入一个虚拟变量。 2 例例5.1描述了一个包括正常年份和非正常描述了一个包括正常年份和非正常年份(亚洲金融危机或年份(亚洲金融危机或SARS的影响)居的影响)居民消费的样本,并建立了虚拟变量计量模民消费的样本,并建立了虚拟变量计量模型。型

2、。3 对对 1 1 作作t t 检验,若检验,若 1 显著地不为显著地不为0,我们就认为正常年份和非正常年份居民,我们就认为正常年份和非正常年份居民在消费行为上的差异是明显的。若在消费行为上的差异是明显的。若 1 0,则正常年份的居民消费水平高于非正常年则正常年份的居民消费水平高于非正常年份的居民消费水平。份的居民消费水平。 利用最小二乘法对利用最小二乘法对式(式(5.1)进行估计,可得到进行估计,可得到(5.6)4 (二)斜率变动模型(二)斜率变动模型 在实际问题中,斜率单独变动出现的情在实际问题中,斜率单独变动出现的情形一般比较少,它指的是改变了变动的速形一般比较少,它指的是改变了变动的速

3、率也就是弹性。率也就是弹性。 例如城镇居民家庭与农村例如城镇居民家庭与农村居民家庭的消费函数,居民家庭的消费函数, 在边际消费倾向在边际消费倾向(斜率)上可能会有所不同,假设它们的(斜率)上可能会有所不同,假设它们的消费函数在截距项没有区别。消费函数在截距项没有区别。5那么回归模型可记为那么回归模型可记为(5.7) 其中,其中,Yi= =第个家庭的消费水平,第个家庭的消费水平,Xi= =第个家庭的收入水平,第个家庭的收入水平, 6式(式(5.7)可以表示为)可以表示为(5.8)(5.9)7 (三)包含多个虚拟变量的截距变动模型(三)包含多个虚拟变量的截距变动模型 如果一个质的因素仅有两种特征,

4、如果一个质的因素仅有两种特征,只需引入一个虚拟变量。但是,很多质的因只需引入一个虚拟变量。但是,很多质的因素往往不只具有两个特征,例如全世界的国素往往不只具有两个特征,例如全世界的国家可以分为发达国家、发展中国家、不发达家可以分为发达国家、发展中国家、不发达国家国家。8 我国少数民族在很多问题上有差我国少数民族在很多问题上有差异,所以当把民族作为虚拟变量时,异,所以当把民族作为虚拟变量时,不能简单将其分为汉族和非汉族;季不能简单将其分为汉族和非汉族;季节因素是我们最常见的质的因素,它节因素是我们最常见的质的因素,它具有四个特征,按照前面的原则,我具有四个特征,按照前面的原则,我们要引入三个虚拟

5、变量。们要引入三个虚拟变量。9 例如,我们用季度资料研究各种商品消例如,我们用季度资料研究各种商品消费额在季节上有没有什么区别?可以建立费额在季节上有没有什么区别?可以建立模型如下:模型如下:(5.10) 其中,其中,其中,其中,YYtt= = =季度的消费,季度的消费,季度的消费,季度的消费,XXtt= = =季度的收入,季度的收入,季度的收入,季度的收入,对于四个季度,我们引入了三个虚拟变量:对于四个季度,我们引入了三个虚拟变量:对于四个季度,我们引入了三个虚拟变量:对于四个季度,我们引入了三个虚拟变量:10这里,第四季度为基础类型,其截距项这里,第四季度为基础类型,其截距项为为0 。而其

6、它三个季度的截距项分别为。而其它三个季度的截距项分别为 0+ 1,0+ 2 ,0+ 3 。1,2 , , 3 代表代表季节变动引起的消费差异。季节变动引起的消费差异。11四个季度的回归模型分别为四个季度的回归模型分别为(5.11)(5.12)(5.13)(5.14)12 (四)截距和斜率同时变动模型(四)截距和斜率同时变动模型(四)截距和斜率同时变动模型(四)截距和斜率同时变动模型 在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回归模型的截距有影响,而且还会改变归模型的截距有影响,而且还会改变归模型的截距有影响,而且还会改

7、变归模型的截距有影响,而且还会改变模型的斜率。模型的斜率。模型的斜率。模型的斜率。13 例如城镇居民和农村居民的消费例如城镇居民和农村居民的消费函数不但在斜率上有差异,在截距上函数不但在斜率上有差异,在截距上也是有可能不一致的,将两个问题同也是有可能不一致的,将两个问题同时考虑进来,我们可以得到回归方程时考虑进来,我们可以得到回归方程 14(5.15) 式中,式中,Yi= =第个家庭的消费水平,第个家庭的消费水平,Xi= =第个第个家庭的收入水平家庭的收入水平,15 1和和 3 分别表示城镇居民家庭和农村居民分别表示城镇居民家庭和农村居民家庭的消费函数在截距和斜率上的差异。家庭的消费函数在截距

8、和斜率上的差异。式(式(5.15)可以表示为)可以表示为(5.165.16)(5.175.17)16 我们一般通过我们一般通过t t 检验来判定它们之间是否检验来判定它们之间是否有差异。有差异。 1.1.若若10 0 ,30 0,则为截距和斜率同时,则为截距和斜率同时变动模型;变动模型; 2.2.若若 10,0,3=0=0,则为截距变动模型;,则为截距变动模型; 3.3.若若 1=0=0,3=0, =0, 则表示城镇居民家庭和则表示城镇居民家庭和农村居农村居 民家庭有着完全相同的消费模式;民家庭有着完全相同的消费模式; 4.4.若若 1=0=0,30,0,则为斜率变动模型,这则为斜率变动模型,

9、这种情况在现实中出现得不是很多。种情况在现实中出现得不是很多。17 下面,以我国下面,以我国城镇居民家庭储蓄模型城镇居民家庭储蓄模型为为例,实际体会虚拟变量模型从建模到检验例,实际体会虚拟变量模型从建模到检验再到估计参数最后下结论的全过程。再到估计参数最后下结论的全过程。 【例例5.2】已有数据资料为我国城镇居民家已有数据资料为我国城镇居民家庭庭1955年至年至1985年人均收入和人均储蓄。年人均收入和人均储蓄。根据经验,也就是先验信息,再通过某些根据经验,也就是先验信息,再通过某些检验,我们发现储蓄和收入有很强的相关检验,我们发现储蓄和收入有很强的相关关系而且收入的变化会引起储蓄的变化。关系

10、而且收入的变化会引起储蓄的变化。18 假定它们之间为线性关系,我们可以建假定它们之间为线性关系,我们可以建立储蓄模型如下立储蓄模型如下 式中,式中,St= =人均储蓄,人均储蓄,Xt= =人均收入,人均收入,t= =年份(年份(t=1955=1955,19561956,19851985)。)。 (5.18)19 把把19551955年作为基期并把该期的价格水平年作为基期并把该期的价格水平定为定为100,再分别扣除包含在和中的物价,再分别扣除包含在和中的物价上涨因素。用最小二乘法估计上涨因素。用最小二乘法估计式(式(5.18),),得到得到 R2 =0.833=0.833, DW=0.398=0

11、.398 (5.19)20 模型(模型(5.19)包含了这样一个假定,那包含了这样一个假定,那就是在就是在1955到到1985年期间我国城镇居民家年期间我国城镇居民家庭的储蓄行为大体保持不变。庭的储蓄行为大体保持不变。21 这一假定实际上是行不通的,因为在这一假定实际上是行不通的,因为在十一届三中全会召开之后,居民的收入十一届三中全会召开之后,居民的收入大大增加,而且与居民储蓄有关的许多大大增加,而且与居民储蓄有关的许多重要因素在重要因素在1979年以后发生了明显变化。年以后发生了明显变化。在改革开放之前,在改革开放之前, 我国居民的收入水平我国居民的收入水平仅仅能够维持温饱水平,根本不可能有

12、仅仅能够维持温饱水平,根本不可能有多少储蓄。多少储蓄。22 1979年以后,我国居年以后,我国居民的收入水平大民的收入水平大幅度提高,同时,居民储蓄也在大幅幅度提高,同时,居民储蓄也在大幅度增长。从这些可以看出来,度增长。从这些可以看出来,1979年年前后两个时期,我国居民的边际储蓄前后两个时期,我国居民的边际储蓄倾向有显著性差异。倾向有显著性差异。23 在改革开放前的大多数年份在改革开放前的大多数年份, 我国我国的消费市场常常是供不应求的消费市场常常是供不应求, 许多商品许多商品要国家下达计划指标要国家下达计划指标, 居民凭票证购买居民凭票证购买, 经常出现的问题是顾客即使有钱也难经常出现的

13、问题是顾客即使有钱也难买到需要的商品买到需要的商品, 就不得不把钱存起来。就不得不把钱存起来。这时候的储蓄就带有非自愿的性质。这时候的储蓄就带有非自愿的性质。24而在而在19791979年以后年以后, , 物资逐渐丰富物资逐渐丰富, , 商商品的买卖也取消了票证的限制品的买卖也取消了票证的限制, , 消费消费者储蓄的主要目的之一是购买高档耐者储蓄的主要目的之一是购买高档耐用消费品,储蓄不再具有用消费品,储蓄不再具有“被迫被迫”的的性质。性质。25 为了验证城镇居民的储蓄行为是否为了验证城镇居民的储蓄行为是否有显著变化有显著变化, 可以建立下面的截距和斜可以建立下面的截距和斜率同时变动模型。率同

14、时变动模型。(5.205.20)式中式中, , St和和Xt仍代表人均储蓄和人均收入仍代表人均储蓄和人均收入, , D D为虚拟变量,为虚拟变量,26用最小二乘法估计用最小二乘法估计式式(5.20), 可以得到可以得到(5.215.21)27 其中其中, 参数估计值下面括号中的数字参数估计值下面括号中的数字为统计值。显然为统计值。显然, 在在1979年前后储蓄年前后储蓄模型的截距和斜率有明显差异。式模型的截距和斜率有明显差异。式(5.21)可以写为两个方程可以写为两个方程(5.225.22)(5.235.23)28 由以上模型可知,我国城镇居民的边由以上模型可知,我国城镇居民的边际储蓄倾向在际

15、储蓄倾向在1979年以前仅为年以前仅为0.004, 也也就是收入增加就是收入增加1元元, 储蓄平均增加储蓄平均增加4厘厘; 而从而从1979年到年到1985年这段时间年这段时间, 城镇居城镇居民的边际储蓄倾向增至民的边际储蓄倾向增至0.256。29 然而然而, 在在式式(5.19)中得到的边际储蓄中得到的边际储蓄倾向却是倾向却是0.17。很明显。很明显, 式式(5.19)既既不代表改革开放之前城镇居民的消费不代表改革开放之前城镇居民的消费行为行为, 也不能正确描述也不能正确描述1979年以后城年以后城镇居民储蓄与收入之间的关系。镇居民储蓄与收入之间的关系。 30我我们们单单从从模模型型的的拟拟

16、合合也也可可以以看看出出引引进进虚虚拟拟变变量量可可以以改改善善估估计计效效果果。式式(5.19)中中的的 随随 机机 误误 差差 项项 存存 在在 正正 自自 相相 关关(DW=0.398), 拟拟合合优优度度效效果果也也不不太太好好( (R2=0.833)。引引入入虚虚拟拟变变量量后后的的模模型型消消除除了了自自相相关关(DW=1.67), 判判定定系系数数也也上上升升到到0.967。所所以以, 虚虚拟拟变变量量的的引引入入很有必要。很有必要。31 二、多个质的因素的虚拟变量模型二、多个质的因素的虚拟变量模型 我们讨论的回归模型只包括一个我们讨论的回归模型只包括一个质的因素,但是在很多情形

17、下质的因素,但是在很多情形下, ,往往有两往往有两个以上的质的因素影响回归模型的被解个以上的质的因素影响回归模型的被解释变量。例如释变量。例如, , 在考察居民的食品消费在考察居民的食品消费行为时行为时, , 可以考虑的质的因素有居民的可以考虑的质的因素有居民的性别、民族、受教育程度、地理区域等性别、民族、受教育程度、地理区域等等。等。32 再如再如, 除收入水平外除收入水平外, 冰琪凌消费量还冰琪凌消费量还会受到季节和地区等质的因素影响。这会受到季节和地区等质的因素影响。这些质的因素可能不仅仅改变模型的截距些质的因素可能不仅仅改变模型的截距和斜率和斜率, 质的因素之间也往往有相互影质的因素之

18、间也往往有相互影响。例如响。例如, 高收入水平和低收入水平的高收入水平和低收入水平的居民在家电消费量上的差异会随着季节居民在家电消费量上的差异会随着季节不同而改变的。不同而改变的。 为了方便为了方便, 我们建立以下简单的食品消我们建立以下简单的食品消费模型费模型 。33(5.245.24)34 式式(5.24)中中, Ct和和At分别表示居民的食分别表示居民的食品消费和居民的收入品消费和居民的收入, D1 , D2 , D3 , D4 , D5是虚拟变量,分别表示性别因是虚拟变量,分别表示性别因素、年龄因素和学历因素。素、年龄因素和学历因素。性别因素只性别因素只有两个特征男和女,设一个虚拟变量

19、有两个特征男和女,设一个虚拟变量D1 。35 年龄分为三个层次,年龄分为三个层次,25岁以下、岁以下、25到到50岁和岁和50岁以上,设二个虚拟变量岁以上,设二个虚拟变量D2和和D3 。受教育程度分为三个层次。受教育程度分为三个层次,初初中以下、高中和高中以上中以下、高中和高中以上,设二个虚拟设二个虚拟变量变量D4 和和D5 。模型中还有虚拟变量之。模型中还有虚拟变量之间的乘积,考虑了截距项的各种变化间的乘积,考虑了截距项的各种变化可能。可能。 36DDii取值不同,截距不同,如:取值不同,截距不同,如:取值不同,截距不同,如:取值不同,截距不同,如:其余的依次类推。其余的依次类推。 6 和和

20、 7 为性别和年龄为性别和年龄层次的相互影响系数。采用通常的统计检层次的相互影响系数。采用通常的统计检验方法对各种可能的情况进行检验。验方法对各种可能的情况进行检验。37 例如,如果例如,如果 1 1 在统计上显著在统计上显著说明性别说明性别这个质的因素会明显影响食品的消费这个质的因素会明显影响食品的消费量。同时,量。同时, 2 2 在统计上显著,就表明在统计上显著,就表明25岁以下居民在食品消费上和别的层岁以下居民在食品消费上和别的层次的居民是有显著差异的,那么年龄次的居民是有显著差异的,那么年龄也会是个很重要的影响因素。也会是个很重要的影响因素。38上上上上述述述述假假假假定定定定虚虚虚虚

21、拟拟拟拟变变变变量量量量仅仅仅仅仅仅仅仅影影影影响响响响回回回回归归归归模模模模型型型型的的的的截截截截距距距距,由由由由此此此此可可可可以以以以推推推推广广广广到到到到更更更更一一一一般般般般的的的的情情情情形形形形,也也也也就就就就是是是是虚虚虚虚拟拟拟拟变变变变量量量量同同同同时时时时改改改改变变变变回回回回归归归归模模模模型型型型的的的的截截截截距距距距和和和和斜斜斜斜率率率率,那那那那样样样样考考考考虑虑虑虑得得得得更更更更周周周周全全全全,但但但但是是是是也也也也会更复杂,在这里我们不作讨论。会更复杂,在这里我们不作讨论。会更复杂,在这里我们不作讨论。会更复杂,在这里我们不作讨论。

22、39第三节第三节第三节第三节 变参数模型和分段回归变参数模型和分段回归变参数模型和分段回归变参数模型和分段回归一、变参数模型一、变参数模型 从上一节的讨论可知,由于引入了虚从上一节的讨论可知,由于引入了虚拟变量,回归模型的截距或斜率不再是拟变量,回归模型的截距或斜率不再是固定不变的。但是模型中参数的变化是固定不变的。但是模型中参数的变化是离散的,而不是连续的。离散的,而不是连续的。40 例如,在例如,在式(式(5.20)中,只是假定在中,只是假定在1979年以前和年以前和1979年以后两个时期城镇年以后两个时期城镇居民有不同的消费行为,也就是说,回居民有不同的消费行为,也就是说,回归模型的截距

23、和斜率并不是每年都发生归模型的截距和斜率并不是每年都发生变化。变参数模型是虚拟变量模型的推变化。变参数模型是虚拟变量模型的推广,它认为回归模型的截距或斜率会随广,它认为回归模型的截距或斜率会随着样本观察值的改变而系统地改变。着样本观察值的改变而系统地改变。41 (一)截距变动模型(一)截距变动模型 系统变参数模型也可以分为截距变动系统变参数模型也可以分为截距变动模型和截距、斜率同时变动模型。设线性模型和截距、斜率同时变动模型。设线性回归模型为回归模型为(5.25)42 式中,式中,X=解释变量,解释变量,Y=被解释变量。被解释变量。如果的变化为非随机的,而且这种如果的变化为非随机的,而且这种变

24、化完全由外生变量决定,那么式变化完全由外生变量决定,那么式(5.25)就是一个非随机变参数模)就是一个非随机变参数模型。型。43 我们观察到截距项和我们前面的虚拟变我们观察到截距项和我们前面的虚拟变量模型的截距项有所不同,下面多了一量模型的截距项有所不同,下面多了一个下标个下标t。这就是说,虽然回归模型斜。这就是说,虽然回归模型斜率在整个样本时期保持不变,但是截距率在整个样本时期保持不变,但是截距项是随着时间的变化而变化的。项是随着时间的变化而变化的。441t定义如下定义如下(5.265.26)式中,式中,0 0和和1 为我们要求的参数,也可以为我们要求的参数,也可以称为称为“超参数超参数”,

25、Z Zt t 是用来解释是用来解释 1 1t t 变变动情况的外生变量将动情况的外生变量将式(式(5.26)代入代入式式(5.25)中,整理得到中,整理得到45(5.275.27)可用最小二乘法对可用最小二乘法对式(式(5.27)中的超参数)中的超参数和其它参数一并进行估计。如果和其它参数一并进行估计。如果Zt 为虚拟为虚拟变量,那么变量,那么式(式(5.27)就是一个虚拟变量就是一个虚拟变量模型,而且是一个截距项变动斜率不变的模型,而且是一个截距项变动斜率不变的模型。因此,虚拟变量模型是变参数模型模型。因此,虚拟变量模型是变参数模型的一种特殊形式。的一种特殊形式。 46 (二)截距和斜率同时

26、变动模型(二)截距和斜率同时变动模型 和虚拟变量模型的思路一样,再来和虚拟变量模型的思路一样,再来讨论斜率和截距同时存在系统变动的情讨论斜率和截距同时存在系统变动的情况。我们只需要在况。我们只需要在式(式(5.27)的基础上的基础上进行改进。将换为,且假定有如下关系进行改进。将换为,且假定有如下关系式:式: (5.285.28)47将式(将式(5.28)代入式()代入式(5.27),则有),则有(5.295.29)48 以上模型只假定以上模型只假定 1t 和和 2t 存在系统存在系统变化,实际上还有很多参数都可能存在这变化,实际上还有很多参数都可能存在这种变化,甚至可能存在种变化,甚至可能存在

27、1t 和和 2t 等系数有等系数有可能不是线性变化的,也就是说超参数本可能不是线性变化的,也就是说超参数本身可能不为常数。这种情况只是在理论上身可能不为常数。这种情况只是在理论上提出来,实际操作会因为太复杂而没有太提出来,实际操作会因为太复杂而没有太多的应用。多的应用。49用最小二乘估计得到用最小二乘估计得到用最小二乘估计得到用最小二乘估计得到式(式(式(式(5.295.29)中的参数中的参数中的参数中的参数估计值后,就可以对参数是否存在系统变估计值后,就可以对参数是否存在系统变估计值后,就可以对参数是否存在系统变估计值后,就可以对参数是否存在系统变化进行统计检验。如果化进行统计检验。如果化进

28、行统计检验。如果化进行统计检验。如果1 11 1和和和和b bb b1 11 1在统计上不在统计上不在统计上不在统计上不显著,就可以把显著,就可以把显著,就可以把显著,就可以把 1 11 1和和和和 11看作常数;否则,看作常数;否则,看作常数;否则,看作常数;否则,我们认为我们认为我们认为我们认为 11 和和和和 22 存在系统变化。存在系统变化。存在系统变化。存在系统变化。 50 显然,如果错误地把显然,如果错误地把 1 和和2 当作常数,当作常数,就等同于错误地解释了经济变量之间的就等同于错误地解释了经济变量之间的关系。此外,由于相当于省略了重要的关系。此外,由于相当于省略了重要的解释变

29、量解释变量 Zt 和和 Wt ,还可能会产生自相,还可能会产生自相关等问题。关等问题。51 (三)应用案例(三)应用案例 【例例5.3】众所周知,我国居民的消费众所周知,我国居民的消费行为在经济体制改革开放前后存在巨大差行为在经济体制改革开放前后存在巨大差异。但是,在这期间居民的消费行为是否异。但是,在这期间居民的消费行为是否也在不断变化?我国的经济体制改革走的也在不断变化?我国的经济体制改革走的是一条渐进的道路,与居民消费有关的诸是一条渐进的道路,与居民消费有关的诸多因素必然会随着改革开放的不断推进而多因素必然会随着改革开放的不断推进而逐步改变。逐步改变。52 这些变化对居民消费的影响主要有

30、三个这些变化对居民消费的影响主要有三个方面:方面: 第一、第一、 观念的变化。与改革开观念的变化。与改革开放初期相比,放初期相比, 我国居民的观念已经发生我国居民的观念已经发生了深刻的变化。人们的市场意识、风险了深刻的变化。人们的市场意识、风险意识、对通货膨胀的心理承受能力等均意识、对通货膨胀的心理承受能力等均大大增强;对大大增强;对“铁铁”饭碗的依赖思想已饭碗的依赖思想已明显减弱。明显减弱。53 第二,消费者的经济决策权逐渐扩大,第二,消费者的经济决策权逐渐扩大,消费品市场供给日益丰富;劳动力市消费品市场供给日益丰富;劳动力市场的建立使人们有越来越多的择业机场的建立使人们有越来越多的择业机会

31、;居民金融资产的迅速积累,使消会;居民金融资产的迅速积累,使消费者可以在一定时间范围内提前或延费者可以在一定时间范围内提前或延期消费。期消费。54 第三,不确定因素增多。随着市场因素第三,不确定因素增多。随着市场因素的增多,经济生活的不确定因素也在增的增多,经济生活的不确定因素也在增加。例如,职工的实际收入已不再是完加。例如,职工的实际收入已不再是完全全“刚性刚性”,个人的实际收入可能会因,个人的实际收入可能会因为通货膨胀、企业经济效益下降而减少。为通货膨胀、企业经济效益下降而减少。不确定因素的增加,迫使消费者在安排不确定因素的增加,迫使消费者在安排消费时更多顾及长远利益,消费行为渐消费时更多

32、顾及长远利益,消费行为渐趋向理性。趋向理性。55 综上所述,我们似乎没有理由认为居民综上所述,我们似乎没有理由认为居民消费行为在消费行为在19791979年以后是固定不变的。但年以后是固定不变的。但是这种变动是否显著?变动趋势是怎么样是这种变动是否显著?变动趋势是怎么样的?这一切还需要用系统变参数模型加以的?这一切还需要用系统变参数模型加以验证。验证。56利用利用利用利用1979197919791979年至年至年至年至1997199719971997年我国城镇居民家庭收年我国城镇居民家庭收年我国城镇居民家庭收年我国城镇居民家庭收支调查资料,可以建立一个简单的系统变支调查资料,可以建立一个简单的

33、系统变支调查资料,可以建立一个简单的系统变支调查资料,可以建立一个简单的系统变参数模型:参数模型:参数模型:参数模型:(5.305.30)式中,式中,X Xt t和和Y Yt t分别代表城镇居民家庭某年人分别代表城镇居民家庭某年人均实际收入和人均实际支出(以均实际收入和人均实际支出(以19801980年的年的价格水平为价格水平为100100,从收入和支出中分别扣除,从收入和支出中分别扣除价格上涨因素的影响)。价格上涨因素的影响)。t= =年份,年份,ut= =随机随机误差项。误差项。 57 注意到模型的截距注意到模型的截距1t 和边际消费和边际消费倾向倾向 2t 是随着时间的推移而不断变是随着

34、时间的推移而不断变化的,也就是说,消费与收入的关系化的,也就是说,消费与收入的关系是逐年变化的。引起是逐年变化的。引起 1t 和和 2t 变化的变化的因素中有许多是不可观测或难以度量因素中有许多是不可观测或难以度量的,所以无法把这些因素作为解释变的,所以无法把这些因素作为解释变量直接引入模型。量直接引入模型。58因此,我们可以用时间序号因此,我们可以用时间序号T T 来代表这来代表这些因素。些因素。 假定假定 1t 和和 2t 的变化可以由下面的的变化可以由下面的关系式来表示:关系式来表示:(5.315.31)(5.325.32)59 将式(将式(5.31)和式()和式(5.32)代入)代入式

35、(式(5.30),得到),得到(5.335.33)60 用最小二乘法估计用最小二乘法估计式(式(5.33)的参的参数,得到参数估计值后,可以对数,得到参数估计值后,可以对a1,a2和和b1,b2进行统计检验。如果进行统计检验。如果a1,a2和和b1,b2部分或全部显著地不为零,则表部分或全部显著地不为零,则表明在经济体制改革期间消费模型参数明在经济体制改革期间消费模型参数存在系统的变化;反之,就认为消费存在系统的变化;反之,就认为消费模型在改革期间是稳定的。模型在改革期间是稳定的。61 经试算发经试算发现现a a0 0 , a2和和b2在统计上都不在统计上都不显著,所以把模型确定为显著,所以把

36、模型确定为(5.345.34) 用最小二乘法估计式(用最小二乘法估计式(5.34),得到结),得到结果如下果如下(5.355.35)62(5.365.36)式(式(5.36)中,参数估计值下面括号中的中,参数估计值下面括号中的数字是统计值。由数字是统计值。由R2和和DW值可知,模型值可知,模型对消费支出对消费支出Yt变化的拟合程度很好,而且变化的拟合程度很好,而且不存在自相关问题。不存在自相关问题。63估计和检验结果表明:估计和检验结果表明: .a.a1 1, , b1在统计上是高度显著的,在统计上是高度显著的,从而证明我国城镇居民的消费行为在从而证明我国城镇居民的消费行为在改革期间是不断变化

37、的。改革期间是不断变化的。 2. 2. 由由a a2 2=4.5047=4.5047可知,我国城镇居可知,我国城镇居民的消费水平呈现逐年上升的趋势;民的消费水平呈现逐年上升的趋势; 64 3由由 可知,我国城镇可知,我国城镇居民的边际消费倾向呈下降趋势,这居民的边际消费倾向呈下降趋势,这一结果与改革以来居民金融资产迅速一结果与改革以来居民金融资产迅速增加的事实相吻合。增加的事实相吻合。654边际消费倾向的变动曲线为边际消费倾向的变动曲线为(5.375.37) 即,边际消费倾向的变化未线性下降趋即,边际消费倾向的变化未线性下降趋势。势。665 5如果忽略居民消费行为的变化,将模型如果忽略居民消费

38、行为的变化,将模型设定为设定为(5.385.38)则估计结果为则估计结果为(5.395.39)67 显然,虽然模型的拟合优度很高,但是显然,虽然模型的拟合优度很高,但是由于边际消费倾向是固定不变的,模型由于边际消费倾向是固定不变的,模型(5.38)错误的描述了消费和收入的关)错误的描述了消费和收入的关系。而且,如果将其用于预测,随着时系。而且,如果将其用于预测,随着时间的推移误差会越来越大。间的推移误差会越来越大。68 在前面的内容,我们都是用虚拟变量代在前面的内容,我们都是用虚拟变量代表质的因素。但在有些情况下,虚拟变表质的因素。但在有些情况下,虚拟变量也可以代表量的因素,分段线性回归量也可

39、以代表量的因素,分段线性回归就属于这种类型。就属于这种类型。 二、分段回归二、分段回归69 在经济关系中常有这样的情况:当在经济关系中常有这样的情况:当解释变量解释变量X X的值达到某水平的值达到某水平 X X* * 之前,与之前,与被解释变量被解释变量Y Y 之间存在某种线性关系;当之间存在某种线性关系;当解释变量解释变量X X的值达到或超过的值达到或超过X X* * 以后,与被以后,与被解释变量的关系就会发生变化。解释变量的关系就会发生变化。70 如果已知如果已知X 的转折点的转折点X* ,我们就可,我们就可以用虚拟变量来估计每一段的斜率。这以用虚拟变量来估计每一段的斜率。这就是分段线性回

40、归。就是分段线性回归。71 【例例5.4】在在1979年以前,我国居民的消年以前,我国居民的消费支出呈缓慢上升的趋势,从费支出呈缓慢上升的趋势,从1979年开年开始,居民消费支出为快速上升趋势。显始,居民消费支出为快速上升趋势。显然,然,1979年是一个转折点,即年是一个转折点,即 X*=1979。于是,可以用以下模型描述我国居民。于是,可以用以下模型描述我国居民在在1955年至年至1985年期间消费支出的变动年期间消费支出的变动趋势。趋势。72(5.405.40) 式中,式中,Yt为某年的消费支出,为某年的消费支出,t为年份为年份 (t=1955t=1955,19561956,1985198

41、5), D为虚拟为虚拟变量,满足变量,满足(5.415.41)73 于是,两个不同时期的消费趋势为于是,两个不同时期的消费趋势为(5.425.42)()()()(5.435.43) 在在19791979年以前,回归模型的斜率是年以前,回归模型的斜率是1 1 ,而在,而在19791979年之后回归模型的斜率则年之后回归模型的斜率则为为( (1 1+ +2 2) )。如果在。如果在2 2 统计上是显著的,统计上是显著的,则表明则表明19791979年以后消费支出趋势发生了明年以后消费支出趋势发生了明显变化。显变化。 74 【例例5.5】例例5.4中中X只有一个转折点,只有一个转折点,但在某些情况下

42、,解释变量存在多个转但在某些情况下,解释变量存在多个转折点。例如,职工收入与职工年龄有关。折点。例如,职工收入与职工年龄有关。一般而言,年龄大的职工收入高于年龄一般而言,年龄大的职工收入高于年龄小的职工。但是,在不同年龄段收入与小的职工。但是,在不同年龄段收入与年龄的关系是不同的。为了方便,我们年龄的关系是不同的。为了方便,我们仅考虑仅考虑3个年龄段:个年龄段:18岁以下、岁以下、18岁至岁至22岁、岁、22岁以上。岁以上。75 显然,显然,18岁和岁和22岁都是转折点。事实岁都是转折点。事实上,上,18岁和岁和22岁分别为多数人的高中岁分别为多数人的高中及大学毕业年龄。因此,不同年龄段及大学毕业年龄。因此,不同年龄段实际上也代表不同文化水平。实际上也代表不同文化水平。 设设Yi为收入,为收入,Xi为年龄,为年龄, =18, =22,可以建立以下回归模型,可以建立以下回归模型76其中,其中,D1和和D2都是虚拟变量,而且有都是虚拟变量,而且有(5.445.44)假定假定E(ui)=0,我们有,我们有77 这里这里, , 1 1 为为1818岁年龄段以下岁年龄段以下的斜率,的斜率,( ( 1 1+ +2 2 ) )和(和(1 1+ +3 3 )分别为分别为1818岁到岁到2222岁和岁和2222岁以上年龄段岁以上年龄段的斜率。的斜率。(5.455.45) 78END79

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号