线性回归模型的扩展

上传人:F****n 文档编号:88225556 上传时间:2019-04-21 格式:PPT 页数:64 大小:318KB
返回 下载 相关 举报
线性回归模型的扩展_第1页
第1页 / 共64页
线性回归模型的扩展_第2页
第2页 / 共64页
线性回归模型的扩展_第3页
第3页 / 共64页
线性回归模型的扩展_第4页
第4页 / 共64页
线性回归模型的扩展_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《线性回归模型的扩展》由会员分享,可在线阅读,更多相关《线性回归模型的扩展(64页珍藏版)》请在金锄头文库上搜索。

1、第五章 线性回归模型的扩展,对数线性模型 半对数模型 线性对数模型 双曲函数模型 多项式回归模型 特征:参数线性,变量不一定线性 包含虚拟变量的回归模型,第一节 对数线性模型:度量弹性,双对数线性模型 对数线性模型的假设检验 多元对数线性回归模型,一、双对数线性模型,考虑函数:Y=AXb1 变量X非线性 恒等变换:lnY=lnA+b1lnX ln表示自然对数(以e为底的对数) lnY=lnA+b1lnX+u 令b0=lnA lnY= b0 +b1lnX+u 将形式如上式的模型称为双对数模型。,双对数线性模型,令y=lnY,x=lnX 则有y=b0 +b1 x +u 若上式满足古典线性回归模型的

2、基本假定,则很容易用普通最小二乘法估计它,并且得到的估计量是BLUE估计量。,双对数线性模型,双对数模型特性:斜率b1度量了Y对X的弹性,即给X一个很小的变动所引起Y变动的百分比。 弹性=Y变动百分比/X变动百分比 双对数模型又称为不变弹性模型,例:对widget教科书的需求,二、双对数模型的假设检验,在随机误差项u满足假定的情形下,线性模型与双对数模型的假设检验方法相同。,三、多元对数线性回归模型,将双变量对数线性回归模型推广到模型中解释变量多于一个的情形 如三变量双对数模型 lnY= b0 +b1lnX1+ b2lnX2+u 在这个模型中,偏斜率系数b1、b2又称为偏弹性系数。 b1是Y对

3、X1的弹性(X2不变) b2是Y对X2的弹性(X1不变),多元对数线性回归模型,在多元对数线性模型中,每一个偏斜率系数度量了在其他变量保持不变的条件下,因变量对某一个解释变量的偏弹性。,例:柯布道格拉斯生产函数,lnY= b0 +b1lnX1+ b2lnX2+u 令X1表示劳动投入,X2表示资本投入 柯布道格拉斯生产函数(C-D函数) Y:19551974年间墨西哥产出(GDP,百万比索) X1:劳动投入(总就业人数,千人) X2:资本投入(固定资本,百万比索),柯布道格拉斯生产函数,lnY=-1.6524+0.3397lnX1+0.8640lnX2 se=(0.6062) (0.1857)

4、(0.09343) t=(-2.73) (1.83) (9.06) R2 =0.995,对回归方程解释,b1:产出对劳动投入的弹性 b2:产出对资本投入的弹性 以上两个弹性系数相加(b1+b2)得到规模报酬系数,反映产出对投入的比例变动。 规模报酬系数=1:规模报酬不变 规模报酬系数1:规模报酬递增 规模报酬系数1:规模报酬递减,对回归方程解释,b1= 0.3397 b2=0.8640 规模报酬系数(b1+b2)=1.2037 墨西哥经济特征是规模报酬递增 资本投入对产出影响大于劳动对产出的影响。,例:对能源需求,数据:19601982年间7个OECD国家(美国、加拿大、德国、英国、意大利、日

5、本、法国)的总最终能源需求指数Y;实际GDP(X1);实际能源价格(X2) 所有指数均以1970年为基准(1970=100),回归结果,lnY=1.5495+0.9972lnX1-0.3315lnX2 se=(0.0903) (0.0.0191) (0.0243) t=(17.17) (52.09) (13.61) R2 =0.994,回归结果分析,能源需求与收入(GDP)正相关,与实际能源价格负相关 收入弹性:0.9972 价格弹性:-0.3315,缺乏弹性(基本消费品),第二节:半对数模型:测度增长率,政府根据预计的GDP增长率指标确定预算赤字规划 美联储根据未偿付消费者信贷的增长率指标监

6、视其货币政策的运行效果,例:美国未偿付消费者信贷的增长,数据:19731987年间未偿付消费者信贷 Y:未偿付消费者信贷 复利计算公式:Yt=Y0(1+r) t Y0Y的初始值 Yt第t期的Y值 r 复利率,例:美国未偿付消费者信贷的增长,求对数:lnYt=lnY0+tln(1+r) 令b0= lnY0 ; b1=ln(1+r) 引进随机误差项u,得到: lnYt= b0 + b1t+u 半对数模型:仅因变量以对数出现,OLS回归结果,lnYt= 12.007 + 0.0946t se=(0.0319) (0.0035) t=(376.4) (26.03) R2 =0.9824 未偿付信贷增长

7、率0.0946( 9.46 %) 半对数模型中,斜率度量了给定解释变量的绝对变化所引起的被解释变量的相对变动,线性趋势模型,Yt= b0 + b1t+u 将因变量对时间t回归,其中t 按时间先后顺序计算,这类模型称为线性趋势模型。 时间t称为趋势变量 若斜率为正,则称Y有向上的趋势; 若斜率为负,则称Y有向下的趋势,例:美国为偿付消费者信贷,Yt= 98084 + 35289t se=(23095) (2540.1) t=(4.247) (13.893) R2 =0.9369 因变量不同,不能比较R2,回归结果分析,在样本区间内,未偿付消费者信贷的年绝对增加值为35289百万美元。 在此期间,

8、未偿付消费者信贷有一个向上趋势。,第三节:线性对数模型,线性对数模型:解释变量是对数形式,而因变量不是对数形式。,例:美国GNP与货币供给,考虑模型:Y=b0+b1lnX+u 其中:Y=GNP;X=货币供给 回归结果: Y=-16329.0+2584.8lnX t= (-23.494) (27.549) R2 =0.9832,第四节:双曲函数模型,双曲函数模型: Y=b0+b1(1/X)+u 参数线性 变量非线性(X以倒数形式进入模型) 特征:X无限增大时,1/X趋近于0,Y逐渐接近b0渐近值。,双曲函数模型,平均固定成本 恩格尔消费曲线 菲利普斯曲线,例:美国菲利普斯曲线,数据:美国1958

9、1969年间小时收入指数(Y)和城市失业率(X) 回归结果:Y=-0.2594+20.588(1/X) t=(-0.2572) (4.3996) R2 =0.6594 线性模型:Y=8.0147-0.7883X t=(6.4625) (-3.2605) R2 =0.5153,第五节:多项式回归模型,多项式回归模型:在模型等式右边只有一个解释变量,但却以不同的次幂出现,可将它们看作多元回归模型。 多项式回归模型在生产与成本函数领域中被广泛应用。,多项式回归模型,形式: 变量非线性,参数线性 变量之间不完全共线性,三次多项式函数,形式:c=a0+a1Q+a2Q2+a3Q3 又称为立方函数 变量Q的

10、最高次幂代表了多项式函数的次,上式最高次为3。,例:成本产出,数据 Y=141.7667+63.4776X-12.961X2+0.9396X3,第六节 包含虚拟变量的回归模型,虚拟变量:定性的或者反映质的差别的或者分组的信息结合到回归模型中。比如性别、种族、宗教、季节、战争/和平、有自然灾害/无自然灾害、南方/北方。我们可以用只取0和1的变量来表示这些定性或者分组的因素。称为虚拟变量。 指标变量、二元变量、分类变量、二分变量,虚拟变量,(1)D=1 表示男,0表示女 (2)D=1 表示生活在南方,0 表示不生活在南方 一般地 D=,虚拟变量,季节 i=1、2、3、4 四个变量合起来可以表示各个

11、季度,虚拟变量的性质,如果定性变量有m种情形,则应引进m -1个虚拟变量。否则就会陷入虚拟变量陷阱,即完全多重共线性。 虚拟变量赋值是任意的。赋值依习惯而定。 赋值为0的一类称为基准类、控制类、对比类。基准类的选择根据研究目的确定。 虚拟变量D 的系数称为差别截距系数,表明赋值为1的类和基准类截距值的差距。,1、方差分析模型,虚拟变量和定量变量一样可以用于回归分析。 模型中的解释变量可以同时包含定量变量和虚拟变量。 若回归模型中的变量仅仅只有虚拟变量,这样的模型称为方差分析模型(ANOVA)。,例:大学毕业生的初职年薪,模型:Y=b0+b1D1+u Y:初职年薪 D1=1:大学毕业 D1=0:

12、其他(非大学毕业) 毕业生初职年薪的期望为: E(Y|D1=0)= b0+b1*0 = b0 E(Y|D1=1)= b0+b1*1 = b0 +b1,大学毕业生的初职年薪,截距b0表示非大学毕业生的平均初职年薪 “斜率” b1表明大学毕业生的平均初职年薪与非大学毕业生的初职年薪的差距 b0 +b1表示大学毕业生的平均初职年薪,例:回归结果/图形,例:工作权利法对工会会员的影响,为了研究工作权利法的效果(该法使工会的劳资谈判合法化),Brennan等人建立了工会会员(属于工会的工人占所有工人的百分比)对工作权利法(1980年)的函数模型,这项研究包括了50个州,其中19个州制定了工作权利法,31

13、个州允许有工会会员制度(即允许进行劳资谈判),工作权利法对工会会员的影响,回归结果: Y=26.68-10.51D Se=(1.00) (1.58) t=(26.68) (6.65) R2 =0.497 Y工会会员占工人的比例(1980) D=0,制定工人工作权利法的州 D=1,未制定工作权利法的州,2、协方差模型,在许多的经济研究中,回归模型中的解释变量有些是定量的,有些是定性的,我们将这种模型称为协方差模型(ANCOVA)。 包含一个定量变量,一个定性变量的回归模型 包含一个定量变量,两个定性变量的回归模型,例:教师年薪与教龄、性别的关系,考虑ANCOVA模型: Y=b0+b1D+b2X+

14、u Y:大学教师的年薪,X:教龄 D=1:男教师,D=0:女教师 男教师平均年龄:E(Y|X,D=1)= b0+b1+b2X 女教师平均年龄:E(Y|X,D=0)= b0+b2X,例:教师年薪与教龄、性别的关系,虚拟变量多种分类的情况,个人假期旅游的年支出对其收入与受教育水平的回归 教育变量是定性变量,假设本问题有三种分类:未达到中学水平、中学水平、大学水平,假期旅游支出与教育水平,模型:Y=b0+b1D1+b2D2+b3X+u Y:用于假期旅游的年支出 X:年收入 D1=1:中学教育,D1=0:其他 D2=1:大学教育,D2=0:其他 基准类:未达到中学水平,假期旅游支出与教育水平,未达到中

15、学水平平均旅游支出 E(Y| D1 =0, D2 =0,X)= b0 +b3X 中学水平的平均旅游支出 E(Y| D1 =1, D2 =0,X)= b0 +b1 +b3X 大学毕业的平均旅游支出 E(Y| D1 =0, D2 =1,X)= b0 +b2 +b3X,回归结果,包含一个定量、两个定性变量的模型,教师年薪一例中,假定除教龄、性别外,肤色也是一个重要的决定因素。 模型: Y=b0+b1D1+b2D2+b3X+u Y:年薪,X:教龄 D1=1:男教师,D1=0:女教师 D2=1:白种, D2=0:非白种,3、回归模型中的结构稳定性:虚拟变量法,美国储蓄收入关系是否在严重萧条之后于1982

16、年经历了一个结构变动。 模型: 19701981年:Y=A1+A2X+u 19821995年:Y=B1+B2X+u Y个人储蓄;X个人可支配收入,美国储蓄收入关系,四种可能结果: 一致回归:A1 = B1 , A2 = B2 平行回归:A1 B1 , A2 = B2 并发回归:A1 = B1 , A2 B2 相异回归:A1 B1 , A2 B2,美国储蓄收入关系,虚拟变量法: Y=M1+M2D+M3X+M4 ( DX ) +u Y个人储蓄;X个人可支配收入 D=0:观察值是从1970年到1981年 D=1:观察值是从1982年到1995年 E(Y|D=0,X)= M1+ M3X E(Y|D=1,X) =(M1+M2 )+ (M3+M4 ) X,美国储蓄收入关系,M2 :差别截距;M4:差别斜率 回归结果 Y=1.02+152.48D+0.0803X-0.0655(DX) se=(20.16) (33.08) (0.0145) (0

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号