第四章 多元线性回归模型

上传人:豆浆 文档编号:771889 上传时间:2017-05-14 格式:DOC 页数:10 大小:403KB
返回 下载 相关 举报
第四章  多元线性回归模型_第1页
第1页 / 共10页
第四章  多元线性回归模型_第2页
第2页 / 共10页
第四章  多元线性回归模型_第3页
第3页 / 共10页
第四章  多元线性回归模型_第4页
第4页 / 共10页
第四章  多元线性回归模型_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《第四章 多元线性回归模型》由会员分享,可在线阅读,更多相关《第四章 多元线性回归模型(10页珍藏版)》请在金锄头文库上搜索。

1、第四章 多元线性回归模型在一元线性回归模型中,解释变量只有一个。但在实际问题中,影响因变量的变量可能不止一个,比如根据经济学理论,人们对某种商品的需求不仅受该商品市场价格的影响,而且受其它商品价格以及人们可支配收入水平的制约;影响劳动力劳动供给意愿(用劳动参与率度量)的因素不仅包括经济形势(用失业率度量) ,而且包括劳动实际工资;根据凯恩斯的流动性偏好理论,影响人们货币需求的因素不仅包括人们的收入水平,而且包括利率水平等。当解释变量的个数由一个扩展到两个或两个以上时,一元线性回归模型就扩展为多元线性回归模型。本章在理论分析中以二元线性回归模型为例进行。一、预备知识(一)相关概念对于一个三变量总

2、体,若由基础理论,变量 和变量 之间存在因果关21,xy系,或 的变异可用来解释 的变异。为检验变量 和变量 之间因果21,xy关系是否存在、度量变量 对变量 影响的强弱与显著性、以及利用解释变21,x量 去预测因变量 ,引入多元回归分析这一工具。21,将给定 条件下 的均值ix21,iyiiii xxyE21021),|( (4.1)定义为总体回归函数(Population Regression Function,PRF) 。定义为误差项(error term),记为 ,即 ,),|(21iiixyE i),|(21iiii xyE这样 ,或iiiiii xy210(4.2)(4.2)式称为

3、总体回归模型或者随机总体回归函数。其中, 称为解21,释变量(explanatory variable)或自变量(independent variable) ; 称为y被解释变量(explained variable)或因变量(dependent variable) ;误差项解释了因变量的变动中不能完全被自变量所解释的部分。在总体回归模型(4.2)中参数 是未知的, 是不可观察的,统210,i计计量分析的目标之一就是估计模型的未知参数。给定一组随机样本,对(4.1)式进行估计,若 的估nixyi ,21),(21 21021,),|(iixyE计量分别记为 ,则定义(4.3)式为样本回归函数2

4、0iy( ) iiixy210ni,(4.3)注意,样本回归函数随着样本的不同而不同,也就是说 是随机变210,量,它们的随机性是由于 的随机性(同一组 可能对应不同的 ) 、iy),(21ixiy各自的变异、以及 之间的相关性共同引起的。定义 为残差项21,x21,x ii(residual term),记为 ,即 ,这样 ,或ieiiiyiiey( ) ii ex10n,(4.4)(4.4)式称为样本回归模型或者随机样本回归函数。样本回归模型中残差项可视为总体回归模型中误差项 的估计量。ie i(二)多元线性回归模型的矩阵表示多元线性回归模型的参数估计比一元线性回归模型要复杂得多,为了便于

5、计算和分析,便于将结果由三变量总体推广到一般的多变量总体,引入矩阵这一工具简化计算和分析。设 是取自总体的一组随机样本。在该组样本下,总nixyi ,21),(21体回归模型(4.2)式可以写成方程组的形式 12101 xy2nnnxy210利用矩阵运算,可表示为nnnxy210212121(4.5)记 , , ,ny21nxX2121310n21则在该组样本下,总体回归模型的矩阵表示为Xy(4.6)记 ,210ne21则样本回归模型的矩阵表示为eXy(4.7)(三)模型假定假定 1 回归模型是参数线性的,并且是设定正确的。假定 2 随机误差项与解释变量不相关。即, 。0),cov(ijx2,

6、1j如果解释变量是非随机的,则该假设自动满足。假定 3 零均值假定。即,0)(iEni,21假定 4 同方差假定。即,varii,假定 5 无自相关假定。即两个误差项之间不相关, ,0),co(ji jini,21 nj,21假定 6 解释变量 与 之间不存在完全共线性,即两个解释变量之间无确切的1x2的线性关系。假定 7 正态性假定。即 ,i),0(2Nni,1(四)参数估计与估计量的分布系数向量 的 OLS 估计为yXT1)((4.8)其中, 为 的转置矩阵。在随机误差项服从正态分布的假定下,系数向量TX的估计量也服从正态分布,即 )(,12XNT(4.9)记 的第 j 个主对角元素为 ,

7、则1)(XCT jc j),(2jjc(4.10)有了系数估计量的分布,就可以对总体参数做假设检验。与双变量总体相同,总体误差 是不可观察的,因而其方差 是未知的。若用 的无偏估计i22量 代替 ,则 OLS 估计量服从自由度为 的 t 分布,而不是正态分布,22 3n即 )(jjjse)3(nt(4.11)其中, , 。jjcse2)(322nei(五)预测原理回归分析的目的之一是利用回归模型预测因变量。假设三变量总体的回归模型为(4.2) ,即iiii xy210(4.2)在一组随机样本 下,利用 OLS 求得样本回归函数为nixyi ,21),(21(4.3)( ) iii xy210n

8、i,1(4.3)给定样本外一点 ,则因变量 的点预测为Tfffxx),1(2fyfff x210(4.12)点预测 的标准误为fyfTff xXxyse1)(1)((4.13)因变量 的置信度为 的区间预测为fy1 , )(32ff ysenty)(32ff ysent(4.14)二、案例案例 1 Woody 餐馆的选址分析Woody 餐馆是一家价位适中、24 小时营业的家庭连锁店,公司邀请你决策下一家连锁店的选址问题。你决定建立一个回归模型来解释每一家连锁餐馆的毛销售额 Y(the gross sales volume),通过文献的阅读,你认为以下变量对毛销售额的影响较大,N =竞争变量:餐

9、馆位置半径 2 里以内市场直接竞争者的数量;P=人口: 餐馆位置半径 3 里以内人口的数量;I=收入: 餐馆位置半径 3 里以内家庭平均收入。并且通过调研,你获得了 33 家 Woody 餐馆连锁店的数据。案例 2 经济形势和实际工资对人们工作意愿的影响在第三章,我们根据劳动经济学理论,分析了经济形势对人们工作意愿的影响存在两种效应:受挫工人效应和增加工人效应;并且利用 1980-2002 年的数据实证了受挫工人效应占主导地位。但根据劳动经济学理论,影响人们工作意愿的因素,除了经济形势以外,还有实际的工资水平。从理论上说,实际工资增加对劳动供给具有两种效应:替代效应与收入效应。替代效应趋于使劳

10、动供给增加,而收入效应则趋于使劳动供给降低,两种效应的相对影响取决于家庭的偏好(参考文献4,p49) 。本案例考察实际工资对人们工作意愿是否有影响,以及在有影响的情况下,那种效应占优。数据见表 3.1。三、实验目的案例 1 Woody 餐馆的选址分析1、绘制 Y 对 N、P、I 的散点图,并在散点图中附加回归线。2、建立 Y 对 N、P、I 的线性回归模型,并定性分析解释变量 N、P、I 对 Y 的影响。3、利用样本数据及 OLS 法对回归模型进行估计,并报告回归结果。4、观察回归系数的显著性和方程的显著性,并解释回归系数的含义。案例 2 经济形势和实际工资对人们工作意愿的影响1、绘制 clf

11、pr 对 ahe82 的散点图,并附回归线,观察城市劳动参与率与实际工资之间的线性关系。2、建立 clfpr 对 ahe82 的一元线性回归模型,利用 1980-2002 年的数据估计模型,并观察回归系数的显著性和方程的显著性。3、同时考虑经济形势与实际工资对人们工作意愿的影响,建立二元线性回归模型,利用 1980-2002 年的数据估计模型,观察回归系数的显著性和方程的显著性,并解释回归系数的经济含义。4、对上面(2)与(3)中估计结果的差别进行解释。5、模型的选择问题,在以下三个模型之间,哪个模型更好呢?tttcunrclfpr10()tttahelfp8210()tttt cunrclf

12、r210()四、实验原理五、实验步骤案例 1 Woody 餐馆的选址分析80,10,0120,140,160,180,0246810NY 80,10,0120,140,160,180,010,020,030,0PY 80,10,0120,140,160,180,10, 20, 30, 40,IY图 4-1 Y 对 N、P、I 的散点图1、打开 Eviews 工作文件 Woody.wfl,按住 Ctrl 键,点击工作文件目录中的序列 Y、N、P、I 图标,点击鼠标右键,点击 Open/as Group,出现包含序列Y、N、P、I 的组对象窗口。点击组对象窗口工具栏的 View 按钮,选择 Gra

13、ph,在 Specifi 选项中选择Scatter,在 Fit lines 中选择 Regression Line,在 Multiple 中选择Multiple graphs-First vs.All,设定完毕后点击确定按钮,则出现 Y 对N、P、I 的三张散点图,点击鼠标右键,选择 Copy,将散点图复制到 Word 文档中,如图 4-1 所示。2、Y 对 N、P、I 的线性回归模型为iiiii IPNY 3210(4.15)一般来说,人口越多,餐馆的毛销售额越大;人们的收入水平越高,餐馆的毛销售额越大;竞争者的数量越多,餐馆的毛销售额越低。即 P 和 I 对 Y 有正的影响,N 对 Y 有

14、负的影响,从而 的预期符号为正, 的预期符号为负。32,1图 4-1 散点图中回归线的斜率与理论的预期是一致的。3、在文件窗口点击 object/new object,在出现的对象类型中选择 equation,在对象名中填写 eq1,点击 OK,出现对话框图 4.2图 4.2 回归方程的设定在估计方法中选择最小二乘法,样本范围填写 1 到 30。设定完毕后点击确定。出现图 4.3图 4.3 方程估计的输出根据图4.3,报告估计结果如下Y = 102192.4 - 9074.67*N + 0.35*P + 1.29*I(2052.67) (0.073) (0.54)t= -4.42 4.87 2

15、.37 =0.582R4、从估计输出结果可知,回归系数的符号方向(正、负)和大小均与理论分析一致,t 统计量的值显示也在 0.05 的显著性水平下显著(这一点也可以从边际概率值观察到) ,F 统计量的值为 15.64(相应的概率值为 0.000003) ,表明三个解释变量对被解释变量联合显著。多元回归系数的含义为,当其他变量(控制变量)不变时,该变量对因变量的边际影响。对于本例各系数的含义为,收入增加一个单位会使餐馆的销售收入增加 1.29 个单位;人口增加一个单位会使餐馆的销售收入增加 0.35 个单位;竞争者的数量增加一个单位将使餐馆的销售数量减少 9074.67 个单位。案例 2 经济形势和实际工资对人们工作意愿的影响在以下操作中,假设包含 clfpr、 ahe82 和 cunr 三个序列的 Eviews 工作文件 clfpr.wfl 已经存在。1、打开 Eviews 工作文件 c

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号