第三章多元回归分析教学教案

上传人:yuzo****123 文档编号:141566608 上传时间:2020-08-10 格式:PPT 页数:57 大小:5.42MB
返回 下载 相关 举报
第三章多元回归分析教学教案_第1页
第1页 / 共57页
第三章多元回归分析教学教案_第2页
第2页 / 共57页
第三章多元回归分析教学教案_第3页
第3页 / 共57页
第三章多元回归分析教学教案_第4页
第4页 / 共57页
第三章多元回归分析教学教案_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《第三章多元回归分析教学教案》由会员分享,可在线阅读,更多相关《第三章多元回归分析教学教案(57页珍藏版)》请在金锄头文库上搜索。

1、第三章 多元回归分析,3.1 模型的假定 3.2 参数的最小二乘估计 3.3 最小二乘估计量的性质 3.4 多元线性回归模型的统计检验 3.5 应用举例,3.1 多元线性回归模型及其假定,回归系数,在前面的多元线性回归模型中, 称为回归系数。 称为偏回归系数(偏效应),它表示在其它自变量保持不变的条件下,该自变量变化一个单位将引起因变量平均变化多少个单位。,3.2 参数的最小二乘估计,拟合值和残差的重要性质 (1)残差的样本均值为0; (2)每个自变量和OLS残差之间的样本协方差为0;拟合值与残差之间的样本协方差也为0; (3)点 总位于OLS回归线上;,3.3 最小二乘估计量的性质,1、线性

2、性,其中,C=(XX)-1 X 为一仅与固定的X有关的行向量,2、无偏性,这里利用了假设: E(X)=0,3、有效性(最小方差性),其中利用了,和,3.4 多元线性回归模型的统计检验,则,总离差平方和的分解,记 总离差平方和 回归(解释)平方和 残差平方和,由于,=0,所以有:,注意:一个有趣的现象,可决系数,该统计量越接近于1,模型的拟合优度越高。,调整的可决系数(adjusted coefficient of determination),在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响

3、:,),1,/(,),/(,1,2,-,-,-,=,n,TSS,k,n,RSS,R,其中:n-k为残差平方和的自由度,n-1为总体平方和的自由度。,对多个线性约束的F检验 不受约束模型(unrestricted model) 假设有q个排除性约束,不防设为自变量中的最后q个,虚拟假设为: 受约束模型(restricted model) 对立假设H1:不正确(即中至少有一个异于0)。定义检验的F统计量,式中RSSr为受约束模型的残差平方和,RSSur为不受约束模型的残差平方和。 分子中使用的自由度df 被检验的约束个数dfr-dfur 即受约束模型与不受约束模型的自由度之差。 分子中使用的自由度

4、df 不受约束模型的自由度n-k 检验不同组之间回归函数(例如k个参数)上差别的邹至庄统计量如下,例:在一个F3,60分布中5%的临界值和拒绝域,例:考虑如下解释主要俱乐部棒球运动员薪水的模型: 式中,salary为1993年的总薪水;years为进入俱乐部的年资;gamesyr为平均每年的比赛次数;bavg为平均职业击球次数;hrunsyr为平均每年的本垒打次数;rbisyr为每年的击球跑垒得分。假设检验的虚拟假设是,一旦控制了俱乐部的年资和每年的比赛次数,度量球员表现的统计指标(bavg、hrunsyr、rbisyr)对薪水没有影响。虚拟假设为,采用Wooldridge中MLB1.RAW数

5、据未受约束的模型估计结果为 从t检验而言, bavg、hrunsyr、rbisyr中没有一个变量在5%的显著性水平上具有一个统计显著的t统计量,但这并不能表明可以拒绝H0,必须估计受约束模型。,受约束模型估计结果为 F统计量为 显著性水平为5%的临界值为2.60,显著性水平为1%的临界值为3.78,所以在1%的显著性水平拒绝bavg、hrunsyr、rbisyr对薪水没有影响的假设。,t统计量,由于,以cii表示矩阵(XX)-1 主对角线上的第i个元素,于是参数估计量的方差为:,其中2为随机误差项的方差,在实际计算时,用它的估计量代替:,因此,可构造如下t统计量,实际上 ,其中 为xi的总样本

6、变异; 为对所有其他自变量(并包括截距项)进行回归所得到的R2,t检验,设计原假设与备择假设:,H1:i0,给定显著性水平,可得到临界值t/2(n-k),由样本求出统计量t的数值,通过 |t| t/2(n-k) 或 |t|t/2(n-k) 来拒绝或接受原假设H0,从而判定对应的解释变量是否应包括在模型中。,H0:i=0 (i=1,2k),注意:一元线性回归中,t检验与F检验一致,一方面,t检验与F检验都是对相同的原假设H0:1=0 进行检验; 另一方面,两个统计量之间有如下关系:,3.5 应用举例,1、中国居民人均消费模型 考虑建立中国居民人均消费的多元线性模型。 解释变量: 人均GDP:GD

7、PP 前期消费:CONSP(-1) 估计区间: 19792000年,中国居民人均消费支出与人均GDP(元/人),Eviews软件估计结果,在中国居民人均收入-消费支出二元模型例中,由应用软件计算出参数的t值:,给定显著性水平=0.05,查得相应临界值: t0.025(19) =2.093。,可见,计算的所有t值都大于该临界值,所以拒绝原假设。即: 包括常数项在内的3个解释变量都在95%的水平下显著,都通过了变量显著性检验。,2、企业的工资影响因素模型,使用Wooldridge的CEOSAL2.RAW中的数据得到以下关于企业工作人员工资的影响因素模型如下表,小括号内为标准误。其中变量mktval

8、为企业的市场价值;profmarg为利润占销售额的百分比;ceoten为其就任当前公司CEO的年数;而comten则为其在这个公司的总年数。 (1)评论profmarg对CEO薪水的影响。 (2)市场价值是否具有显著影响?试解释你的结论。 (3)解释ceoten和comten的系数。这些变量是统计显著的吗?你如何解释在其他条件不变的情况下,你在这个公司任职时间越长,你的薪水则越低?,3、在职培训津贴对企业废弃率的影响,对于1987年密歇根州制造企业的一个样本(见Wooldridge中数据集JTRAIN.RAW中数据的一个子集),估计以下方程。 其中n=30, R2=0.431。小括号内为标准误。变量hrsemp为平均每个雇员每年受到培训的小时数;sales为企业年销售额;employ为企业雇员人数。 (1)判断变量hrsemp的系数的显著性,如果显著,企业增加培训能够降低废弃率,但企业还可能考虑其他什么因素?,(2)利用一个更大企业样本,1987年的43个观测值,得到总体回归模型 的估计方程,判断hrsemp的显著性。 (2)证明这个总体模型可以写成 解释假设,(3)当估计第(2)部分的方程时得到 控制了工人培训和销售-雇员比后,是否越大的企业具有越为统计显著的废弃率? (4)检验假设:sales/employ提高1%将伴随以废弃率下降1%,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号