计量经济学02解析

上传人:最**** 文档编号:117968468 上传时间:2019-12-11 格式:PPTX 页数:44 大小:849.30KB
返回 下载 相关 举报
计量经济学02解析_第1页
第1页 / 共44页
计量经济学02解析_第2页
第2页 / 共44页
计量经济学02解析_第3页
第3页 / 共44页
计量经济学02解析_第4页
第4页 / 共44页
计量经济学02解析_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《计量经济学02解析》由会员分享,可在线阅读,更多相关《计量经济学02解析(44页珍藏版)》请在金锄头文库上搜索。

1、Copyright 2011 Pearson Addison-Wesley. All rights reserved. 第四章 一元线性回归 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 本章大纲 1. 总体线性回归模型 2. 普通最小二乘(OLS)估计量及样本回归线 3. 样本回归的拟合优度 4. 最小二乘假设 5. OLS估计量的抽样分布 4-2 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 估计总体回归线的斜率 总体回归线的斜率表示每一单位X

2、变化引起Y的期 望变化 最终目标是估计每一单位X变化对Y的因果效应, 当前考虑的问题是描绘一条直线来拟合变量X,Y的 数量关系 4-3 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 一般而言,线性回归的统计推断问题类似于均值估计或是两均 值差估计的统计推断问题。统计学或是计量经济学中关于斜率 估计的步骤: 估计: 如何利用数据估计总体回归线的斜率? 利用普通最小二乘法 (OLS). OLS的优缺点有哪些? 假设检验: 如何检验斜率是否为“0”? 置信区间: 如何构造该斜率的置信区间? 4-4 Copyright 2011

3、 Pearson Addison-Wesley. All rights reserved. 1-5 一元线性回归模型 问题:缩小班级规模会对学生的成绩有什么影响? 数据:加州所有K-6和K-8的学区(n=420) 变量: 5年级考试分数(标准化考试,包括数学和阅 读),学区平均分数 学生教师比(STR)=学生数除以全职教师的 数量 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 线性回归模型(教材 4.1节) 总体回归线: Test Score = 0 + 1STR 1 =总体回归线斜率 = = 一单位STR变化所引起的T

4、est Score的变化 为什么0 及 1 是“总体”参数? 我们想知道 1的值。但是, 因为1未知,故须利用数据进行估计 4-6 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 线性回归模型 Yi = 0 + 1Xi + ui, i = 1, n n 个观察值, (Xi , Yi ), i = 1,., n. X 是自变量或回归变量 Y 是因变量 0 = 截距 1 = 斜率 ui = 回归误差 一般地,回归误差包括了除X变量以外的其他所有决定Y变 量的因素。此外,回归误差也包含Y的度量误差 4-7 Copyright 2

5、011 Pearson Addison-Wesley. All rights reserved. 线性回归模型(如图示): Y 及 X 的观测值 (n = 7); 线性回 归线; 回归误差 (误差项): 4-8 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 普通最小二乘估计量 (教材 4.2节) 如何利用数据估计0 及 1? 回顾:Y的最小二乘估计量 为如下问题的解: 类似地, 我们关注未知参数0和1 的最小二乘(OLS )估计量,即求解如下问题: 4-9 Copyright 2011 Pearson Addison-W

6、esley. All rights reserved. OLS 方法 总体回归线: Test Score = 0 + 1STR 1 = = ? 4-10 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 求解OLS 估计量: OLS估计量是最小化真值Yi与基于回归线的预测值 之差的平方和的结果 最小化问题可由微积分求解(见附录App. 4.2) 该结果即为0 及 1 的OLS估计值 4-11 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 4-12 重要

7、概念4.2 OLS估计量、预测值和残差 斜率 1 和 截距 0的OLS估计量分别为 OLS预测值 和残差 分别为 估计的截距 、斜率 和残差 是利用X和Y的n组样本观测值计 算得到的。它们分别为总体截距 0和斜率 1 和误差项u的估计。 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 加利福尼亚州测试成绩与班级规模数据的OLS估计运 用 斜率估计值 = = 2.28 截距估计值 = = 698.9 估计回归线: = 698.9 2.28STR 4-13 Copyright 2011 Pearson Addison-Wesl

8、ey. All rights reserved. 斜率估计值与截距估计值的解释 = 698.9 2.28STR 每个教师对应的学生人数增加1个时,学区测试成绩将平均 下降2.28分 即: = 2.28 截距 (按字面理解) 指:由该回归线知,在学生老师比例 为零的学区,预测其平均测试成绩为698.9分。但该解释 没有实际意义数据范围之外的推断没有经济意义。 4-14 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 预测值与残差: 数据集中有一个学区是加州的安蒂洛普(Antelope),其学生与教师之比 = 19.33 平均

9、测试成绩 = 657.8 预测值: = 698.9 2.2819.33 = 654.8 残差: = 657.8 654.8 = 3.0 4-15 Copyright 2011 Pearson Addison-Wesley. All rights reserved. OLS 回归: STATA 结果 regress testscr str, robust Regression with robust standard errors Number of obs = 420 F( 1, 418) = 19.26 Prob F = 0.0000 R-squared = 0.0512 Root MSE

10、= 18.581 - | Robust testscr | Coef. Std. Err. t P|t| 95% Conf. Interval -+- str | -2.279808 .5194892 -4.39 0.000 -3.300945 -1.258671 _cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057 - = 698.9 2.28STR (稍后讨论该结果的其余部分) 4-16 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 拟合优度(教材 4.3节)

11、OLS回归线拟合数据的效果如何?考虑两个互补的统 计量: 回归 R2度量了能被X解释的Y的方差的比例; 取值 在0 (不能拟合)到1 (完全拟合)之间 回归标准误 (SER) 是具有代表性的回归残差大小 ,其单位与Y的单位相同 4-17 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 回归 R2 :由回归“解释”的Yi 的样本方差的比例 Yi = + = OLS 预测 + OLS 残差 样本var (Y) = 样本 var( ) + 样本 var( ) (Why?) 总平方和 = 被解释的平方和 + 残差平方和 R2定义:

12、 R2 = = R2 = 0 则 ESS = 0 R2 = 1 则 ESS = TSS 0 R2 1 如果X为一元变量,回归的R2 = X与Y的相关系数平方 4-18 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 4-19 SER 衡量的是u分布的离散程度。 SER 近似等于OLS残差的 样本标准离差: SER = = 第二个等式成立,因为 = = 0. 回归标准误 (SER) Copyright 2011 Pearson Addison-Wesley. All rights reserved. SER = SER: U

13、的单位与Y单位一样,SER是用因变量单位度量的观测值在回归线附近 的离散程度 SER衡量的是OLS残差的平均大小 (距离回归线的平均偏差) 均方根误差 (RMSE) 与 回归标准误(SER)联系紧密: RMSE = 该公式与SER度量一样,较小的差异在于用n替代了除数n-2. 4-20 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 说明: 为何用n-2作除数而不是n? SER = 用n-2作除数是为“自由度”修正。正如在 中,用n-1作除数。 所不同的是,在SER中涉及到两个未知参数0 与1的估计,而在 中 只涉及到一个未知参数Y 的估计。 尽管在单个回归变量时,常用公式中采用n-2作除数,但是当n很大时 ,除数是n,n-1或是n-2的差别可以不计 详情见 17.4 部分 4-21 Copyright 2011 Pearson Addison-Wesley. All rights reserved. 关于 R2 及 SER 的例子 = 698.9 2.28S

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号