一元线性回归模型ppt课件.ppt

上传人:资****亨 文档编号:122414187 上传时间:2020-03-05 格式:PPT 页数:68 大小:2.05MB
返回 下载 相关 举报
一元线性回归模型ppt课件.ppt_第1页
第1页 / 共68页
一元线性回归模型ppt课件.ppt_第2页
第2页 / 共68页
一元线性回归模型ppt课件.ppt_第3页
第3页 / 共68页
一元线性回归模型ppt课件.ppt_第4页
第4页 / 共68页
一元线性回归模型ppt课件.ppt_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《一元线性回归模型ppt课件.ppt》由会员分享,可在线阅读,更多相关《一元线性回归模型ppt课件.ppt(68页珍藏版)》请在金锄头文库上搜索。

1、Econometrics 第三章 一元线性回归模型 教材第二 三章 第三章 一元线性回归模型 3 1 回归的涵义 3 2 随机扰动项的来源 3 3 参数的最小二乘估计 3 4 参数估计的性质 3 5 显著性检验 3 6 拟合优度 3 7 预测 学习要点 回归模型的涵义 参数的OLS估计及其性质 显著性检验 3 1 回归的涵义 回归分析 regression analysis 用于研究一个变量 称为被解释变量或应变量 与另 一个或多个变量 称为解释变量或自变量 之间的关 系 Y代表被解释变量 X代表解释变量 解释变量有多 个时 用X1 X2 X3等表示 例 商品的需求量与该商品价格 消费者收入以

2、及其 他竞争性商品价格之间的关系 总体回归函数 population regression function PRF 例 学生的家庭收入与数学分数有怎样的关系 3 1 回归的涵义 3 1 回归的涵义 总体回归函数 population regression function PRF 根据上面数据做散点图 3 1 回归的涵义 总体回归函数 population regression function PRF 上图中 圆圈点称为条件均值 条件均值的连线称为 总体回归线 总体回归线表明了Y的均值与每个X的变动关系 上图近似线性的总体回归线可以表示成 表示给定的X值所对应的Y的均值 称为参数 para

3、meters 也称回归系数 regression coefficients 称为截距 intercept 称为斜率 slope 斜率系数度量了X每变动一单位 Y 条件 均值的 变化率 举例 含义 3 1 回归的涵义 样本回归函数 sample regression function SRF 实际中往往无法获得整个总体的数据 怎么估计总体 回归函数 即如何求参数B1 B2 通常 我们仅仅有来自总体的一个样本 我们的任务就是根据样本信息估计总体回归函数 怎么实现 3 1 回归的涵义 样本回归函数 sample regression function SRF 表2 2 2 3的数据都是从表2 1中随

4、机抽取得到的 3 1 回归的涵义 样本回归函数 sample regression function SRF 通过散点得到两条 拟合 样本数据的样本回归线 3 1 回归的涵义 样本回归函数 sample regression function SRF 可用样本回归函数 SRF 表示样本回归线 其中 总体条件均值 的估计量 并非所有样本数据都准确地落在样本回归线上 因此 建立随机样本回归函数 其中 是 的估计量 称 为残差 residual 表示了Y的实际值与样本回归估计值的差 3 1 回归的涵义 样本回归函数 sample regression function SRF 回归分析 根据样本回归

5、函数估计总体回归函数 3 1 回归的涵义 线性 回归的特殊含义 对 线性 有两种解释 变量线性和参数线性 变量线性 例如前面的总体 或样本 回归函数 下 面的函数不是变量线性的 参数线性 参数B1 B2仅以一次方的形式出现 下面 的模型是参数非线性的 本书主要关注参数线性模型 从现在起 线性回归 linear regression 是指参数线性的回归 而解释变量 并不一定是线性的 3 2 随机扰动项的来源 总体回归函数说明在给定的家庭收入下 美国学生 平均的数学分数 但对于某一个学生 他的数学分数可能与该平均水平 有偏差 可以解释为 个人数学分数等于这一组的平均值加上 或减去某个值 用数学公式

6、表示为 其中 表示随机扰动项 简称扰动项 扰动项是一 个随机变量 通常用概率分布来描述 3 2 随机扰动项的来源 对于回归模型 称为 被解释变量 explained variable 也称 应变量或因变量 dependent variable 称为 解释变量 explanatory variable 也称 自变量 independent variable 称为 参数 parameter 称为 随机扰动项 random error term 3 2 随机扰动项的来源 上式如何解释 可以认为 在给定家庭收入水平 上 第i个学生的 数学分数可以表达为两部分之和 一是 即 是该收入水平上的平 均数学分

7、数 这一部分称为系统或确定性部分 二是 称为非系统或随机成本 由收入以外的因素 决定 此时 称 为随机总体 回归函数 stochastic PRF 3 2 随机扰动项的来源 3 2 随机扰动项的来源 性质1 扰动项代表了未纳入模型变量的影响 例如 个人健康状况 居住区域等等 性质2 反映了人类行为的内在随机性 即使模型中 包括了决定数学分数的所有变量 其内在随机性也不 可避免 这是做任何努力都无法解释的 性质3 还代表了度量误差 例如收入的数据可能不 等于真实值 性质4 奥卡姆剃刀原则 即描述应该尽可能 简单 只要不遗漏重要的信息 此时可以把影响Y的 次要因素归入随机扰动项 3 3 参数的最小

8、二乘估计 参数估计 普通最小二乘法 OLS 根据样本回归函数估计总体回归函数 要回答两个问 题 如何估计PRF 如何验证估计的PRF是真实的PRF的一个 好 的估计值 这里先回答第一个问题 回归分析中使用最广泛的是普通最小二乘法 method of ordinary least squares OLS 3 3 参数的最小二乘估计 参数估计 普通最小二乘法 OLS 最小二乘原理 由于不能直接观察PRF 所以用SRF 来估计它 因而 最好的估计方法是 选择 使得残差 尽可能小 3 3 参数的最小二乘估计 参数估计 普通最小二乘法 OLS 普通最小二乘法就是要选择参数 使得残差平 方和 residu

9、al sum of squares RSS 最小 即 3 3 参数的最小二乘估计 参数估计 普通最小二乘法 OLS 如何确定 的值 根据微积分 当 对 的一阶偏 导数为0时 Q达到最小 即 3 3 参数的最小二乘估计 参数估计 普通最小二乘法 OLS 以上联立方程组称为正规方程组 normal equations 求解 得 注意 即小写字母代表了 变量与其均值的离差 上面给出的估计量称为OLS估计量 OLS estimator 3 3 参数的最小二乘估计 参数估计 普通最小二乘法 OLS OLS估计量的一些重要性质 用OLS法得出的样本回归线经过样本均值点 即 残差的均值 总为0 对残差和解释

10、变量的积求和 其值为零 即 对残差与 估计的 的积求和 其值为零 即 3 3 参数的最小二乘估计 例子 数学S A T分数 3 3 参数的最小二乘估计 例子 数学S A T分数 根据公式可以得到回归结果 3 3 参数的最小二乘估计 例子 数学S A T分数 根据公式可以得到回归结果 对估计结果的解释 斜率系数0 0013表示在其他条件保持不变的情况下 家庭年 收入每增加1美元 数学S A T 分数平均提高0 0013分 截距432 4138表示 当家庭年收入为0时 数学平均分大约为 432 4138 这样的解释没有什么经济意义 对截距最好的解释是 它代表了回归模型中所有省略变量对 Y的平均影响

11、 3 3 参数的最小二乘估计 例子 受教育年限与平均小时工资 预期平均工资随受教育年限的增加而增加 回归结果 3 3 参数的最小二乘估计 例子 股票价格与利率 经济理论表明 股票价格和利率之间存在反向关系 3 3 参数的最小二乘估计 例子 股票价格与利率 看起来两个变量之间的关系不是线性的 即不是直线 因此 假设实际关系如下 回归结果为 作为比较 线性回归结果为 引发的一个重要问题 哪一个模型更好 如何进行判 断 在模型选择中使用那些检验 后面将逐一回答 3 4 参数估计的性质 古典线性回归模型 CLRM 的假定 前面我们回答了 如何估计PRF 的问题 OLS 下面我们要回答 怎样判别它是真实

12、PRF的一个好的 估计 的问题 只有假定了随机扰动项u的生成过程 才能判定SRF 对PRF拟合得是好是坏 OLS估计量的推导与随机扰动项的生成过程无关 但根据SRF进行假设检验时 就必须对随机扰动项的生成做 一些特殊的假定 否则无法进行假设检验 下面仍然沿用一元线性回归模型来讨论 3 4 参数估计的性质 古典线性回归模型 CLRM 的假定 假定1 回归模型是参数线性的 但不一定是变量线性 的 回归模型形式如下 可扩展到多个解释变量 假定2 解释变量 与随机扰动项 不相关 如果X是非随机的 该假定自动满足 即使X是随机的 如果样本容量足够大 也不会对分析产生 严重影响 3 4 参数估计的性质 古

13、典线性回归模型 CLRM 的假定 假定3 给定 扰动项的均值为零 即 3 4 参数估计的性质 古典线性回归模型 CLRM 的假定 假定4 同方差 homoscedastic 即 3 4 参数估计的性质 古典线性回归模型 CLRM 的假定 假定5 无自相关 no autocorrelation 即两个扰动 项之间不相关 3 4 参数估计的性质 古典线性回归模型 CLRM 的假定 假定6 回归模型是正确设定的 即模型不存在设定偏 差或设定误差 为什么需要以上6个假定 这些假定现实吗 如果不 满足这些假定 情况又会怎样 如何得知是否满足所 有这些假定 这些重要的问题暂时没有答案 事实上 教材 第二

14、部分 都是围绕 如果假定不满足时会怎样 而展开的 3 4 参数估计的性质 OLS估计量的方差与标准差 有了上述假定后可以计算出估计量的方差和标准差 OLS估计量是随机变量 因为其值随样本的不同而变 化 这些估计量的抽样变异性通常由估计量的方差或 其标准差来度量 OLS估计量的方差 variance 及标准差 standard error 怎么估计 3 4 参数估计的性质 OLS估计量的方差与标准差 根据下式估计 n 2 称为自由度 在一元线性回归模型中有两个参 数 在计算这两个未知参数时 失去了两个自由度 因此 虽然有n个观察值 但自由度仅为 n 2 顺便指出 称为回归标准差 standard

15、 error of the regression SER 3 4 参数估计的性质 OLS估计量的方差与标准差 数学S A T一例 教材有误 3 4 参数估计的性质 估计结果的报告 估计的数学SAT函数如下 括号内数字为标准差 OLS估计量的性质 可以概括为高斯 马尔柯夫定理 Gauss Markov theorem 如果满足古典线性回归模型的基本假定 则在所有线 性估计两种 OLS估计量具有最小方差性 即OLS估计 是最优线性无偏估计量 BLUE 具体见教材PP46 3 5 显著性检验 OLS估计量的抽样分布或概率分布 知道如何计算OLS估计量及其标准差仍然不够 必须 求出其抽样分布才能进行假

16、设检验 为了推导抽样分布 再增加一条假定 假定7 在总体回归函数 中 扰动项 服从均值为0 方差为 的正态分布 即 为什么可以作这样一个假定 3 5 显著性检验 OLS估计量的抽样分布或概率分布 可以证明 是 的线性函数 根据 正态变量的 线性函数仍服从正态分布 得知 服从正态分 布 中心极限定理 随着样本量的增加 独立同分布随机变量构造的 统计量近似服从正态分布 3 5 显著性检验 OLS估计量的抽样分布或概率分布 3 5 显著性检验 假设检验 假定 家庭年收入对学生的数学成绩没有影响 数值结果表明 因此 零假设不成立 不能仅看数值结果 抽样波动性会导致数值结果因样 本变化而不同 需要进行假设检验 怎么进行 前面指出 当我们知道估计量的抽样分布后 假设检验将不成问 题 讨论以下两种方法 1 置信区间法 2 显著性检验法 3 5 显著性检验 假设检验 能否使用上式进行假设检验 问题在哪里 问题在于真实的 是未知的 可以用 来估计它 则有 3 5 显著性检验 假设检验 置信区间法 在数学S A T一例中 共有10个观察值 因此自由度 为 10 2 8 假定 显著性水平或犯第一类错误 弃真

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号