一元线性回归模型PPT课件

资源描述

《一元线性回归模型PPT课件》由会员分享，可在线阅读，更多相关《一元线性回归模型PPT课件（68页珍藏版）》请在金锄头文库上搜索。

1、 11 第三章一元线性回归模型教材第二三章第三章一元线性回归模型 3 1回归的涵义3 2随机扰动项的来源3 3参数的最小二乘估计3 4参数估计的性质3 5显著性检验3 6拟合优度3 7预测学习要点回归模型的涵义参数的OLS估计及其性质显著性检验 3 1回归的涵义回归分析 regressionanalysis 用于研究一个变量称为被解释变量或应变量与另一个或多个变量称为解释变量或自变量之间的关系 Y代表被解释变量 X代表解释变量解释变量有多个时用X1 X2 X3等表示例商品的需求量与该商品价格消费者收入以及其他竞争性商品价格之间的关系总体回归函数 populati

2、onregressionfunction PRF 例学生的家庭收入与数学分数有怎样的关系 3 1回归的涵义 3 1回归的涵义总体回归函数 populationregressionfunction PRF 根据上面数据做散点图 3 1回归的涵义总体回归函数 populationregressionfunction PRF 上图中圆圈点称为条件均值条件均值的连线称为总体回归线总体回归线表明了Y的均值与每个X的变动关系上图近似线性的总体回归线可以表示成表示给定的X值所对应的Y的均值称为参数 parameters 也称回归系数 regressioncoefficients 称为截距

3、intercept 称为斜率 slope 斜率系数度量了X每变动一单位 Y 条件均值的变化率举例含义 3 1回归的涵义样本回归函数 sampleregressionfunction SRF 实际中往往无法获得整个总体的数据怎么估计总体回归函数即如何求参数B1 B2 通常我们仅仅有来自总体的一个样本我们的任务就是根据样本信息估计总体回归函数怎么实现 3 1回归的涵义样本回归函数 sampleregressionfunction SRF 表2 2 2 3的数据都是从表2 1中随机抽取得到的 3 1回归的涵义样本回归函数 sampleregressionfunction SRF

4、通过散点得到两条拟合样本数据的样本回归线 3 1回归的涵义样本回归函数 sampleregressionfunction SRF 可用样本回归函数 SRF 表示样本回归线其中总体条件均值的估计量并非所有样本数据都准确地落在样本回归线上因此建立随机样本回归函数其中是的估计量称为残差 residual 表示了Y的实际值与样本回归估计值的差 3 1回归的涵义样本回归函数 sampleregressionfunction SRF 回归分析根据样本回归函数估计总体回归函数 3 1回归的涵义线性回归的特殊含义对线性有两种解释变量线性和参数线性变量线性例如前面的总体

5、或样本回归函数下面的函数不是变量线性的参数线性参数B1 B2仅以一次方的形式出现下面的模型是参数非线性的本书主要关注参数线性模型从现在起线性回归 linearregression 是指参数线性的回归而解释变量并不一定是线性的 3 2随机扰动项的来源总体回归函数说明在给定的家庭收入下美国学生平均的数学分数但对于某一个学生他的数学分数可能与该平均水平有偏差可以解释为个人数学分数等于这一组的平均值加上或减去某个值用数学公式表示为其中表示随机扰动项简称扰动项扰动项是一个随机变量通常用概率分布来描述 3 2随机扰动项的来源对于回归模型称为被解释变量 expla

6、inedvariable 也称应变量或因变量 dependentvariable 称为解释变量 explanatoryvariable 也称自变量 independentvariable 称为参数 parameter 称为随机扰动项 randomerrorterm 3 2随机扰动项的来源上式如何解释可以认为在给定家庭收入水平上第i个学生的数学分数可以表达为两部分之和一是即是该收入水平上的平均数学分数这一部分称为系统或确定性部分二是称为非系统或随机成本由收入以外的因素决定此时称为随机总体回归函数 stochasticPRF 3 2随机扰动项的来源 3 2随机扰动项的来源

7、性质1 扰动项代表了未纳入模型变量的影响例如个人健康状况居住区域等等性质2 反映了人类行为的内在随机性即使模型中包括了决定数学分数的所有变量其内在随机性也不可避免这是做任何努力都无法解释的性质3 还代表了度量误差例如收入的数据可能不等于真实值性质4 奥卡姆剃刀原则即描述应该尽可能简单只要不遗漏重要的信息此时可以把影响Y的次要因素归入随机扰动项 3 3参数的最小二乘估计参数估计普通最小二乘法 OLS 根据样本回归函数估计总体回归函数要回答两个问题如何估计PRF 如何验证估计的PRF是真实的PRF的一个好的估计值这里先回答第一个问题回归分析中使用最广泛的是

8、普通最小二乘法 methodofordinaryleastsquares OLS 3 3参数的最小二乘估计参数估计普通最小二乘法 OLS 最小二乘原理由于不能直接观察PRF 所以用SRF来估计它因而最好的估计方法是选择使得残差尽可能小 3 3参数的最小二乘估计参数估计普通最小二乘法 OLS 普通最小二乘法就是要选择参数使得残差平方和 residualsumofsquares RSS 最小即 3 3参数的最小二乘估计参数估计普通最小二乘法 OLS 如何确定的值根据微积分当对的一阶偏导数为0时 Q达到最小即 3 3参数的最小二乘估计参数估计普通最小二乘法 OLS 以

9、上联立方程组称为正规方程组 normalequations 求解得注意即小写字母代表了变量与其均值的离差上面给出的估计量称为OLS估计量 OLSestimator 3 3参数的最小二乘估计参数估计普通最小二乘法 OLS OLS估计量的一些重要性质用OLS法得出的样本回归线经过样本均值点即残差的均值总为0 对残差和解释变量的积求和其值为零即对残差与估计的的积求和其值为零即 3 3参数的最小二乘估计例子数学S A T分数 3 3参数的最小二乘估计例子数学S A T分数根据公式可以得到回归结果 3 3参数的最小二乘估计例子数学S A T分数根据公式可以得到回归结果

10、对估计结果的解释斜率系数0 0013表示在其他条件保持不变的情况下家庭年收入每增加1美元数学S A T 分数平均提高0 0013分截距432 4138表示当家庭年收入为0时数学平均分大约为432 4138 这样的解释没有什么经济意义对截距最好的解释是它代表了回归模型中所有省略变量对Y的平均影响 3 3参数的最小二乘估计例子受教育年限与平均小时工资预期平均工资随受教育年限的增加而增加回归结果 3 3参数的最小二乘估计例子股票价格与利率经济理论表明股票价格和利率之间存在反向关系 3 3参数的最小二乘估计例子股票价格与利率看起来两个变量之间的关系不是线性的即不是直线

11、因此假设实际关系如下回归结果为作为比较线性回归结果为引发的一个重要问题哪一个模型更好如何进行判断在模型选择中使用那些检验后面将逐一回答 3 4参数估计的性质古典线性回归模型 CLRM 的假定前面我们回答了如何估计PRF 的问题 OLS 下面我们要回答怎样判别它是真实PRF的一个好的估计的问题只有假定了随机扰动项u的生成过程才能判定SRF对PRF拟合得是好是坏 OLS估计量的推导与随机扰动项的生成过程无关但根据SRF进行假设检验时就必须对随机扰动项的生成做一些特殊的假定否则无法进行假设检验下面仍然沿用一元线性回归模型来讨论 3 4参数估计的性质古典线性回归

12、模型 CLRM 的假定假定1 回归模型是参数线性的但不一定是变量线性的回归模型形式如下可扩展到多个解释变量假定2 解释变量与随机扰动项不相关如果X是非随机的该假定自动满足即使X是随机的如果样本容量足够大也不会对分析产生严重影响 3 4参数估计的性质古典线性回归模型 CLRM 的假定假定3 给定扰动项的均值为零即 3 4参数估计的性质古典线性回归模型 CLRM 的假定假定4 同方差 homoscedastic 即 3 4参数估计的性质古典线性回归模型 CLRM 的假定假定5 无自相关 noautocorrelation 即两个扰动项之间不相关 3 4参数估计的性质古

13、典线性回归模型 CLRM 的假定假定6 回归模型是正确设定的即模型不存在设定偏差或设定误差为什么需要以上6个假定这些假定现实吗如果不满足这些假定情况又会怎样如何得知是否满足所有这些假定这些重要的问题暂时没有答案事实上教材第二部分都是围绕如果假定不满足时会怎样而展开的 3 4参数估计的性质 OLS估计量的方差与标准差有了上述假定后可以计算出估计量的方差和标准差 OLS估计量是随机变量因为其值随样本的不同而变化这些估计量的抽样变异性通常由估计量的方差或其标准差来度量 OLS估计量的方差 variance 及标准差 standarderror 怎么估计 3 4参数估计的

14、性质 OLS估计量的方差与标准差根据下式估计 n 2 称为自由度在一元线性回归模型中有两个参数在计算这两个未知参数时失去了两个自由度因此虽然有n个观察值但自由度仅为 n 2 顺便指出称为回归标准差 standarderroroftheregression SER 3 4参数估计的性质 OLS估计量的方差与标准差数学S A T一例教材有误 3 4参数估计的性质估计结果的报告估计的数学SAT函数如下括号内数字为标准差 OLS估计量的性质可以概括为高斯马尔柯夫定理 Gauss Markovtheorem 如果满足古典线性回归模型的基本假定则在所有线性估计两种 OLS估计量具

15、有最小方差性即OLS估计是最优线性无偏估计量 BLUE 具体见教材PP46 3 5显著性检验 OLS估计量的抽样分布或概率分布知道如何计算OLS估计量及其标准差仍然不够必须求出其抽样分布才能进行假设检验为了推导抽样分布再增加一条假定假定7 在总体回归函数中扰动项服从均值为0 方差为的正态分布即为什么可以作这样一个假定 3 5显著性检验 OLS估计量的抽样分布或概率分布可以证明是的线性函数根据正态变量的线性函数仍服从正态分布得知服从正态分布中心极限定理随着样本量的增加独立同分布随机变量构造的统计量近似服从正态分布 3 5显著性检验 OLS估计量的抽样分布或概率分布 3

16、 5显著性检验假设检验假定家庭年收入对学生的数学成绩没有影响数值结果表明因此零假设不成立不能仅看数值结果抽样波动性会导致数值结果因样本变化而不同需要进行假设检验怎么进行前面指出当我们知道估计量的抽样分布后假设检验将不成问题讨论以下两种方法 1 置信区间法 2 显著性检验法 3 5显著性检验假设检验能否使用上式进行假设检验问题在哪里问题在于真实的是未知的可以用来估计它则有 3 5显著性检验假设检验置信区间法在数学S A T一例中共有10个观察值因此自由度为 10 2 8 假定显著性水平或犯第一类错误弃真的概率为5 于是有即 3 5显著性检验假设检验置信区间法整理或上式给出了的一个95 的置信区间重复上述过程 100个这样的区间中将有95个包括真实的代入得区间不包括0 所以拒绝零假设家庭年收入对数学S A T没有影响 3 5显著性检验假设检验置信区间法图形教材有误 0 000740 00187 3 5显著性检验假设检验置信区间法按照上述过程同样可得截距95 的置信区间如果则显然拒绝零假设因为上述95 的置信区间不包

展开阅读全文

一元线性回归模型PPT课件

最新文档