一元线性回归模型_1课件

上传人:F****n 文档编号:88280227 上传时间:2019-04-23 格式:PPT 页数:55 大小:2.56MB
返回 下载 相关 举报
一元线性回归模型_1课件_第1页
第1页 / 共55页
一元线性回归模型_1课件_第2页
第2页 / 共55页
一元线性回归模型_1课件_第3页
第3页 / 共55页
一元线性回归模型_1课件_第4页
第4页 / 共55页
一元线性回归模型_1课件_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《一元线性回归模型_1课件》由会员分享,可在线阅读,更多相关《一元线性回归模型_1课件(55页珍藏版)》请在金锄头文库上搜索。

1、在第二章,我们以人为设计的收入与消费数据,讨论了总体回归模型与样本回归模型。本章分析一元线性回归模型的经典假定,以及经典假设下的最小二乘估计方法和估计量的统计性质、区间估计、假设检验,并运用蒙特卡罗模拟直观认识和验证最小二乘估计量的统计性质。,第三章 一元线性回归模型,3.4 例子:中国消费函数, 3.5 对最小二乘估计量统计性质的直观认识-蒙特卡洛模拟,3.3 回归参数的区间估计和假设检验,3.2 拟合优度,3.1 一元线性回归模型参数的估计,本章小结,3.1 一元线性回归模型参数的估计,一元线性回归模型是指模型中只有一个解释变量的模型,也称为简单线性回归模型,其一般形式是:,(3.1.1)

2、,Y为被解释变量,X为解释变量。因为模型中共有两个变量,所以,模型(3.1.1)也被称为双变量线性回归模型,0与1为待估参数,ui为随机误差项或随机扰动项。,一、基本假定,1、对模型与变量的假定,假定1:回归模型对参数(系数)而言是线性模型。,假定2:解释变量是外生变量。,解释变量X是外生变量,是指在重复抽样中,X 取固定不变的值。这一假定意味着我们的回归分析是条件回归分析,就是以解释变量X的给定值作为条件的。根据这一假定,有解释变量X与随机扰动项ui不相关,即:,(3.1.2),假定3:模型是正确设定的。,即模型对变量和函数形式没有设定偏误,它的确切含义将在第章中讨论。,假定4:零均值假定。

3、,即在给定解释变量的条件下,随机扰动项的条件均值为零,2、对随机扰动项的假定,假定5:同方差假定。,(3.1.4),假定6:无自相关假定。,(3.1.5),满足上述假定的线性回归模型,称为经典线性回归模型,二、普通最小二乘法(OLS),Yi的变化可以分为两部分,一部分是可以由Xi的变化解释的,另一部分来自随机扰动。Yi向Xi所解释的“平均水平”回归,这就是“回归”的含义。而斜率系数1是指,Xi每变化一个单位,Yi平均变化1个单位。0是样本回归直线的截距。,基于假定3,我们对模型(3.1.1)取条件期望,则有:,(3.1.6),即:,第一步 构造含有待估计系数的残差平方和 并对其求最小,第二步

4、对残差平方和求两个系数的偏导数 (一阶条件),(3.1.8),(3.1.7),正规方程组,对第二步的进一步演算,在(3.1.9)式中,令 , 和分别称为Xi和Yi的离差形式,也可称为对Xi和Yi的中心化处理。为方便,我们 以下分析过程中,将和号 简写为 。容易证明: (3.1.10) (3.1.11) 于是,估计量(3.1.9)可以表示为离差形式: (3.1.12) 在计量经济学中,往往以小写字母表示对均值的离差。由于 和 是从最小二乘原理推导出来的,故称为普通最小二乘估计量。将样本数据代入估计量的计算公式(3.1.12)即可求得参数的估计值。,例3.1.1:数据来源:中国统计年鉴2009,请

5、回答:我国宏观经济中的边际消费倾向是多少? 表3.1.1 2008年中国各地区城市居民人均年消费支出和可支配收入,解答,思考?,图3.1.1 样本数据的散点图和样本回归直线,样本点紧密散布在样本回归直线周围,有的样本点落在样本回归直线上,但是大多数样本点不在样本回归直线上,而是在直线上方或者下方,那么这条样本回归直线“逼近”了总体回归直线吗?为什么要用普通最小二乘法?如何度量样本回归模型对样本观测值的拟合程度?要回答这些问题,我们必须学习估计量的统计性质和模型的拟合优度等概念。,三、最小二乘估计量的统计性质,1.估计量的主要性质,(1) 线性性: 即估计量是随机样本数据的线性函数;,(2) 无

6、偏性,即估计量的期望等于总体的真实值,即:,(3) 有效性,即估计量 在所有线性无偏估计量 中具有最小方差,也称为最小方 差性,即:,(4) 渐近无偏性,即样本容量趋于无穷大时,估计量的期望趋于总体真实值,即:,复习数理统计学中的关于点估计量的优良准则!,(5)一致性,(6) 渐近有效性,即样本容量趋于无穷大时,估计量 在所有的一致估计量 中具有最小的渐近方差,即:,前三个性质也称为有限样本性质,因为一旦某个估计量具有这些性质,它们就不以样本大小而改变,拥有这些性质的估计量被称为最佳线性无偏估计量(Best Linear Unbiased Estimator,BLUE)。 后三个性质称为估计量

7、的大样本性质或渐近性质。如果估计量不具有有限样本性质,则应考察其是否具有大样本性质。,2.OLS 估计量的统计性质,线性性是指估计量 是随机变量 Yi的线性组合。,即,即在所有线性无偏估计量中,最小二乘估计量 和 具有最小方差。也就是说,如果我们能得到不同于最小二乘估计量的其他线性无偏估计量,其方差大于或者等于最小二乘估计量的方差。,由于最小二乘估计量拥有一个“好”的估计量所应具备的有限样本性质,它也拥有大样本特性,即渐近无偏性、一致性、渐近有效性。,(1)线性性,(2)无偏性,(3)有效性(最小方差性),(4)大样本性质,有关证明,(3) 要证明有效性,先计算OLS估计量 的方差,证明最小方

8、差性(有效性),总结,由以上分析可以看出,普通最小二乘估计量(ordinary least squares estimators,OLS)在经典假定下具有线性性、无偏性和最小方差性等性质,称具有这些性质的估计量为最优线性无偏估计量( best linear unbiased estimator ,BLUE)。 高斯-马尔可夫定理(Gauss-Markov theorem) 在经典假定下,普通最小二乘估计量具有线性性、无偏性和最小方差性(BLUE),即OLS估计量是最佳线性无偏估计量。,3.2 拟合优度,如图3.2.1(a)和(b)中的直线,它们分别表示由散点表示的样本数据所对应的样本回归直线(

9、OLS估计的样本回归直线),它们都是通过残差平方和最小而产生的直线,但是二者对样本观测值的拟合程度显然是不同的。这两条直线,谁拟合得更好?这就需要使用拟合优度的概念。,3.2.1,一、总离差平方和的分解,已知由一组样本观测值 得到如下样本回归直线: Y的第 个观测值与样本均值的离差 可分解为两部分之和,(3.2.1),(3.2.2),图3.2.2 总离差的分解示意图,(3.2.6),ESS称为回归平方和(explained sum of squares,ESS),反映由模型中解释变量所解释的那部分离差的大小。,二、拟合优度,ESS占Y的总离差平方和的比例,度量了回归直线对样本观测值的拟合优度。

10、这一比例记为R2 ,被称为判定系数,(3.2.8),如果样本回归直线与样本观测值完全拟合,或者说,所有的样本点全部落在样本回归直线上,则有R2=1。但是,由于样本的随机性,样本回归直线(或者估计的模型)与样本观测值完全拟合,亦即R2=1的情况很少发生。R2越大,说明在总变差中由回归解释的部分所占比重越大,拟合优度越高。反之,R2越小,说明估计的模型对样本观测值的拟合程度越差。,3.3 回归参数的区间估计和假设检验,一、回归参数估计量的概率分布,的概率分布,的标准差,的标准化变换,的标准误(Standard Error),若将正态随机变量 做标准化变换 即经过标准化变换的 均服从标准正态分布。,

11、二、回归参数的区间估计,参数估计中的区间估计,选择一个显著性水平(01),并求一个正数,使得随机区间( )包含参数 (真实值)的概率为1-,即 其中,1- 称为置信度, 称为显著性水平,而( ) ,称为具有置信水平 1- 的置信区间,也就是说,我们有 1- 的“把握”认为,置信区间覆盖了真值 。这个区间也称为 的区间估计。置信区间的两个端点称为置信上限和置信下限。,具体构造参数的区间估计,给定置信度1-,从t 分布表中查得自由度为 的临界值 ,那么t 值处在(- , )内的概率是 1-(图3.3.1的中间空白区域面积),即 即 整理(3.3.14)式得,于是得到参数的置信度为1- 的置信区间,

12、(3.3.13),(3.3.15),(3.3.16),(3.3.14),图3.3.1 t分布的1- 置信区间,三、变量的显著性检验:t 检验,四、检验统计量的 p 值,对回归参数的假设检验是在给定的显著性水平下做出的,因此当给定的显著性水平不同时,检验所得的结论很可能不同,甚至会产生相反的结论。在原假设既定、t 统计量已确定的情况下,对参数假设检验的结论与显著性水平息息相关。如何避免选择的主观性? 一个简单的方法是,在既定原假设下,计算t统计量的值,记为 ,在t分布表中可以查到 所对应的双尾(在概率趋于0的方向)的概率值,这个概率值即为t统计量的值等于 时的p值。p值参看图3.3.2,用公式表

13、示,即为 使用这个p值就勿需人为地选择显著性水平,即可方便的做出拒绝或者不拒绝原假设的结论。,当被择假设不是等于某个值,而是大于等于或者小于等于某个值时,就要使用单侧检验,包括:(1)左侧检验: : , : , 。此时临界值是 ,拒绝域是 。或者使用p值产生检验结论,见图3.3.3; (2)右侧检验: : , : , 。此时临界值是 ,拒绝域是 。或者用p值做出拒绝或者不拒绝原假设的结论,见图3.3.4。,图3.3.4 t检验法和p值检验法等价示意图-右侧检验,图3.3.3 t检验法和p值检验法等价示意图-左侧检验,3.4 例子:中国消费函数,表3.1.1 2008年中国各地区城市居民人均年消

14、费支出和可支配收入,数据来源:中国统计年鉴2009,估计检验与经济解释,从估计的结果看,估计的斜率系数为0.6647,说明城镇居民人均可支配收入每增加1元,人均消费支出平均增加0.6647元,即边际消费倾向的估计值 ,这一结果不仅符合经济理论中关于对边际消费倾向的假定,同时也说明,如果提高收入水平,能比较明显的扩大消费。估计的截距为725.3459,可以认为是自主性消费支出,即当收入为零的时候还存在的消费。但是,在计量经济学中,一般对截距不做解释,因为解释变量为0几乎没有经济学意义。以上对估计结果的分析表明,估计结果不仅与相关经济理论一致,也体现了比较明显的现实经济意义。 由(3.3.19)式

15、和(3.3.20)式可知 的t值为22.496, 的t值为1.589,给定显著性水平 ,查表得临界值为 。由 ,拒绝原假设,说明斜率 在5%的显著性水平下显著不为0,这表明,可支配收入对消费有显著影响。而 ,不能拒绝截距为零的原假设。等价地,p值分别为0.0000和0.1229分别小于和大于0.05,结论和t值检验一样。 拟合优度为 =0.946,说明模型整体上对样本数据拟合较好,即解释变量“城市居民人均年可支配收入”解释了被解释变量“城市居民人均年消费支出”的平均变化的94.6%。,估计检验与经济解释,我国居民消费主要取决于居民可支配收入。但我国个人收入在国民收入的初次分配 (在初次分配中,国民收入被分解为三个基本的部分:国家收入、企业收入、个人收入)中的占比长期偏低。因此提高消费的关键在于收入分配的改革。基于边际消费倾向的估计值,就可以得到相关乘数,由 ,投资乘数

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号