计量三-5

上传人:xh****66 文档编号:61953899 上传时间:2018-12-15 格式:PPT 页数:31 大小:138KB
返回 下载 相关 举报
计量三-5_第1页
第1页 / 共31页
计量三-5_第2页
第2页 / 共31页
计量三-5_第3页
第3页 / 共31页
计量三-5_第4页
第4页 / 共31页
计量三-5_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《计量三-5》由会员分享,可在线阅读,更多相关《计量三-5(31页珍藏版)》请在金锄头文库上搜索。

1、1,第五章,线性回归的定式偏差,2,线性回归分析、统计推断检验有效前提是模型满足假设, 这些假设不一定成立, 保证线性回归分析的可靠性和价值,必须分析模型假设被违反的可能性,判断 找出解决问题的方法。 本章先对异常值、函数关系非线性等模型定式误差,以及解释变量随机性和误差项分布等问题进行分析。,3,两变量和多元线性回归模型的第二条假设,是误差项均值为0对所有i 都成立。这条假设是保证模型变量关系真实性的基本要求,意义在于从一个方面肯定误差项只是微小随机扰动因素,可以通过多次观测的平均基本消除掉。 当经济变量关系异常值、规律性扰动、解释变量缺落、参数变化和变量关系非线性等特殊情况和模型变量关系设

2、定错误时,就可能导致线性回归模型的误差项均值非0。这些问题也称为“定式误差”。,4,第一节 变量关系非线性 第二节 异常值 第三节 规律性扰动 第四节 解释变量缺落 第五节 参数改变 (随机解释变量) (误差项非正态分布),5,第一节 变量关系非线性,前面讨论的异常值、规律性扰动、解释变量缺落等几种误差项均值非零问题,虽然是对模型假设和有效性的破坏,但并没有改变模型是随机线性函数这个基本点。 线性回归模型可能存在的更大错误,就是变量关系根本不是线性的。,6,一、问题,Eg: 两变量之间的真实关系为 但我们直接用 则 显然不可能始终为0,7,二、发现与判断,方法:残差序列分析结合问题背景分析、相

3、关理论和经验得出初步判断,然后再通过处理和结果比较加以确证。,8,三、问题处理和非线性回归,恢复变量之间的真实函数关系。然后再设法通过幂函数、对数化等数学变换等,把非线性关系转化为正确的线性回归模型。 有不少非线性变量关系无法通过初等数学变换转化为线性模型,可利用Tayler级数展开方法作非线性函数的近似线性函数,9,第二节 异常值,现实经济中常常存在这样的情况,一些突发事件或变化对经济活动、经济关系造成短暂的,但却是很显著的冲击影响。这些影响既不能被看作微小的随机扰动,但又不会决定或改变长期的经济关系,或者说经济规律。 表现为模型的误差项在相应时点存在均值非0的问题。 例(p122),10,

4、异常值的发现和判断-残差序列分析 原理:在模型假设成立的前提下,回归残差应是服从正态分布的随机变量,根据正态分布的性质,其取值应该大多数(95%、99%以上概率)分布在均值加减2到3倍标准差的范围内。 方法:(1)计算法 (2)图像法,11,计算法: (1)计算残差的标准差 (2)用S 除各个残差 若 模型在时点i处就很 可能存在异常值问题。,12,图像法(图5-1),13,问题的处理:,引进一个针对性的虚拟变换(Dummy Varible) Dummy Varible: 新的回归模型: 此时: 例5-1(p124),14,第三节 规律性扰动,除了异常值以外,周期性或其他规律性扰动,也会使线性

5、回归模型的误差项偏离零均值假设。例如:商业销量指标的季节性变化 。 解决方法:1.统计平滑处理(存在两个问题) 2.引进虚拟变量,15,第四节 解释变量缺落,除了异常值和规律性扰动以外,解释变量缺落也是引起误差项均值非0问题的常见原因。 解释变量缺落:线性回归模型设定的变量关系中,忽略了某些具有重要的,对被解释变量有趋势性影响的因素。,16,一、问题,解释变量缺落 本应为 估计时忽略 则误差项满足 不可能始终为0,违反0均值假设,17,两个时期误差项的均值分别为 除非 和 同时成立,否则的均值不可能在两个时期都始终为0。若同时成立,就意味着两个时期参数没有变化,与假设的情况不一致。因此在参数发

6、生改变时,必然导致误差项均值非0的问题。,18,二、发现与判断,方法: 经济问题背景分析和残差序列分析相结合。 解释变量缺落,19,第五节 参数改变,参数改变,也是引起误差项均值非0问题的常见原因。 参数改变:在考察期间(样本数据观测范围),变量关系中的参数发生变化,就是变量关系本身发生变化。,20,参数改变:真实的变量关系可以用0,t和(t,T)两个时期中的两个模型分别表示 简单地用同一变量关系 代表Y和X在整个0,T 时期的关系,21,二、发现与判断,模型参数改变,22,邹检验,把观测样本分为两组,两组子样本和全样本分别进行回归, 两组子样本回归的残差平方和加总得到“无约束残差平方和” 再

7、与全样本回归的残差平方和,称为“有约束的残差平方和” 构造下列F统计量 该统计量服从自由度分别为 和 的F分布。 例5.3例5.1作为邹检验的例子。,23,补充:随机解释变量,线性回归模型假设解释变量非随机 。 隐含的解释变量与模型误差项不相关 推导计算参数估计量的期望和方差比较便利 保证了参数估计量的小样本分布可知,服从与模型误差项相同的分布 。 但这些并没有保证。,24,一、随机解释变量及其影响,如果解释变量是随机的,那么最小二乘估计的性质和参数估计量的分布等都有疑问。 随机解释变量在少数情况下会影响回归分析的性质,大多数情况下以非随机解释变量为基础得到的结论仍然能成立。 随机解释变量的3

8、种情况。 书上p133-134例,25,二、工具变量法估计,工具变量法(Instrument variable estimates)是克服上述随机解释变量第三种情况困难的有效方法。 思路:是设法利用一个既与随机解释变量相关性较强,又与没有相关性或渐近不相关的“工具”变量,构造模型参数的一致估计量 。,26,设模型为: 其中解释变量不仅是随机变量,而且与有强相关性 “工具”变量: 工具变量法估计 ,27,多元线性回归分析 :假设一个多元线性回归模型有 个解释变量与误差项强相关的随机解释变量,这时候可设法找 个与误差项不相关或渐近不相关,而与 个与误差项有强相关性的解释变量相关性较强的工具变量。

9、多元线性回归的工具变量法估计的公式 (p136),28,三、参数估计量的分布性质和统计推断,随机解释变量对参数估计量分布性质的影响: (1)在小样本的情况下,即使误差项仍然服从正态分布,估计出来的参数一般不服从正态分布。 (2)基于t 分布的各种统计推断和检验仍然是有效的, 基于服从F 分布统计量的相关检验推断也仍然成立。 最小二乘估计及相关统计推断的作用不会因为解释变量的随机性受到严重影响。 可靠性有一定下降,29,补充:误差项非正态分布,两变量和多元线性回归模型的第六条假设,都是模型的随机误差项服从正态分布。 与最小二乘估计的性质关系不大 对于确定参数估计量的分布,进行相关的统计推断和检验等,有关键作用。,30,一、问题及其判断,判断服从正态分布的方法: (1)直方图检验: 比较残差频数直方图上方边缘的形态与正态分布密度函数; (2)偏斜度:判断偏斜度指标是否接近于0; (3)峰度检验: 如果峰度的估计值非常接近3则通过检验,若明显异于3则说明误差项偏离正态分布假设。,31,二、误差项非正态分布的影响,如果模型只违反误差项正态分布一条假设,关于误差项和解释变量的其余假设都成立, 最小二乘估计的线性无偏性、有效性和一致估计的性质仍然都是成立的, 相关的各种假设检验和统计推断,也基本上仍然成立有效, 分析结果和结论的可靠性会受一定影响。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号