第五章回归分析预测法

上传人:八婆 文档编号:495577 上传时间:2017-03-16 格式:DOC 页数:13 大小:93.50KB
返回 下载 相关 举报
第五章回归分析预测法_第1页
第1页 / 共13页
第五章回归分析预测法_第2页
第2页 / 共13页
第五章回归分析预测法_第3页
第3页 / 共13页
第五章回归分析预测法_第4页
第4页 / 共13页
第五章回归分析预测法_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《第五章回归分析预测法》由会员分享,可在线阅读,更多相关《第五章回归分析预测法(13页珍藏版)》请在金锄头文库上搜索。

1、1第一节 一元线性回归分析预测法一、 概念(思路)根据预测变量(因变量)Y 和影响因素(自变量)X 的历史统计数据,建立一元线性回归方程 ,然后代入 X 的预测值,求出Y 的预测值的方法。基本公式:y=a+a、 b 为回归系数,是未知参数。基本思路:1、 利用 X,Y 的历史统计数据,求出合理的回归系数:a 、b,确定出回归方程2、 根据预计的自变量 x 的取值,求出因变量 y 的预测值。二、 一元线性回归方程的建立1、 使用散点图定性判断变量间是否存在线性关系例:某地区民航运输总周转量和该地区社会总产值由密切相关关系。年份 总周转量(亿吨公里)Y 社会总产值(百亿元)02 63 84 15

2、86 27 38 522、 使用最小二乘法确定回归系数使实际值与理论值误差平方和最小的参数取值。对应于自变量 测值(理论值)为 b+m*际值 yi,y ,求 a、b 的值。使用微积分中求极值的方法,得:由下列方程代表的直线的最小二乘拟合直线的参数公式:其中 m 代表斜率 ,b 代表截距。某 地 区 民 航 运 输 总 周 转 量 和 社 会 总 产 值 关 系 图101112131415161718192020 25 30 35 40 45 50 55 60ii ( 223一元线性回归 回归方程的显著性检验判断 X、Y 之间是否确有线性关系,判定回归方程是否有意义。有两类检验方法:相关系数检验

3、法和方差分析法1、 相关系数检验法构造统计量 r )()( )()( 2222 22 ii ii ,|r| 的大小反映了两个变量间线性关系的密切程度,利用它可以判断两个变量间的关系是否可以用直线方程表示。r 值 两变量之间的关系r=1 完全正相关1r0正相关,越接近 1,相关性越强。越接近 0,相关性越弱r=0 不线性相关40r接近关性越强;越接近 0,相关性越弱r=全负相关两个变量是否存在线性相关关系的定量判断规则: 对于给定的置信水平 ,从相关系数临界值表中查出 r 临 (把其与用样本计算出来的统计量 较:若|r 0|r 临 (成立,则认为 X、Y 之间存在线性关系,回归方程在 水平上显著

4、。差异越大,线性关系越好。反之则认为不显著,回归方程无意义,变量间不存在线性关系。其中:n 为样本数。2、 方差分析法:方差分析的基本特点是把因变量的总变动平方和分为两部分,一部分反映因变量的实际值与用回归方程计算出的理论值之差,一部分反映理论值与实际值的平均值之差。Y 的总变差=Y 的残余变差+Y 的说明变差,离差平方和=剩余平方和+回归平方和5yi ()()( )()(222 22差 、 可 解 释 变 差 , 记 为的 影 响 造 成 的 , 说 明 变对由 于 为差 、 不 可 解 释 变 差 , 记的 影 响 造 成 的 , 残 余 变以 外 其 它 因 素 对除 了 离 程 度 ,

5、 记 为个 数 据 和 其 平 均 值 的 偏回归平方和 U 与剩余平方和 Q 相比越大,说明回归效果越好。注:在方差分析中,已被解释的和未被解释的变差除以相应的自由度的个数即变为方差。Y 的方差是 Y 的总偏差平方和除以 解释的方差等于被解释的变差(因为回归只比估计 Y 的均值多用一个约束条件),残余方差等于残差偏差平方和除以 差的方差 误差方差的无偏且一致的估计(S 叫做回归标准差)S 2=Q/(量判断回归有效性有两种方法:(1)可决系数检验法拟合优度统计量;判定系数 :r 2=Q/(复相关系数检验法:构造统计量 R= )判断规则:对于给定的置信度 ,从相关系数 r 分布表中查出 r 临

6、(,把其与用样本计算出来的统计量 较:6若 R0r 临 (立,则认为回归方程在 水平上显著。反之则认为不显著,回归方程无意义,变量间不存在线性关系。(2)F 检验法:构造统计量 F=(U/Q/(其中:m 为变量个数(总数); n 为样本数。统计量 F 服从第一自由度为 二自由度为 F(布。F=1(断规则:对于给定的置信度 ,从 F 分布表中查出 ,把其与用样本计算出来的统计量 较:若 (立,则认为回归方程在 水平上显著。反之则认为不显著,回归方程无意义,变量间不存在线性关系。四、 回归方程没有通过检验的原因1、 定性分析选择的各变量间,本来不存在因果关系。定性分析设想不准确。2、 选择的变量间

7、存在因果关系,但还存在其它起着更重要作用的变量尚未列入模型之中。3、 选择变量之间的关系是非线性关系。五、 利用检验通过的回归方程进行预测y=给定 x 值,则 y 的预测值为 8=准误差:S= e2)/(第二节 一元非线性回归分析预测法思路:与一元线性回归分析基本相同。即通过变量替换将非线性方程转化为线性方程;使用最小二乘法建立线性回归方程;在通过逆变换将线性方程转化为非线性方程。函数的线性变换及逆变换是个数学问题,不讲了。例题,参见 160 页:航空货物周转量=a*(社会总产值) 196 页,场空运需求预测202 页,利雅得国际机场业务量预测第三节 多元回归分析一、 思路多元非线性回归分析转

8、换为多元线性回归分析,多元线性回归分析,与一元线性回归分析基本相同,只是在自变量的选定上、求解回归方程及统计检验等方面比一元回归要复杂一些。设多元线性回归模型为:y=b 0+b1*x1+b2*+bm*参数求法为最小二乘法:y i-(b 0+b1*b2*+bm*) 28分别对 偏导数,偏导数等于 0 时,上式取得最小值。可以得到 m+1 个关于 标准方程,使用线性代数中的行列式解法,可以求出回归系数 二元回归分析为例,说明多元回归方程的建立1、 定性判断得知,因变量 Y 与自变量 在线性相关关系。模型形式为:y=b 0+b1*x1+b2*确定回归系数 b0、b 1、b 2,最小二乘法。分别对 b

9、0、b 1、b 2 求偏导,令偏导数=0,构成如下方程组: 11201 22102 112100 0)( 0)(2整 理 得 : )()(2121211211 :9手工列表计算:三、 回归方程的统计检验1、 回归方程的显著性检验,检验回归方程的有效性检验方法有:F 检验法、复相关系数检验法2、 回归系数的显著性检验,检验回归系数的有效性,检验方法有:t 检验法构造统计量 m 为变量个数; n 为样本数。统计量 t 服从自由度为 t(分布。2 211212)( j)( 个 元 素第的 拟 矩 阵 的 对 角 线 上 的为 矩 阵21212112 2121212110 得 :10判断规则:对于给定

10、的置信度 ,从 t 分布表中查出 (把其与用样本计算出来的统计量 较:若 t0t (立,则认为回归方程在 水平上显著。反之则认为不显著,回归系数无意义,变量间不存在线性相关关系。统计假设检验总结:对于一元回归,四种检验方法选一即可;对于多元回归必须进行 t 检验和 R、F 间严重的一种。检验目的 检验方法 统计量 判断规则相关系数检验法 检验回归方程的有效性 F 检验 验 例题:国外预测模型简介全行业运量预测五、 几个基本问题及内在假设1、 自变量的选择(回归分析测法的程序)1) 确定预测变量2) 确定影响预测变量的因素定性分析,具有经济上的意义和内在的因果关系。3) 收集整理预测变量及其影响

11、因素的历史统计资料114) 分析因变量和自变量的关系,确定回归模型定量分析,因变量与自变量、自变量之间的相关系数,判别因变量和自变量是否显著相关,显著相关的影响因素作为自变量;同时与因变量不相关或与某个自变量高度线性相关的自变量,应予剔除。实践经验确定散点图分析确定理论试算(计算拟和误差(预测误差),选出拟和程度最好的模型5) 求解模型参数,建立回归方程6) 检验回归方程的有效性7) 利用检验通过的回归方程进行预测,并确定预测值的置信区间2、 多元共线性(多重共线性)1) 概念:回归分析中,自变量之间存在着相关关系,称这种关系为多元共线性。多元回归分析的假设是自变量之间是独立的。得出的参数估计

12、值是不可靠的。例如:某省宏观经济模型中,建筑业产值=年工业总产值+年建筑业产值负号的出现很难解释,上年工业总产值和上年建筑业产值存在共线性。122) 检验多元共线性的方法:U 2(布Q 2(布 2(分布拟和优度判定系数: 判定系数法:把某自变量用其它自变量进行回归计算,计算相应的判定系数 大,说明本自变量可以用其它自变量的线性组合替代,存在多重共线性。或者用因变量分别与含有本自变量或不含有本自变量的自变量组合进行回归计算,若两者计算的判定系数差不多,则说明本自变量与其它自变量间存在多元共线性。 逐步回归法:逐个引进自变量,根据 变化情况判断是否存在多重共线性。若 化显著,则不存在多重共线性,应

13、引入;若 显著变化,则无需引入。 偏相关系数检验法,计算两两变量间的相关系数,进行分析检验。3、 自相关(序列相关)概念:若随机误差项在不同样本之间存在相关性,e i 与 关,则称为序列相关;较多的是 之间序列相关,称为自相关自相关的检验:)1/(2达宾沃尔森检验计算出 后,查达宾 沃尔森检验表判定是否存在自相关。 冯诺曼比检验 回归检验4、 线性假设回归的另一假设是线性假设,因变量和自变量间的关系可以用线性表示出来。无法将其转化为线性的回归方程,不能采用回归分析方法,而要采取别的方法,如仿真方法。5、 样本数据样本数据的多少,影响变量个数的选择。5 个数据,一个自变量;三十个数据,最多只能有 5 个自变量。有 20 个到 30 个样本数据,预测精度较高。第四节 自回归分析实质是时间序列分析法利用预测变量本身的时间序列在不同时期取值之间存在的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 咨询培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号