利用excel进行线性回归分析

上传人:第*** 文档编号:31394987 上传时间:2018-02-07 格式:DOC 页数:17 大小:860KB
返回 下载 相关 举报
利用excel进行线性回归分析_第1页
第1页 / 共17页
利用excel进行线性回归分析_第2页
第2页 / 共17页
利用excel进行线性回归分析_第3页
第3页 / 共17页
利用excel进行线性回归分析_第4页
第4页 / 共17页
利用excel进行线性回归分析_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《利用excel进行线性回归分析》由会员分享,可在线阅读,更多相关《利用excel进行线性回归分析(17页珍藏版)》请在金锄头文库上搜索。

1、1文档内容1. 利用 Excel 进行一元线性回归分析2. 利用 Excel 进行多元线性回归分析1. 利用 Excel 进行一元线性回归分析第一步,录入数据以连续 10 年最大积雪深度和灌溉面积关系数据为例予以说明。录入结果见下图(图 1)。图 1第二步,作散点图如图 2 所示,选中数据(包括自变量和因变量),点击“图表向导” 图标;或者在“插入”菜单中打开“图表(H )” 。图表向导的图标为 。选中数据后,数据变为蓝色(图 2)。2图 2点击“图表向导” 以后,弹出如下对话框(图 3):图 3在左边一栏中选中“XY 散点图 ”,点击“完成”按钮,立即出现散点图的原始形式(图4):3灌 溉

2、面 积 y(千 亩 )01020304050600 10 20 30灌 溉 面 积 y(千 亩 )图 4第三步,回归观察散点图,判断点列分布是否具有线性趋势。只有当数据具有线性分布特征时,才能采用线性回归分析方法。从图中可以看出,本例数据具有线性分布趋势,可以进行线性回归。回归的步骤如下:1. 首先,打开“工具” 下拉菜单,可见数据分析选项(见图 5):图 5用鼠标双击“数据分析” 选项,弹出“ 数据分析”对话框(图 6):4图 62. 然后,选择“回归” ,确定,弹出如下选项表(图 7):图 7进行如下选择:X、Y 值的输入区域(B1:B11,C1:C11),标志,置信度(95%),新工作表

3、组,残差,线性拟合图(图 8-1)。或者:X、Y 值的输入区域(B2:B11,C2:C11 ),置信度( 95%),新工作表组,残差,线性拟合图(图 8-2)。注意:选中数据“标志” 和不选“ 标志”,X、Y 值的输入区域是不一样的:前者包括数据标志:最大积雪深度 x(米) 灌溉面积 y(千亩)后者不包括。这一点务请注意(图 8)。5图 8-1 包括数据“标志”图 8-2 不包括数据“标志”3. 再后,确定,取得回归结果(图 9)。6图 9 线性回归结果4. 最后,读取回归结果如下:截距: ;斜率: ;相关系数: ;测定系数:356.2a813.b98.0R;F 值: ;t 值: ;标准离差(

4、标准误差):97.02R45726.t;回归平方和: ;剩余平方和: ;y 的误差平方和41sSr 176Se即总平方和: 。9.t5. 建立回归模型,并对结果进行检验模型为: xy813.56.2至于检验,R、R 2、F 值、t 值等均可以直接从回归结果中读出。实际上,检验通过。有了 R 值,F 值和 t 值均可计算出来。,0.9841.0RF 值的计算公式和结果为: 8,05.22 32.945.71)9846.01()(1 Fkn 显然与表中的结果一样。T 值的计算公式和结果为: 8,05.2 3.2.109746.1tknRt 7回归结果中给出了残差(图 10),据此可以计算标准离差。

5、首先求残差的平方,然后求残差平方和 ,于是标准22)(iiiy 107.64.72.10 LniS离差为 9.8.)(12Svyknsniii于是 15.0%15038.5.649y图 10y 的预测值及其相应的残差等进而,可以计算 DW 值(参见 图 11),计算公式及结果为 751.041.)91.()3.1( )8370(9)(DW222121 Lniiii取 , , (显然 ),查表得 , 。05.k080v9.ld29.u显然,DW=0.751 ,可见有序列正相关,预测的结果令人怀疑。94.ld8图 11 利用残差计算 DW 值利用 Excel 快速估计模型的方法:2. 用鼠标指向图

6、 4 中的数据点列,单击右键,出现如下选择菜单(图 12):图 122. 点击“添加趋势线”,弹出如下选择框( 图 13):图 133. 在“分析类型” 中选择“ 线性( L)”,然后打开选项单(图 14):9图 144. 在选择框中选中“显示公式(E )”和“ 显示 R 平方值”(如图 14),确定,立即得到回归结果如下(图 15):图 表 标 题y = 1.8129x + 2.3564R2 = 0.978901020304050600 10 20 30灌 溉 面 积 y(千 亩 )线 性 (灌 溉 面 积y(千 亩 )图 15在图 15 中,给出了回归模型和相应的测定系数即拟合优度。顺便说

7、明残差分析:如果在图 8 中选中“残差图(D)”,则可以自动生成残差图(图 12)。10X Variable 1 Residual Plot-3-2-101230 5 10 15 20 25 30X Variable 1残差图 16回归分析原则上要求残差分布是无趋势的,如果在图中添加趋势线,则趋势线应该是与 x轴平行的,且测定系数很小。事实上,添加趋势线的结果如下(图 17):X Variable 1 Residual Ploty = -9E-15x + 2E-13R2 = 1E-27-3-2-101230 5 10 15 20 25 30X Variable 1残差图 17可见残差分布图基本

8、满足回归分析的要求。预测分析虽然 DW 检验似乎不能通过,但这里采用的变量相关分析,与纯粹的时间序列分析不同(时间序列分析应该以时间为自变量)。从残差图看来,模型的序列似乎并非具有较强的自相关性,因为残差分布相当随机。因此,仍有可能进行预测分析。现在假定:有人在1981 年测得最大积雪深度为 27.5 米,他怎样预测当年的灌溉面积?下面给出 Excel 2000 的操作步骤:2. 在图 9 所示的回归结果中,复制回归参数(包括截距和斜率),然后粘帖到图1 所示的原始数据附近;并将 1981 年观测的最大积雪深度 27.5 写在 1980 年之后(图 18)。11图 182. 将光标至于图 18

9、 所示的 D2 单元格中,按等于号“”,点击 F2 单元格(对应于截距 a=2.356),按 F4 键,按加号 “” ,点击 F3 单元格(对应于斜率 b=1.812),按F4 键,按乘号 “*”,点击 B2 单元格(对应于自变量 x1),于是得到表达式“=$F$2+$F$3*B2”(图 19),相当于表达式 ,回车,立即得到 ,1*bay9128.1y即 1971 年灌溉面积的计算值。图 193. 将十字光标标至于 D2 单元格的右下角,当粗十字变成细十字以后,按住鼠标左键,往下一拉,各年份的灌溉面积的计算值立即出现,其中 1981 年对应的 D12 单元格的52.212即我们所需要的预测数

10、据,即有 千亩(图 20)。21.51y12图 204. 进一步地,如果可以测得 1982 年及其以后各年份的数据,输入单元格 B13 及其下面的单元格中,在 D13 及其以下的单元格中,立即出现预测数值。例如,假定 1982 年的最大积雪深度为 米,可以算得 千亩;1983 年的最大积雪深度为7.231x32.4512y,容易得到 千亩(图 21)。7.513x89y图 21 预测结果(19811983)最后大家思考一下为什么 DW 检验对本例中的问题未必有效?132. 利用 Excel 进行多元线性回归分析【例】某省工业产值、农业产值、固定资产投资对运输业产值的影响分析。Excel 200

11、0 的操作方法与一元线性回归分析大同小异:第一步,录入数据(图 1)。图 1 录入的原始数据第二步,数据分析1. 沿着主菜单的“ 工具(T)”“数据分析(D)” 路径打开“数据分析”对话框,选择“回归”,然后“确定” ,弹出“回归”分析对话框,对话框的各选项与一元线性回归基本相同(图 2)。下面只说明 x 值的设置方法:首先,将光标置于“X 值输入区域(X )” 中(图 2);然后,从图 1 所示的 C1 单元格起,至 E19 止,选中用作自变量全部数据连同标志,这时“X 值输入区域( X)” 的空白栏中立即出现 “$C$1:$E$19”当然,也可以通过直接在“X 值输入区域(X)” 的空白栏

12、中输入“$C$1:$E$19”的办法实现这一步骤。注意:与一元线性回归的设置一样,这里数据范围包括数据标志:工业产值x1农业产值x2固定资产投资x3运输业产值 y14故对话框中一定选中标志项(图 3)。如果不设“标志”项,则“X 值输入区域(X)”的空白栏中应为“$C$2:$E$19”,“Y 值输入区域(Y)”的空白栏中则是“$F$2:$F$19” 。否则,计算结果不会准确。图 2 x 值以外的各项设置图 3 设置完毕后的对话框(包括数据标志)2. 完成上述设置以后,确定,立即给出回归结果。由于这里的“输出选项”选中了“新工作表组(P)”(图 3),输出结果在出现在新建的工作表上(图 4)。从

13、图 4 的“输出摘要(SUMMARY OUTPUT)”中可以读出:15, , , , ,04.1a05326.1b042.b0964.3b926.0R, , , , ,98622R4s579F81t 82bt。7.3bt根据残差数据,不难计算 DW 值,方法与一元线性回归完全一样。根据回归系数可以建立如下多元线性模型: 321064.0536.04.1 xxxy 由于 x 2 的回归系数 b2 的符号与事理不符, b 2 的 t 检验值为负, b 2 的绝对值很小,可以判定,自变量之间可能存在多重共线性问题。图 4 第一次回归结果3. 剔除异常变量 x2(农业产值),用剩余的自变量 x1、x

14、3 与 y 回归(图 5),回归步骤无非是重复上述过程(参见图 6,注意这里没设数据“标志”),最后给出的回归结果( 图 7)。16图 5 剔除异常变量“农业产值(x2)”图 6 回归对话框的设置(不包括数据标志)从图 7 中容易读出回归结果:, , , , ,89.0a051328.1b0912.3b94263.0R985.02R, , , 。324s74F64t 853bt17显然,相对于第一次回归结果,回归系数的符号正常,检验参数 F 值提高了,标准误差 s值降低了,t 值检验均可通过。相关系数 R 有所降低,这也比较正常 一般来说,增加变量数目通常提供复相关系数,减少变量则降低复相关系数。回归结果可以接受,建立二元回归模型如下: 89.0912.05138.03xxy或者 89.0*12*固 定 资 产 投 资 工 业 产 值 运 输 业 产 值 图 7 剔除“农业产值”后的回归结果

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号