数学建模_统计回归模型

上传人:飞*** 文档编号:30672770 上传时间:2018-01-31 格式:DOC 页数:9 大小:255KB
返回 下载 相关 举报
数学建模_统计回归模型_第1页
第1页 / 共9页
数学建模_统计回归模型_第2页
第2页 / 共9页
数学建模_统计回归模型_第3页
第3页 / 共9页
数学建模_统计回归模型_第4页
第4页 / 共9页
数学建模_统计回归模型_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《数学建模_统计回归模型》由会员分享,可在线阅读,更多相关《数学建模_统计回归模型(9页珍藏版)》请在金锄头文库上搜索。

1、第 6 组:潘光松,刘博,杜晶习题 10-6问题:某公司想用全行业的销售额作为自变量来预测公司的销售量,表中给出了 19771981年公司的销售额和行业销售额的分季度数据(单位:百万元)(1( 画出数据的散点图,观察用线性回归模型拟合是否合适。(2( 建立公司销售额对全行业的回归模型,并用 DW 检验诊断随机误差项的自相关性。(3( 建立消除了随机误差项自相关性之后的回归模型。分析与假设:表中的数据是以时间为顺序的。由于前期的销售额对后期的投资一般有明显的影响,从而对后期的后期的销售额造成影响。因此在此模型中因考虑到出现自相关型时,建立新的回归模型。记公司公司的销售额为 y,全行业的销售额为

2、x,利用 x 来建立 y 的预测模型。基本回归模型:为了大致分析 y 和 x 的关系,首先利用表中的数据作出 y 对 x 关系作出散点图,如下(见图中的+):做散点图:x=A(:,2); y=A(:,1); plot(x,y,+)图一从图一中可以看出,随着 x 的增加,y 的值有比较明显的线性增长趋势,图中的直线是用线性模型,因此可建立一元线性回归模型y=0+1x+ (1)拟合的(其中 是随机误差),这里假设 (对 t 相互独立)且服从 N(0, ).根据表中的数据,对模型(1)直接利用 matlab 统计工具箱求解、算法如下:xx=ones(20,1),x;b,bint,r,rint,sta

3、ts=regress(y,xx);hold on;yy=b(1)+b(1)*x;plot(x,yy)hold off;得到的回归系数估计值及其置信区间(=0.05), 检验统计量 R,F,P 的结果如表 1:参数 参数估计值 参数置信区间0 -1.4548 【-1.9047 -1.0048】1 0.1763 【0.1732 0.1793】R=1.0e+004 *0.0001 F=1.0e+004 *1.4888 P=1.0e+004 *0.0000表 1 模型(1)的计算结果将参数的估计值带入(1)中得到yy=-1.4548+0.1763*x (2)用 matlab 中的 restool 命令

4、得到的交互式画面见图 2,由此可以得出不同水平下的预测值及其置信区间。通过左下方的 Export 下拉式菜单。可以输出模型的统计结果。rstool(x,y) 得出 y1= 24.569+/-0.051307 当 x=147.625 时且通过 Export 下拉菜单可得出 beta 0=-1.4548,beta1=0.1763rmse(剩余标准差)= 0.086056图二自相关性诊断与处理方法从表面上来看得到的基本模型(2)拟合度非常高,接近你 100%,应该很满意了,但是 这个模型并没有考虑到我们的数据是一个时间序列(将原表中的数据打乱不影响,模型(2)的结果)。实际上对于时间序列数据做回归分

5、析时,模型的随机误差 有可能存在相关性,违背模型 关于 (对时间 t)相互独立的基本假设,其他相关因素对公司销售额的影响肯能也有时间上的延续,即误差 会出现自相关性。残差 e=y-yy, yy 为估计值e 可作为随机 误差 的估计值 ,画出 e e 的散点图,能够直观的判断 的自相关性,模型(2)的残差可在计算过程中得到表 2,以及数据 e e 的图见图 3做残差图:plot(x,r,+)t 1 2 3 4 5e -0.0282 -0.0642 0.0198 0.1616 0.0443t 6 7 8 9 10e 0.0441 0.0412 -0.0608 -0.0968 -0.1516t 11

6、 12 13 14 15e -0.1505 -0.0555 -0.0255 0.1033 0.0828t 16 17 18 19 20e 0.1034 0.0263 0.0395 -0.047 -0.0359表 2为了对 的字相关性做定量的诊断,并在确诊后得到新的结果,我 们 考虑如下模型y=0+1x+,=P+u,其中 p 是自相关系数,|p|0,则随机误差 存在正的自相关;若 p0,则随机误差 存在负的自相关。利用 D-W 检验诊断自相关现象如下:e=y-yy;ee=e(2:20,:);eee=e(1:19,:);y0=sum(ee-eee).2);y1=sum(ee.2);DW=y0/y1

7、;p=1-0.5*DW;算出y0 = 0.0980 y1 = 0.1326DW = 0.7388 p = 0.6306因为 DW2(1-p),所以 0DW4,若 p 的估计值在 0 附近,则 DW 的值在 2 附近, 的自相关行很弱,若 p 在正负 1 附近, 则 DW 接近 0 或 4, 的自相关性很强。加入自相关后的模型利用表 2 给出的残差 e,根据以上式子可得出 DW=0.7388,对于显著性水平=0.05,n=20,k=2,查 D-W 分布表,得到 检验的临界 值 dL=1.2 和 dU=1.4.现在 DWdL,因此可以认为随即误差存在正自相关,且 p 可得出=0.6306。以 p

8、的估计值带入(3)和(4)做变换,利用变换后的数据 y4,x4 估计模型(5)的参数,得到的表见表 3,还可以得出剩余标准差 rmse=0.08828.y2=y(2:20,:)y3=y(1:19,:)x2=x(2:20,:);x3=x(1:19,:);y4=y2-y3*p; (3)x4=x2-x3*p (4)yyy= y=0+1x+u, 0=0(1-p) (5)b1,bint1,r1,rint1,stats1=regress(y4,ones(19,1),x4);最后将模型(5)的变量还原为原始变量。得到的结果如下yyy=-0.3951+0.6306*y3+0.1738*x2-0.1096*x3

9、;表 3参数 参数估计值 参数置信区间0 -0.3951 -0.7481 -0.04221 0.1738 【0.1675 0.1800】R=1.0e+003 *0.0010 F=1.0e+003 *3.4621 P=1.0e+003 *0.0000结果极其预测从机理上看,加入自相关的模型(5)更为合理。将原表中的数据和得到的两个新的模型进行比较,可以得到如下表。以及下图e1=yyyy-yyy;t=2:20;subplot(1,2,1);plot(y2,yyy,+)hold on;yyyy=yy(2:20,:);plot(y2,yyyy,o)hold off;subplot(1,2,2);plo

10、t(t,ee,+)hold on;plot(t,e1,o)t y(实际数据) yy(模型 1) yyy(模型 2) ee e12 21.4 21.464 21.464 -0.0642 4.00E-063 21.96 21.94 21.915 0.01979 0.025214 21.52 21.358 21.399 0.16158 -0.040265 22.39 22.346 22.456 0.0443 -0.110476 22.76 22.716 22.756 0.04407 -0.040087 23.48 23.439 23.472 0.04124 -0.0338 23.66 23.721

11、23.755 -0.06084 -0.033679 24.1 24.197 24.162 -0.09685 0.03493410 24.01 24.162 24.109 -0.15159 0.0528911 24.54 24.69 24.595 -0.15049 0.09522412 24.3 24.356 24.27 -0.05552 0.08505613 25 25.025 24.988 -0.02546 0.0376614 25.64 25.537 25.517 0.10327 0.0199715 26.36 26.277 26.332 0.08281 -0.0552716 26.98 26.877 26.917 0.10339 -0.0404917 27.52 27.494 27.544 0.02634 -0.0500718 27.78 27.74 27.744 0.03952 -0.0034919 28.24 28.287 28.293 -0.04701 -0.0062620 28.78 28.816 28.765 -0.03591 0.050926

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号