第三讲MATLAB预测1回归分析

上传人:壹****1 文档编号:593547068 上传时间:2024-09-25 格式:PPT 页数:21 大小:509KB
返回 下载 相关 举报
第三讲MATLAB预测1回归分析_第1页
第1页 / 共21页
第三讲MATLAB预测1回归分析_第2页
第2页 / 共21页
第三讲MATLAB预测1回归分析_第3页
第3页 / 共21页
第三讲MATLAB预测1回归分析_第4页
第4页 / 共21页
第三讲MATLAB预测1回归分析_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《第三讲MATLAB预测1回归分析》由会员分享,可在线阅读,更多相关《第三讲MATLAB预测1回归分析(21页珍藏版)》请在金锄头文库上搜索。

1、先来看两个例子:先来看两个例子: 问题1 (血压与年龄)为了了解血压随着年龄的增长而升高的关系,调查了30个成年人的血压,如表所示,我们希望用这组数确定血压与年龄之间的关系,并且由此从年龄预测血压可能的变化范围。表 1序号血压年龄序号血压年龄序号血压年龄11443911162642113636221547121505622142503138451314059231203941454714110342412021516265151284225160446142461613048261585371706717135452714463812442181141828130299158671911620

2、29125251015456201241930175692021/5/231模型模型:记血压为y,年龄为x,可以做出如上图所示的散点图,从图形上直观的可以看出,y与x大致呈线性关系,即有:需要由数据确定系数 的估计值 。此函数为一元线性函数!2021/5/232 问题2 (血压与年龄,体重指数,吸烟习惯) 世界卫生组织颁布的“体重指数”的定义是体重(kg)除以身高(m)的平方,下表给出了30个人的体重指数等数据,其中,0表示不吸烟,1表示吸烟,怎么考虑吸烟这个因素,此因素对于血压升高有影响吗,并对体重指数为25,50岁的吸烟者的血压做出预测。表 2序号 血压 年龄体重指数吸烟习惯序号 血压 年

3、龄体重指数吸烟习惯序号 血压 年龄体重指数吸烟习惯11443924.20111626428.01211363625.0022154731.11121505625.80221425026.2131384522.60131405927.30231203923.5041454724.01141103420.10241202120.3051626525.91151284221.70251604427.1161424625.10161304822.21261585328.6171706729.51171354527.40271446328.3081244219.70181141818.802813029

4、22.0191586727.21191162022.60291252525.30101545619.30201241921.50301756927.412021/5/233模型:模型:记血压为 ,年龄为 ,体重指数为 ,吸烟习惯为 ,用Matlab将 与 的数据做散点图,看出大致也呈线性关系,建立模型:由数据估计系数 ,也可看做曲面拟合(其实为超平面)2021/5/234多元线性回归多元线性回归 b=regress( Y, X )1、确定回归系数的点估计值:确定回归系数的点估计值:第三讲第三讲 MATLAB预测方法(预测方法(1)回归分析)回归分析2021/5/2353、画出残差及其置信区间:

5、画出残差及其置信区间: rcoplot(r,rint)2、求回归系数的点估计和区间估计、并检验回归模型:求回归系数的点估计和区间估计、并检验回归模型: b, bint,r,rint,stats=regress(Y,X,alpha)回归系数的区间估计残差用于检验回归模型的统计量,有三个数值:R2、F值、与F对应的概率p、以及残差的方差的估计值置信区间 显著性水平(缺省时为0.05 )2021/5/236问题1的求解:y=;%已知的因变量数组x=;%已知的自变量数组n=;%已知的数据容量X=ones(n,1),x;%1与自变量组成的输入矩阵b,bint,r,rint,s=regress(y,X);

6、%回归分析程序(显著性水平为0.05)b, bint, s,%输出回归系数及其置信区间和统计量 rcoplot(r,rint) %残差及其置信区间作图输出结果为:b=98.40840.9732bint = 78.7484 118.0683 0.5601 1.3864s = 0.4540 23.2834 0.0000 273.71372021/5/237结果整理为下表:R2=0.4540 F=23.2834 p0.001 s2=273.71370.5601 1.38640.973274.7484, 118.068398.4084回归系数置信区间回归系数估计值回归系数 从以下几点可以看出模型是有效

7、的:参数的置信区间不含0点;p小于显著性水平;用Matlab可以求出F1-(1,n-2)=4.1960,显然小于F值。 但是由于1的置信区间过长,R2较小,说明模型的精度不高!2021/5/238残差图如图所示:图中第二个点的残差置信区间中不包含0点,由于残差服从均值为0的正态分布,因此可以认为这个点为异常数据,偏离数据整体的变化范围,应该剔除,重新进行回归分析!残差与残差区间杠杆图,最好在0点线附近比较均匀的分布,而不呈现一定的规律性,如果是这样,就说明回归分析做得比较理想。2021/5/239剔除第二个点后得到的结果:R2=0.7123 F=66.8358 p0.0001 s2=91.43

8、050.7140, 1.19250.953385.4771, 108.255996.8665回归系数置信区间回归系数估计值回归系数对50岁的人血压进行预测,得到结果为:根据预测区间 ,可以得到其置信度为0.95的置信区间为:125.7887,163.2708.2021/5/2310同样方法做问题二第一次做多元回归结果:R2=0.6855 F=18.8906 p0.0001 s2=169.7917-0.0758 0.79650.36043.5537 87.173645.3636回归系数置信区间回归系数估计值回归系数3.090611.82461.0530 5.1281-0.1482 23.7973

9、通过残差分析图可以得到第2个点和第10个点为异常点,删除后重新进行回归分析,可以得到下面表:2021/5/2311R2=0.8462 F=44.0087 p0.0001 s2=53.66040.1273 0.73320430329.9064 87.113858.5101回归系数置信区间回归系数估计值回归系数2.344910.30650.8509 3.83893.3878 17.2253用上面的参数通过计算可以得到:50岁,体重指数为25,吸烟的人的血压预测为:148.9525置信度为0.95的置信区间为:134.5951,163.30992021/5/2312多多 项项 式式 回回 归归 (一

10、)一元多项式回归(一)一元多项式回归 (1)确定多项式系数的命令:p,S=polyfit(x,y,m)(2)一元多项式回归命令:polytool(x,y,m)1、回归:、回归:y=a1xm+a2xm-1+amx+am+12、预测和预测误差估计:、预测和预测误差估计:(1)Y=polyval(p,x)求polyfit所得的回归多项式在x处 的预测值Y;(2)Y,DELTA=polyconf(p,x,S,alpha)求polyfit所得的回归多项式在x处的预测值Y及预测值的显著性为1-alpha的置信区间Y DELTA;alpha缺省时为0.052021/5/2313方法一方法一 直接作二次多项式

11、回归:直接作二次多项式回归: t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48; p,S=polyfit(t,s,2)得回归模型为 :2021/5/2314方法二方法二化为多元线性回归:化为多元线性回归:t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;T=ones(1

12、4,1) t (t.2);b,bint,r,rint,stats=regress(s,T);b,stats得回归模型为 :Y=polyconf(p,t,S) plot(t,s,k+,t,Y,r)预测及作图预测及作图2021/5/2315(二)多元二项式回归(二)多元二项式回归命令:rstool(x,y,model, alpha)nm矩阵显著性水平(缺省时为0.05)n维列向量2021/5/2316 例例2 设某商品的需求量与消费者的平均收入、商品价格的统计数 据如下,建立回归模型,预测平均收入为1000、价格为6时 的商品需求量.方法一方法一 直接用多元二项式回归:x1=1000 600 12

13、00 500 300 400 1300 1100 1300 300;x2=5 7 6 6 8 7 5 4 3 9;y=100 75 80 70 50 65 90 100 110 60;x=x1 x2; rstool(x,y,purequadratic)2021/5/2317 点击画面左下方的Export按钮,则beta、rmse和residuals都传送到Matlab工作区中.在左边图形下方的方框中输入1000,右边图形下方的方框中输入6。 则画面左边的“Predicted Y”下方的数据变为88.47981,即预测出平均收入为1000、价格为6时的商品需求量为88.4791.2021/5/2318在Matlab工作区中输入命令: beta, rmse2021/5/2319结果为: b = 110.5313 0.1464 -26.5709 -0.0001 1.8475 stats = 0.9702 40.6656 0.0005方法二方法二将 化为多元线性回归:2021/5/2320部分资料从网络收集整理而来,供大家参考,感谢您的关注!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号