逐步回归分析

上传人:206****923 文档编号:37534270 上传时间:2018-04-18 格式:DOC 页数:7 大小:136.50KB
返回 下载 相关 举报
逐步回归分析_第1页
第1页 / 共7页
逐步回归分析_第2页
第2页 / 共7页
逐步回归分析_第3页
第3页 / 共7页
逐步回归分析_第4页
第4页 / 共7页
逐步回归分析_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《逐步回归分析》由会员分享,可在线阅读,更多相关《逐步回归分析(7页珍藏版)》请在金锄头文库上搜索。

1、回归分析回归分析 MATLABMATLAB 工具箱工具箱一、多元线性回归一、多元线性回归多元线性回归:ppxxy.1101、确定回归系数的点估计值: 命令为:b=regress(Y, X )b 表示pb.10Y 表示nYYYY.21X 表示npnnppxxxxxxxxxX.1.1.12122221112112、求回归系数的点估计和区间估计、并检验回归模型: 命令为:b, bint,r,rint,stats=regress(Y,X,alpha) bint 表示回归系数的区间估计. r 表示残差. rint 表示置信区间. stats 表示用于检验回归模型的统计量,有三个数值:相关系数 r2、F

2、值、与 F 对应的概率 p.说明:相关系数越接近 1,说明回归方程越显著;时拒绝,F 越2r) 1,(1knkFF0H大,说明回归方程越显著;与 F 对应的概率 p时拒绝 H0,回归模型成立.alpha 表示显著性水平(缺省时为 0.05) 3、画出残差及其置信区间. 命令为:rcoplot(r,rint) 例 1.如下程序. 解:(1)输入数据.x=143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164;X=ones(16,1) x;Y=88 85 88 91 92 93 93 95 96 98 97 96 98 99

3、100 102; (2)回归分析及检验.b,bint,r,rint,stats=regress(Y,X)b,bint,stats 得结果:b = bint =-16.0730 -33.7071 1.56120.7194 0.6047 0.8340stats =0.9282 180.9531 0.0000即;的置信区间为-33.7017,1.5612, 的置信区间为0.6047,0.834;7194. 0,073.161001r2=0.9282, F=180.9531, p=0.0000,我们知道 p0.05 就符合条件, 可知回归模型 y=-16.073+0.7194x 成立.(3)残差分析,

4、作残差图. rcoplot(r,rint)268 013 s r 从残差图可以看出,除第二个数据外,其余数据的残差离零点均较近,且残差的置信区间均包 含零点,这说明回归模型 y=-16.073+0.7194x 能较好的符合原始数据,而第二个数据可视为异 常点. (4)预测及作图. z=b(1)+b(2)*xplot(x,Y,k+,x,z,r)二、多项式回归二、多项式回归 (一一)一元多项式回归一元多项式回归. 1、一元多项式回归:1121.mmmmaxaxaxay(1)确定多项式系数的命令:p,S=polyfit(x,y,m) 说明:x=(x1,x2,xn),y=(y1,y2,yn);p=(a

5、1,a2,am+1)是多项式 y=a1xm+a2xm-1+amx+am+1 的系数;S 是一个矩阵,用来估计预测误差. (2)一元多项式回归命令:polytool(x,y,m) 2、预测和预测误差估计. (1)Y=polyval(p,x)求 polyfit 所得的回归多项式在 x 处的预测值 Y; (2)Y,DELTA=polyconf(p,x,S,alpha)求 polyfit 所得的回归多项式在 x 处的预测值 Y 及预测 值的显著性为 1-alpha 的置信区间 YDELTA;alpha 缺省时为 0.5.例 1. 观测物体降落的距离 s 与时间 t 的关系,得到数据如下表,求 s. (

6、关于 t 的回归方程)2ctbtas t (s)1/302/303/304/305/306/307/30s (cm)11.8615.6720.6026.6933.7141.9351.13t (s)8/309/3010/3011/3012/3013/3014/30s (cm)61.4972.9085.4499.08113.77129.54146.48解法一:直接作二次多项式回归. t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;p,

7、S=polyfit(t,s,2) 得回归模型为:1329. 98896.652946.4892tts解法二:化为多元线性回归. t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48; T=ones(14,1) t (t.2); b,bint,r,rint,stats=regress(s,T); b,stats 得回归模型为:22946.4898896.651329. 9tts预测及作图: Y=polyconf(p,t,S) plot(

8、t,s,k+,t,Y,r)(二二)多元二项式回归多元二项式回归 多元二项式回归命令:rstool(x,y,model, alpha) 说明:x 表示 nm 矩阵;Y 表示 n 维列向量;alpha:显著性水平(缺省时为 0.05);model 表示由下列 4 个模型中选择 1 个(用字符串输入,缺省时为线性模型):linear(线性):mmxxyL110purequadratic(纯二次): njjjjmmxxxy12 110Linteraction(交叉): mkjkjjkmmxxxxy1110Lquadratic(完全二次): mkjkjjkmmxxxxy,1110L例 1. 设某商品的需

9、求量与消费者的平均收入、商品价格的统计数据如下,建立回归模型,预 测平均收入为 1000、价格为 6 时的商品需求量.需求量10075807050659010011060收入1000600 1200500300400130011001300300 价格5766875439解法一:选择纯二次模型,即.2 2222 11122110xxxxy直接用多元二项式回归: x1=1000 600 1200 500 300 400 1300 1100 1300 300; x2=5 7 6 6 8 7 5 4 3 9; y=100 75 80 70 50 65 90 100 110 60; x=x1 x2;

10、rstool(x,y,purequadratic)在左边图形下方的方框中输入 1000,右边图形下方的方框中输入 6,则画面左边的“Predicted Y”下方的数据变为 88.47981,即预测出平均收入为 1000、价格为 6 时的商品需求量为 88.4791. 在画面左下方的下拉式菜单中选”all”, 则 beta、rmse 和 residuals 都传送到 Matlab 工作区中. 在 Matlab 工作区中输入命令:beta, rmse 得结果:beta =110.53130.1464-26.5709-0.00011.8475rmse =4.5362 故回归模型为:2 22 1218

11、475. 10001. 05709.261464. 05313.110xxxxy 剩余标准差为 4.5362, 说明此回归模型的显著性较好.解法二:将化为多元线性回归:2 2222 11122110xxxxyX=ones(10,1) x1 x2 (x1.2) (x2.2); b,bint,r,rint,stats=regress(y,X); b,stats 结果为: b =110.53130.1464-26.5709-0.00011.8475stats =0.9702 40.6656 0.0005三、非线性回归三、非线性回归 1、非线性回归: (1)确定回归系数的命令:beta,r,J=nli

12、nfit(x,y,model, beta0) 说明:beta 表示估计出的回归系数;r 表示残差;J 表示 Jacobian 矩阵;x,y 表示输入数据 x、y 分别为矩阵和 n 维列向量,对一元非线性回归,x 为 n 维列向量;model 表示是事先用 m-文件定义的非线性函数;beta0 表示回归系数的初值. (2)非线性回归命令:nlintool(x,y,model, beta0,alpha) 2、预测和预测误差估计: Y,DELTA=nlpredci(model, x,beta,r,J) 表示 nlinfit 或 nlintool 所得的回归函数在 x 处的预测值 Y 及预测值的显著性

13、为 1-alpha 的置 信区间 YDELTA. 例 1. 如下程序.解:(1)对将要拟合的非线性模型 y=a,建立 m-文件 volum.m 如下:xbe/function yhat=volum(beta,x)yhat=beta(1)*exp(beta(2)./x); (2)输入数据:x=2:16;y=6.42 8.20 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.60 10.80 10.60 10.90 10.76;beta0=8 2; (3)求回归系数:beta,r ,J=nlinfit(x,y,volum,beta0);beta (4)运行结果:

14、beta =11.6036-1.0641 即得回归模型为:xey10641. 16036.11(5)预测及作图: YY,delta=nlpredci(volum,x,beta,r ,J);plot(x,y,k+,x,YY,r)四、逐步回归四、逐步回归 1、逐步回归的命令:stepwise(x,y,inmodel,alpha)说明:x 表示自变量数据,阶矩阵;y 表示因变量数据,阶矩阵;inmodel 表示矩阵mn1n 的列数的指标,给出初始模型中包括的子集(缺省时设定为全部自变量);alpha 表示显著性水 平(缺省时为 0.5). 2、运行 stepwise 命令时产生三个图形窗口:Step

15、wise Plot,Stepwise Table,Stepwise History. 在 Stepwise Plot 窗口,显示出各项的回归系数及其置信区间. (1)Stepwise Table 窗口中列出了一个统计表,包括回归系数及其置信区间,以及模型的统计量 剩余标准差(RMSE)、相关系数(R-square)、F 值、与 F 对应的概率 P. 例 1. 水泥凝固时放出的热量 y 与水泥中 4 种化学成分 x1、x2、x3、 x4 有关,今测得一组 数据如下,试用逐步回归法确定一个线性模型.序号12345678910111213x17111117113122111110x226295631525571315447406668x3615886917221842

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号