Matlab实现多元回归实例

上传人:平*** 文档编号:11928607 上传时间:2017-10-15 格式:DOC 页数:10 大小:221.58KB
返回 下载 相关 举报
Matlab实现多元回归实例_第1页
第1页 / 共10页
Matlab实现多元回归实例_第2页
第2页 / 共10页
Matlab实现多元回归实例_第3页
第3页 / 共10页
Matlab实现多元回归实例_第4页
第4页 / 共10页
Matlab实现多元回归实例_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《Matlab实现多元回归实例》由会员分享,可在线阅读,更多相关《Matlab实现多元回归实例(10页珍藏版)》请在金锄头文库上搜索。

1、1Matlab 实现多元回归实例(一)一般多元回归一般在生产实践和科学研究中,人们得到了参数 和因变量,nx1的数据,需要求出关系式 ,这时就可以用到回归分析的方法。如果yyfx只考虑 是线性函数的情形,当自变量只有一个时,即, 中f ,nx1时,称为一元线性回归,当自变量有多个时,即, 中 时,n1 2称为多元线性回归。进行线性回归时,有 4 个基本假定: 因变量与自变量之间存在线性关系; 残差是独立的; 残差满足方差奇性; 残差满足正态分布。在 Matlab 软件包中有一个做一般多元回归分析的命令 regeress,调用格式如下:b, bint, r, rint, stats = regr

2、ess(y,X,alpha) 或者b, bint, r, rint, stats = regress(y,X) 此时,默认 alpha 0.05.这里,y 是一个 的列向量,X 是一个 的矩阵,其中第一列是全 11n1nm向量(这一点对于回归来说很重要,这一个全 1 列向量对应回归方程的常数项) ,一般情况下,需要人工造一个全 1 列向量。回归方程具有如下形式:0myx其中, 是残差。在返回项b,bint,r,rint,stats 中, 是回归方程的系数;01mb 是一个 矩阵,它的第 行表示 的(1-alpha)置信区间;int2ii 是 的残差列向量;r 是 矩阵,它的第 行表示第 个残差

3、 的(1-alpha)置信区间;it iiir注释:残差与残差区间杠杆图,最好在 0 点线附近比较均匀的分布,而不呈现一定的规律性,如果是这样,就说明回归分析做得比较理想。 一般的, 返回 4 个值: 值、F_检验值、阈值 ,与显著性概率相关sta2Rf2的 值(如果这个 值不存在,则,只输出前 3 项) 。注释:pp(1)一般说来, 值越大越好。2R(2)人们一般用以下统计量对回归方程做显著性检验:F_检验、t_检验、以及相关系数检验法。Matlab 软件包输出 F_检验值和阈值 。一般说来,F_检验值f越大越好,特别的,应该有 F_检验值 。f(3)与显著性概率相关的 值应该满足 。如果

4、,则说明回ppalhpalh归方程中有多余的自变量,可以将这些多余的自变量从回归方程中剔除(见下面逐步回归的内容) 。这几个技术指标说明拟合程度的好坏。这几个指标都好,就说明回归方程是有意义的。例 1(Hamilton,1987)数据如下:序号 Y X1 X21 12.37 2.23 9.662 12.66 2.57 8.943 12.00 3.87 4.404 11.93 3.10 6.645 11.06 3.39 4.916 13.03 2.83 8.527 13.13 3.02 8.048 11.44 2.14 9.059 12.86 3.04 7.7110 10.84 3.26 5.1

5、111 11.20 3.39 5.0512 11.56 2.35 8.5113 10.83 2.76 6.5914 12.63 3.90 4.9015 12.46 3.16 6.96第一步 分析数据在 Matlab 软件包中分析是否具有线性关系,并作图观察,M文件opt_hanmilton_1987:x1=2.23,2.57,3.87,3.10,3.39,2.83,3.02,2.14,3.04,3.26,3.39,2.35,2.76,3.90,3.16;x2=9.66,8.94,4.40,6.64,4.91,8.52,8.04,9.05,7.71,5.11,5.05,8.51,6.59,4.9

6、0,6.96;y=12.37,12.66,12.00,11.93,11.06,13.03,13.13,11.44,12.86,10.84,11.20,11.56,10.83,12.63,12.46;corrcoef(x1,y)corrcoef(x2,y)plot3(x1,x2,y,*)得到结果:ans =1.0000 0.002530.0025 1.0000ans =1.0000 0.43410.4341 1.0000即,corrcoef(x1,y)0.0025,corrcoef(x2,y)0.4341,说明没有非常明显的单变量线性关系。图形如下:也看不出有线性关系,但是,旋转图形,可以看出所

7、有点几乎在一个平面上。这说明, 在一个平面上,满足线性关系:,12yx12axbya或者,换成一个常见的形式 012yx其中, 是残差。于是,在 Matlab 软件包中做线性多元回归,写一个 M文件opt_regress_hamilton:x1=2.23,2.57,3.87,3.10,3.39,2.83,3.02,2.14,3.04,3.26,3.39,2.35,2.76,3.90,3.16;x2=9.66,8.94,4.40,6.64,4.91,8.52,8.04,9.05,7.71,5.11,5.05,8.51,6.59,4.90,6.96;y=12.37,12.66,12.00,11.9

8、3,11.06,13.03,13.13,11.44,12.86,10.84,11.20,11.56,10.83,12.63,12.46;e=ones(15,1);x=e,x1,x2;b,bint,r,rint,stats=regress(y,x,0.05)rcoplot(r,rint)其中,rcoplot (Residual case order plot)表示画出残差与残差区间的杠杆图。执4行后得到:b =-4.51543.09701.0319bint =-4.6486 -4.38223.0703 3.12381.0238 1.0399r =0.0113-0.0087-0.0102-0.00

9、690.0101-0.0106-0.0037-0.01050.0049-0.01360.00570.0163-0.00230.01100.0071rint =-0.0087 0.0314-0.0303 0.0128-0.0301 0.0098-0.0299 0.0162-0.0106 0.0308-0.0313 0.0102-0.0252 0.0178-0.0299 0.0089-0.0174 0.0272-0.0331 0.0058-0.0161 0.0275-0.0027 0.0354-0.0236 0.0190-0.0079 0.0299-0.0156 0.0298stats =1.0e

10、+004 *0.0001 3.9222 0 0.00005即, 。124.53.097.yx置信度 95,且 ,与显著性概率 相关2.,_RF检 验 值 390.05的 ,这说明,回归方程中的每个自变量的选取,都是有意义的。.p残差杠杆图:从杠杆图看出,所有的残差都在 0 点附近均匀分布,区间几乎都位于之间,即,没有发现高杠杆点,也就是说,数据中没有强影响点、0.3,异常观测点。综合起来看,以上回归结果(回归函数、拟合曲线或曲面)近乎完美。(二)逐步回归假设已有数据 X 和 Y,在 Matlab 软件包中,使用 stepwise 命令进行逐步回归,得到回归方程 ,其中 是随机误差。naaX12

11、stepwise 命令的使用格式如下:stepwise(X,Y)注意:应用 stepwise 命令做逐步回归,数据矩阵 X 的第一列不需要人工加一个全 1 向量,程序会自动求出回归方程的常数项(intercept) 。在应用 stepwise 命令进行运算时,程序不断提醒将某个变量加入(Move in)回归方程,或者提醒将某个变量从回归方程中剔除( Move out) 。注释:使用 stepwise 命令进行逐步回归,既有剔除变量的运算,也有引入变量的运算,它是目前应用较为广泛的一种多元回归方法。在运行stepwise(X,Y)命令时,默认显著性概率 。.05例 2(Hald,1960 )Ha

12、ld 数据是关于水泥生产的数据。某种水泥在凝固时放出的热量 (单位:卡克)与水泥中 4 种化学成分所占的百分比有关:Y6:xCaoAlSiFe1232342在生产中测得 13 组数据:序号 X1 X2 X3 X4 Y1 7 26 6 60 78.52 1 29 15 52 74.33 11 56 8 20 104.34 11 31 8 47 87.65 7 52 6 33 95.96 11 55 9 22 109.27 3 71 17 6 102.78 1 31 22 44 72.59 2 54 18 22 93.110 21 47 4 26 115.911 1 40 23 34 83.812

13、 11 66 9 12 113.313 10 68 8 12 109.4求出关系式 。YfX解:(1)本问题涉及的数据是 5 维的,不能画图观察。先做异常值分析。X=7,26,6,60;1,29,15,52;11,56,8,20;11,31,8,47;7,52,6,33;11,55,9,22;3,71,17,6;1,31,22,44;2,54,18,22;21,47,4,26;1,40,23,34;11,66,9,12;10,68,8,12;Y=78.5,74.3,104.3,87.6,95.9,109.2,102.7,72.5,93.1,115.9,83.8,113.3,109.4;A=X,

14、Y;mahal(A,A)程序执行后得到结果:ans =5.68033.64846.70023.36763.38394.43004.00806.50673.08497.50165.17682.4701可以认为数据都是正常的。(2)一般多元回归。7在 Matlab 软件包中写一个 M文件 opt_cement_1:X=7,26,6,60;1,29,15,52;11,56,8,20;11,31,8,47;7,52,6,33;11,55,9,22;3,71,17,6;1,31,22,44;2,54,18,22;21,47,4,26;1,40,23,34;11,66,9,12;10,68,8,12;Y=

15、78.5,74.3,104.3,87.6,95.9,109.2,102.7,72.5,93.1,115.9,83.8,113.3,109.4;a1=ones(13,1);A=a1,X;b,bint,r,rint,stat=regress(Y,A)rcoplot(r,rint)程序执行后得到:b =62.40541.55110.51020.1019-0.1441bint =-99.1786 223.9893-0.1663 3.2685-1.1589 2.1792-1.6385 1.8423-1.7791 1.4910r =0.00481.5112-1.6709-1.72710.25083.9254-1.4487-3.17501.37830.28151.99100.9730-2.2943rint =-4.0390 4.0485-3.2331 6.2555-5.3126 1.9707-6.5603 3.1061-4.5773 5.07888-0.5623 8.4132-6.0767 3.1794-6.8963 0.5463-3.5426 6.2993-3.0098 3.5729-2.2372 6.2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号