回归分析建模方法

上传人:简****9 文档编号:111472310 上传时间:2019-11-02 格式:PDF 页数:42 大小:2.44MB
返回 下载 相关 举报
回归分析建模方法_第1页
第1页 / 共42页
回归分析建模方法_第2页
第2页 / 共42页
回归分析建模方法_第3页
第3页 / 共42页
回归分析建模方法_第4页
第4页 / 共42页
回归分析建模方法_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《回归分析建模方法》由会员分享,可在线阅读,更多相关《回归分析建模方法(42页珍藏版)》请在金锄头文库上搜索。

1、曲线拟合问题的特点是,根据得到的若干有关变量的 一组数据,寻找因变量与(一个或多个)自变量之间的一 个函数,使这个函数对该组数据拟合得最好。通常函数的 形式可以由经验、先验知识或对数据的直观观察决定,要 作的工作就是由数据用最小二乘法(不用最小一乘法)计 算函数中的待定系数 曲线拟合问题的特点是,根据得到的若干有关变量的 一组数据,寻找因变量与(一个或多个)自变量之间的一 个函数,使这个函数对该组数据拟合得最好。通常函数的 形式可以由经验、先验知识或对数据的直观观察决定,要 作的工作就是由数据用最小二乘法(不用最小一乘法)计 算函数中的待定系数. 第第4章回归分章回归分析析 简单地说,回归分析

2、就是对拟合问题作的统计分析。简单地说,回归分析就是对拟合问题作的统计分析。 建立因变量建立因变量y与自变量与自变量x1 ,xm 间的回归模 型 间的回归模 型(经验公式经验公式); 对回归模型的可信度进行检验;对回归模型的可信度进行检验; 判断每个自变量判断每个自变量xi 对对y 的影响是否显著;的影响是否显著; 诊断回归模型是否适合这组数据;诊断回归模型是否适合这组数据; 利用回归模型对利用回归模型对y进行预报或控制进行预报或控制. 回归分析在一组数据的基础上研究这样几个问题回归分析在一组数据的基础上研究这样几个问题 1 多元线性回归多元线性回归 1.1 模型模型 多元线性回归模型多元线性回

3、归模型 01 1 2 (0,) mm yxx N =+ ? 其中其中未知未知 n个独立观测数据个独立观测数据 1 (;,),(1,;) iiim yxxin nm=? 得得 = += niN xxy i iimmii , 1), 0( 2 110 ? ? 0 11111 1 1 1 1 m nnmnn m xxy XY xxy = ? ? ? ? 记, 2 (0,) n YX NI =+ ? 多元线性回归模型可表示为多元线性回归模型可表示为 1.2 参数估计参数估计 误差平方和误差平方和 = = n i T i XYXYQ 1 2 )()()( 利用最小二乘法利用最小二乘法 (求使求使Q()达

4、最小的达最小的)可求得可求得 mmx xy 110 +=?得多元线性回归方程得多元线性回归方程 拟合值拟合值 XY = 残差向量残差向量(拟合误差拟合误差) ? ? 111 n nn yy YY yy = ? 残差平方和(或剩余平方和)残差平方和(或剩余平方和) 22 11 () nn iii ii Syy = = 残 1 () TT X XX Y =最小二乘估计最小二乘估计 1.3 统计分析统计分析 1. E= ?222 2 3.(1) 1 SS nm nm = 残残 是的无偏估计 21 2.( ,() ) T NX X ?222 2 4.( ) SS m m = 回回 也是的无偏估计 22

5、2 2 11 (1) .()() nn iii ii S nSyySyy = = 回残 且其中, 2 1 () n i i SyySS = =+ 回残 平方和分解公式平方和分解公式 1.4 回归模型的假设检验回归模型的假设检验 0 :0(1,)(1,)0 jj Hjmjm=?不全为 0 ( ,1)FFm nmH 当时拒绝即认为回归模型显著即认为回归模型显著 相关系数相关系数 2 , (01,) S RRR S = 回 越大越好 检验问题检验问题: / ( ,1) /(1) Sm FF m nm Snm = 回 残 检验统计量检验统计量: 判断判断: 1.5 回归系数的假设检验回归系数的假设检验

6、 ( )( ) 01 :0:0 , (1,.,) jj jj HHjm=检验问题检验问题: ( ) 0 / (1) /(1) j H jjj j c tt nm Snm = 成立时 残 1 ()1 T j j cX Xj +其中是对角线上第个元素 ( ) 0 2 |(1) j j ttnmH 当时拒绝 判断判断: 检验统计量检验统计量: ( ) 0 2 (,) j H jjjj Nc 成立时 说明说明x j 的作用显著的作用显著 1.6 回归系数的区间估计回归系数的区间估计 2 (1) jjj tnms c 对置信水平对置信水平 1-,j 的置信区间:的置信区间: 1 S s nm = 残 其

7、中 1.7 利用回归模型进行预测利用回归模型进行预测 ),( 0010m xxx?=对给定的对给定的 mmx xy 001100 +=? 预测区间预测区间 00 22 ,yu s yu s + 对 对 y0 的区间估计方法可用于给出已知数据残差的区间估计方法可用于给出已知数据残差 i 服从均值为零的正态分布,所以服从均值为零的正态分布,所以若某个若某个i 的 置信区间不包含零点,则认为这个数据是异常的, 可予以剔除。 的 置信区间不包含零点,则认为这个数据是异常的, 可予以剔除。 (1, ) iii yyin= ?,的置信区间,的置信区间, 1.8 Matlab实现实现 Matlab统计工具箱

8、用命令统计工具箱用命令regress实现多元线性回归, 用的方法是最小二乘法,用法: 实现多元线性回归, 用的方法是最小二乘法,用法:b=regress(Y,X) 这里这里Y,X为数组矩阵为数组矩阵, b为回归系数估计值为回归系数估计值 m , , 10 ? b,bint,r,rint,stats = regress( Y,X,alpha ) 这里这里Y,X同上,同上,alpha为显著性水平为显著性水平(缺省时设为缺省时设为0.05), , b,bint为回归系数估计值和它们的置信区间,为回归系数估计值和它们的置信区间,r,rint为残 差 为残 差(向量向量)及其置信区间,及其置信区间,st

9、ats是用于检验回归模型的统 计量,有三个数值,第一个是 是用于检验回归模型的统 计量,有三个数值,第一个是R2,第二个是,第二个是F,第,第3个是 与 个是 与F对应的概率对应的概率p,p拒绝拒绝H0,回归模型成立,回归模型成立 残差及其置信区间可以用残差及其置信区间可以用rcoplot(r,rint)画图画图. 例例1 合金的强度与其中的碳含量有比较密切的关系,今从生 产中收集了一批数据如下表 合金的强度与其中的碳含量有比较密切的关系,今从生 产中收集了一批数据如下表 x0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 y42.0 41.5 45.0

10、 45.5 45.0 47.5 49.0 55.0 50.0 试先拟合一个函数试先拟合一个函数y(x),再用回归分析对它进行检验,再用回归分析对它进行检验. 解 解 先画出散点图先画出散点图 x=0.1:0.01:0.18; y=42,41.5,45.0,45.5,45.0, 47.5,49.0,55.0,50.0; plot(x,y,+) 可知可知y与与x大致上为线性关系。设回归模型为大致上为线性关系。设回归模型为y=b0 +b1 x 用用regress和和rcoplot编程如下编程如下 clc,clear x1=0.1:0.01:0.18; y=42,41.5,45.0,45.5,45.0

11、,47.5,49.0,55.0,50.0; x=ones(9,1),x1; b,bint,r,rint,stats=regress(y,x); b,bint,stats,rcoplot(r,rint ) 得到 得到 b =27.4722 137.5000 bint =18.6851 36.2594 75.7755 199.2245 stats =0.7985 27.7469 0.0012 ? 2 01 27.4722,137.5000,0.7985,27.7469,0.0012bbRFp= ? 0 b的置信区间 ? 1 b的置信区间 可知模型成立可知模型成立 观察命令观察命令rcoplot(r

12、,rint) 所画的残差分布,除第 所画的残差分布,除第 8个数据外其余残差的 置信区间均包含零点, 第 个数据外其余残差的 置信区间均包含零点, 第8个点应视为异常 点,将其剔除后重新计 算,可得 个点应视为异常 点,将其剔除后重新计 算,可得 b =30.7820 109.3985 bint =26.2805 35.2834 76.9014 141.8955 stats =0.9188 67.8534 0.0002 应该用修改后的这个结果应该用修改后的这个结果 例例2 某厂生产的一种电器的销售量与竞争对手的价格某厂生产的一种电器的销售量与竞争对手的价格x1和本 厂的价格 和本 厂的价格x2

13、有关。下表是该商品在有关。下表是该商品在10个城市的销售记录个城市的销售记录 x1 120 140 190 130 155 175 125 145 180 150 x2 100 110 90 150 210 150 250 270 300 250 y 102 100 120 77 46 93 26 69 65 85 试根据这些数据建立试根据这些数据建立y与与x1和和x2的关系式,对得到的模型和 系数进行检验。若某市本厂产品售价 的关系式,对得到的模型和 系数进行检验。若某市本厂产品售价160(元),竞争对手 售价 (元),竞争对手 售价170(元),预测商品在该市的销售量(元),预测商品在该市

14、的销售量. y 关于关于x1的散点图的散点图y 关于关于x2的散点图的散点图 解 解 分别画出分别画出y关于关于x1和和y关于关于x2的散点图,可以看出的散点图,可以看出y与与x2有 较明显的线性关系,而 有 较明显的线性关系,而y与与x1之间的关系则难以确定,我 们将作几种尝试,用统计分析决定优劣 之间的关系则难以确定,我 们将作几种尝试,用统计分析决定优劣 设回归模型为设回归模型为 01 122 ybb xb x=+ 编写如下程序编写如下程序 x1=120 140 190 130 155 175 125 145 180 150; x2=100 110 90 150 210 150 250

15、270 300 250; y=102 100 120 77 46 93 26 69 65 85; x=ones(10,1),x1,x2; b,bint,r,rint,stats=regress(y,x); b,bint,stats 得到 得到 b =66.5176 0.4139 -0.2698 bint = - 32.5060 165.5411 -0.2018 1.0296 -0.4611 -0.0785 stats =0.6527 6.5786 0.0247 得到 得到 b =66.5176 0.4139 -0.2698 bint = - 32.5060 165.5411 -0.2018 1.0296 -0.4611 -0.0785 stats =0.65

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号