机组耗水率影响因素的回归分析报告

上传人:xmg****18 文档编号:121234983 上传时间:2020-02-19 格式:DOC 页数:16 大小:235KB
返回 下载 相关 举报
机组耗水率影响因素的回归分析报告_第1页
第1页 / 共16页
机组耗水率影响因素的回归分析报告_第2页
第2页 / 共16页
机组耗水率影响因素的回归分析报告_第3页
第3页 / 共16页
机组耗水率影响因素的回归分析报告_第4页
第4页 / 共16页
机组耗水率影响因素的回归分析报告_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《机组耗水率影响因素的回归分析报告》由会员分享,可在线阅读,更多相关《机组耗水率影响因素的回归分析报告(16页珍藏版)》请在金锄头文库上搜索。

1、.专业整理.机组耗水率影响因素的回归分析摘 要数理统计是具有广泛应用的数学分支,在生产过程和科学实验中,总会遇到多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们之间存在相互关系,这种相互关系可以分为确定性关系和相关关系。变量之间的确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律性,这种函数称为回归函数或回归方程1。回归分析是一种处理变量之间相关关系最常用的统计方法,用它可以寻找隐藏在随机后面的统计规律。确定回归方程,

2、检验回归方程的可信度等是回归分析的主要内容。按回归模型类型可划分为线性回归分析和非线性回归分析。 本文运用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。首先收集数据并利用MATLAB软件2进行数据处理,作出散点图。分析图发现耗水率与出库流量、库水位有明显的线性关系。在此基础上假设并建立模型。对回归参数做点估计及区间估计,并作出显著性检验,发现显著效果良好,然后利用残差图3检验回归效果,发现异常点,进而改进模型,最后利用回归方程做点预测和区间预测。关键词:相互关系;多元线性回归分析;线性回归方程;显著性检测目录1 设计目的12 设计原理12.1 线性回归方程的建立12.2 参数估计12

3、.3 回归模型的假设检验22.4 回归系数的假设检验和区间估计32.5 利用回归模型进行预测33 设计题目34 实现过程44.1 回归方程的确立44.2 回归方程显著性检验64.3 模型改进74.4 回归预测85 设计总结11参考文献12 .学习帮手.1 设计目的为了进一步理解概率论与数理统计的基本概念、理论和方法,基本掌握MATLAB等具有统计分析功能软件的使用,并具备初步的运用计算机完成数据处理的技能,实现理论与实践的结合。2 设计原理2.1 线性回归方程的建立设Y是一个可观测的随机变量,受到P(P0)个非随机变量因素和随机因素的影响若Y与有如下线性关系: 其中是固定的未知参数,称为回归系

4、数,服从,Y称为被解释变量,模型(2.1.1)称为多元线性回归模型4。已知 n 个独立观测数据应满足下式其中相互独立,且设,记 2.2 参数估计 对模型中参数,使用最小二乘法进行估计,即应选取估计值,使当时,误差平方和 达到最小。为此,令 整理得 整理化为正规方程组的矩阵形式 当矩阵 X 列满秩时, 为可逆方阵,上式的解为 将代回原模型得到 y 的估计值 而这组数据的拟合值为,拟合误差 称为残差,可作为随机误差的估计,而残差平方和(或剩余平方和)为 2.3 回归模型的假设检验 检验因变量与自变量 之间是否存在线性关系。显然,如果所有的都很小,与 的线性关系就不明显,所以可令原假设为当成立时由回

5、归平方和U和残差平方和Q 满足 在显著性水平下有上分位数, ,若 接受 ;否则,拒绝。2.4 回归系数的假设检验和区间估计当上面的 被拒绝时,不全为零,但是不排除其中若干个等于零。所以应进一步作如下 m+1个检验 :若假设成立 对给定的,若,接受;否则,拒绝。对作区间估计,在置信水平1下,的置信区间为其中。2.5 利用回归模型进行预测 当回归模型和系数通过检验后,可由给定的 预测, 是随机的,显然其预测值(点估计)为给定可以算出的预测区间(区间估计),结果较复杂,但当 n 较大且 x0i 接近平均值xi 时,y0 的预测区间可简化为 其中是标准正态分布的上分位数。对y0 的区间估计方法可用于给

6、出已知数据残差 的置信区间,ei 服从均值为零的正态分布,所以若某个 ei 的置信区间不包含零点,则认为这个数据是异常的,可予以剔除。3 设计题目 本文选用葛洲坝机组发电耗水率数据进行分析得到其主要影响因素为库水位,出库流量。数据如表3.1所示,利用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。表3.1 某天耗水率与出库流量、库水位的数据 机组发电耗水率 (立方米/万千瓦) 库水位(米)出库流量(立方米)65.081560760.4665.101556560.2865.121554060.1065.171550759.7865.381553658.9165.401551958.736

7、5.431551058.6365.471548958.4865.531543758.3165.621635557.9665.581470857.0665.701439356.4365.841429655.834 实现过程4.1 回归方程的确立 本文采用二元线性回归模型8,分析机组耗水率与其影响因素出库流量、库水位的关系。故选用“机组发电耗水率”为应变量Y,选用“出库流量”、“库水位”为,对已知数据进行数据处理。运用MATLAB软件5作出散点图。输入:A=65.08 15607 60.4665.10 15565 60.2865.12 15540 60.1065.17 15507 59.7865.

8、21 15432 59.4465.37 15619 59.2565.38 15536 58.9165.39 15514 58.7665.40 15519 58.7365.43 15510 58.6365.47 15489 58.4865.53 15437 58.3165.62 16355 57.9665.58 14708 57.0665.70 14393 56.4365.84 14296 55.83;% 做散点图subplot(1,2,1),plot(A(:,1),A(:,3),+)xlabel(x1(库水位) ylabel(y(耗水率)subplot(1,2,2),plot(A(:,2),A

9、(:,3),o)xlabel(x2(出库流量) ylabel(y(耗水率)结果:图4.1.1散点图从图中可以看到无论是库水位还是出库流量都与机组发电耗水率具有线性关系,因此,可以建立机组发电耗水率与库水位和出库流量的二元线性回归模型。再利用 MATLAB 统计工具箱中的回归分析命令6进行分析, 输入:m,n=size(A);y=A(:,3);x=A(:,1:2);b,bint,r,rint,stats=regress(y,ones(m,1),x);b,bint,stats并得出结果:b =373.8698 -4.9759 0.0007bint =340.0820 407.6577 -5.464

10、2 -4.4875 0.0004 0.0009stats =0.9863 468.4118 0.0000 0.0278将结果整理得下表:表4.1.1 回归模型的系数、系数置信区间与统计量回归系数回归系数估计值回归系数置信区间373.8698340.082 ,407.6577-4.9759-5.4642 ,-4.4875 0.00070.0004,0.0009= 0.9863,F= 468.4118,p0.0001, =0.0278由此可得模型为:4.2 回归方程显著性检验(1) 拟合优度检验 相关系数,非常接近1,说明本模型对样本数据拟合较好,即解释变量“出库流量”、“库水位”对被解释变量“耗

11、水率”的绝大部分差异做出了解释。(2) F检验 由MATLAB所得数据F=468.4118,查F分布表,在显著水平=0.005的情况下,比较得F远大于8.19,说明耗水率与出库流量、库水位间存在显著的线性关系。(3) 残差分析 残差分析的基本方法是由回归方程7作出残差图,通过观测残差图,以分析和发现观测数据中可能出现的错误以及所选用的回归模型是否恰当;在残差图中,残差点比较均匀地落在水平区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高。在MATLAB界面下输入: rcoplot(r,rint);得到残差图如下:图.2.1 残差示意图4.3

12、 模型改进考虑删除异常点程序并重新建立模型。在MATLAB界面下输入:b1,bint1,r1,rint1,stats1=regress(y(1:12);y(14:m),ones(m-1,1),x(1:12,:);x(14:m,:)rcoplot(r1,rint1);删除异常点后,残差示意图如下图所示,此时没有异常点,改进回归模型的系数、系数置信区间8与统计量参见表4.3.1。4.3.1 模型改进后残差图根据MATLAB所得数据整理得下表:4.3.1 回归模型改进后的系数、系数置信区间与统计量 回归系数回归系数估计值回归系数置信区间328.4616290.6145 ,366.3087-4.359

13、4-4.8880 ,-3.8308 0.00100.00073,0.0012= 0.9931,F= 858.5846,p0.0001, =0.0150 表4.1.1与表4.3.1加以比较,可以发现:可决系数从0.9863提高到0.9931,F统计量从468.4118提高到858.5846,由此可知改进后的模型显著性明显提高。4.4 回归预测对模型进行回归预测9,在MATLAB软件10里调用“polytool”命令,输入以下程序:x1=15607 15565 15540 15507 15536 15519 15510 15489 15437 16355 14708 14393 14296;y=65.08 65.10 65.12 65.17 65.38 65.40 65.43 65.47 65.53 65.62 65.58 65.70 65.84;polytool(x1,y,1,0.05)结果:图4.4.1 预测图输入:x2=60.46 60.28 60.10 59.78 58.91 58.73 58.63 58.48 58.31 57.96 57.06 56.43 55.83;y=65.08 65.10 65.12 65.17 65.38 65.40 65.4

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号