概率论与数理统计课程设计-一元线性回归分析

上传人:aa****6 文档编号:30017814 上传时间:2018-01-26 格式:DOC 页数:18 大小:466.50KB
返回 下载 相关 举报
概率论与数理统计课程设计-一元线性回归分析_第1页
第1页 / 共18页
概率论与数理统计课程设计-一元线性回归分析_第2页
第2页 / 共18页
概率论与数理统计课程设计-一元线性回归分析_第3页
第3页 / 共18页
概率论与数理统计课程设计-一元线性回归分析_第4页
第4页 / 共18页
概率论与数理统计课程设计-一元线性回归分析_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《概率论与数理统计课程设计-一元线性回归分析》由会员分享,可在线阅读,更多相关《概率论与数理统计课程设计-一元线性回归分析(18页珍藏版)》请在金锄头文库上搜索。

1、摘要数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占有很重要的地位。对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论;对于非正态总体期望和方差的区间估计和假设检验问题,在大样本的情况下,可利用中心极限定理转化为正态总体来解决。但实际问题中常常碰到非正态总体,而且是小样本的情况,因此对它的区间估计和假设检验是一个值得研究的问题本文利用概率纶与数理统计中的所学的回归分析知识,对用切削机房进行金属品加工时为了适当地调整机床,测量刀具的磨损速度与测量刀具的厚度间的关系建立数学模型,利用这些数据做出刀具厚度 关于时间 的线性回归xy方程,并 MATLAB 与 EXCEL 软

2、件对验数据进行分析处理,得出线性回归系数与拟合系数等数据,并用 F 检验法检验了方法的可行性,同时用分布参数置信区间和假设检验问题 ,得出了刀具厚度 关于时间 的线性关系显著,并进行xy了深入研究,提出了小样本常用分布参数的置信区间与假设检验的解决方法。关键词:统计量法;置信区间;假设检验;线性关系;回归分析1目录一设计目的 .4二设计问题 .4三设计原理 .4四方法实现 .8五设计总结 .18参考文献 .18致 谢 .192一设计目的了解一元回归方程,回归系数的检验方法及应用一元回归方程进行预测的方法;学会应用 MATLAB 软件进行一元回归实验的分析方法。同时更好的了解概率论与数理统计的知

3、识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合 Excel 对数据的处理解决实际问题。本设计是利用一元线性回归理论对用切削机房进行金属品加工时为了适当地调整机床,测量刀具的磨损速度与测量刀具的厚度间的关系建立数学模型,并用 Excel 分析工具库中的回归分析软件进行解算。二设计问题用切削机床进行金属加工时,为了适当地调节机床,需要测定刀具的磨损速度。在一定时间(例如每隔一小时)测量刀具的厚度,得到数据如下:切削时间hxi刀具厚度cmyi切削时间hxi刀具厚度cmyi0 30.0 15 24.81 29.1 16 24.02 28.4 17 23.73 28.1 18 23.

4、14 28.0 19 22.95 27.7 20 22.66 27.5 21 22.37 27.2 22 22.18 27.0 23 21.79 26.8 24 21.510 26.5 25 21.311 26.3 26 21.012 26.1 27 20.613 25.7 28 20.314 25.3 29 20.1由此,我们利用这些数据做出刀具厚度 关于时间 的线性回归方程。xy三设计原理在实际问题中,经常会出现两个变量之间的相关关系不是线性的(即直线3型) ,而是非线性的(即曲线型) 。设其中有两个变量 与 ,我们可以用一xy个确定函数关系式: )(xy大致的描述 与 之间的相关关系,函

5、数 称为 关于 的回归函数,yx)(u方程 )(u成为 关于 的回归方程。一元线性回归处理的是两个变量 与 之间的线性关系,可以设想xy的值由两部分构成:一部分由自变量 的线性影响所致,表示 的线性函y x数 ;另一部分则由众多其他因素,包括随机因素的影响所致,这bxa一部分可以视为随机误差项,记为 。可得一元线性回归模型(1)bxay式中,自变量 是可以控制的随机变量,成为回归变量;固定的未知参数 a,bx成为回归系数; 称为响应变量或因变量。由于 是随机误差,根据中心极限定理,通常假定 , 是未知参数。),0(2N2确定 与 之间的关系前,可根据专业知识或散点图,选择适当的曲yx线回归方程

6、,而这些方程往往可以化为线性方程或者就是线性方程,因此我们可以用线性方程: bxa大致描述变量 与 之间的关系;yx1)模型回归系数的估计为了估计回归系数,假定试验得到两个变量 与 的 个数据对xyn我们将这 对观测值代入式( 1) ,得,321,niyxLnibxanii ,32,L这里 互独立的随机变量,军服从正态分布,即n21K4n,123i), N(02K回归系数估计的方法有多种,其中使用最广泛的是最小二乘法,即要求选取的 , , 的值使得述随机误差 的平方和达到最小,即求使得函数abniini bxaybaQ1221,取得最小值的 , 。由于 是 , 的二元函数,利用微积分中的函数存

7、在极值的必要baQ,条件,分别对 求 , 偏导数,并令其为 0,构成二元一次方程组ab,niibxy00)(,1iia化简后得到如下正规方程组,)(11niniybxaa .1112nininix解方程组得到总体参数 估计量ba,iixnnay 22)(iixnyy这里, 均已有的观测数据。)21(和xiL由此得到回归方程 xbay带入观测 ,得到值 称为回归预测值。方程的直线称为回归直线。iiy52)回归方程显著性检验建立一元线性回归方程当且仅当变量之间存在线性相关关系时才是有意义的,因此必须对变量之间的线性相关的显著性进行检验,即对建立的回归模型进行显著性检验。我们首先引入几个概念:(1)

8、 ,称为 总偏差平方和,它表示观测值 总niTyS12)(TSiy的分散程度;(2) ,称 为回归平方和,它是由回归变量 的变niRyS12)(RSx化引起的,放映了回归变量 对变量 线性关系的密切程度;xy(3) ,称 为残差(剩余)平方和,它是由观测niEyS1i2)(ES误差等其他因素起误差,它的值越小说明回归方程与原数据拟合越好。可以证明下列关系成立ERTSS即 = + niy12)(niy12)(niy1i2)(我们主要考虑回归平方和在总偏差和中所占的比重,记 。TRS2(0 F (1,n-2),则认为 y 与 x 之间的线性关系显著;如果 F y=30 29.1 28.4 28.1

9、 28.0 27.7 27.5 27.2 27.0 26.8 26.5 26.3 26.1 25.7 25.3 24.8 24.0 23.7 23.1 22.9 22.6 22.3 22.1 21.7 21.5 21.3 21.0 20.6 20.3 20.1; x=0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29; plot(x,y,*)7生成图(1) ,可以看出 x 和 y 大体成线性关系。图 1 散点图(横轴:X 纵轴 Y)(2)作一元回归分析,输入: n=length(y);

10、X=ones(n,1),x; b,bint,r,rint,s=regress(y,X); b,bint,sb =29.5501-0.3329bint =29.3326 29.7676-0.3458 -0.3200s =1.0e+003 *0.0010 2.8019 0 0.00018这个结果可整理成表 1 的形式。回归系数 回归系数估计值 回归系数置信区间029.5501 29.3326,29.76761-0.3329 -0.3458,-0.320012R9.2801F01.p表 1 MATLAB 回归分析结果表一元回归方程为: xy35.9从几个方面都可以检验模型是有效的: 检验 -接近于

11、0; 的置信区FP1间不含零点; ;用 MATLAB 命令 finv(0.95,1,28)计算得到p,F 为统计量观测值,所以 X 与 Y 的相关性显著。F1960.428,95.0残差及其置信区间作图代码输入:rcoplot(r,rint)结果如图 2 所示:5 10 15 20 25 30-1-0.8-0.6-0.4-0.200.20.40.60.81Residual Case Order PlotResidualsCase Number图 2 残差图(横轴:削磨时间 纵轴:残差分析值)所 谓 残 差 是 指 实 际 观 察 值 与 回 归 估 计 值 的 差 , 残 差 分 析 就 是

12、通 过 残差 所 提 供 的 信 息 , 分 析 出 数 据 的 可 靠 性 、 周 期 性 或 其 它 干扰。 从残差图可9以看出,数据的残差离零点较近,且残差的置信区间均包含零点,这说明回归模型 能很好的符合原始数据。xy329.05129(3)讲上面的回归系数估计值 , 带入回归方程,501.0329.-刀具磨损速度的测试中,对时间间隔为 30/h 的刀具厚度进行预测,得到 。19.560y在 ,刀具的厚度预测区间简化为 ,输入计 suysuy210210,算指令: t1=19.5631-norminv(0.0975,0,1)*sqrt(sum(r.2)/16)t1 =20.0742 t

13、2=19.5631+norminv(0.0975,0,1)*sqrt(sum(r.2)/16)t2 =19.0520即时间间隔为 30/h 的刀具磨损速度测试中,刀具厚度的置信度为 0.95 的预测区间为 。0742.,519也可以用命令: y=30 29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8 26.5 26.3 26.1 25.7 25.3 24.8 24.0 23.7 23.1 22.9 22.6 22.3 22.1 21.7 21.5 21.3 21.0 20.6 20.3 20.1; x=0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29; polytool(x,y,1,0.05)作出散点图及拟合曲线,并对 时的 y 进行预报,结果如图 3 所示。30x10图 3 散点图及拟合曲线如图 3 所示,红线表示为数据离合区间,蓝色“+”表示为数据散点分布,绿色表示为拟合曲线。(4)下面用 Excel“分析工具库”提供的“回归”工具,找出线性回归方程,并检验其显著性。1、具体步骤如下:1在【工具】菜单中选中【数据分析】 ,则会弹出【数据分析】对话框,然后“分析工具”中选择“回归”选项,如图二所示。单击【确定】

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号