应数数理统计课程设计报告书

上传人:xmg****18 文档编号:122414391 上传时间:2020-03-05 格式:DOC 页数:11 大小:207KB
返回 下载 相关 举报
应数数理统计课程设计报告书_第1页
第1页 / 共11页
应数数理统计课程设计报告书_第2页
第2页 / 共11页
应数数理统计课程设计报告书_第3页
第3页 / 共11页
应数数理统计课程设计报告书_第4页
第4页 / 共11页
应数数理统计课程设计报告书_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《应数数理统计课程设计报告书》由会员分享,可在线阅读,更多相关《应数数理统计课程设计报告书(11页珍藏版)》请在金锄头文库上搜索。

1、.海 南 大 学数理统计课程设计题目: 一元线性回归 班级: 数学与应用数学 学号: 20131615310031 姓名: 王丽 指导教师: 韩汉鹏 日期: 2015/6/25 一元线性回归分析摘要:本文利用回归分析中的一元线性回归分析对近十年来的国内生产总值与第三产业增加值的关系进行研究(由于国家统计数据中暂时还没有2014-2015年的数据,故只能往后推几年),通过F检验以及R检验,肯定了模型的可靠性。关键词:一元线性回归分析 国内生产总值 第三产业增加值 F检验 MATLAB试验设计方法建立一元线性回归模型: 其中是待定系数,对于不同的是相互独立的随机变量。假设对于的n个值,得到的n个相

2、应的值,确定的方法是根据最小二乘准则,要使取最小值。利用极值必要条件令,求的估计值,从而得到回归直线。(1)参数的区间估计由于我们所计算出的仍然是随机变量,因此要对取值的区间进行估计,如果区间估计值是一个较短的区间表示模型精度较高。(2)对误差方差的估计设为回归函数的值,为测量值,残差平方和剩余方差(3)线性相关性的检验由于我们采用的是一元线性回归,因此,如果模型可用的话,应该具有较好的线性关系。反映模型是否具有良好线性关系可通过相关系数R的值及F值观察。试验数据(来源于国家统计http:/ 345629.2,408903,484123.5,534123,588018.8;x=66282.8,

3、76964.9,91180.1,115090.9,135906.9,. 153625.1,180743.4,214579.9,243030,275887;plot(x,y,*)xlabel(第三产业增加值);ylabel(国内生产总值);运行后得到从图形可以看出,这些点大致分布在一条直线的左右,因此,可以考虑一元线性回归。根据计算得到的计算表为:= 1553291 n= 10 = 3.5098e+006 = 1.5533e+005 = 3.5098e+005= 2.4127e+011 = 6.4162e+011 = 1.4320e+012= 2.8784e+011 = 5.4518e+011

4、= 1.2319e+012= 4.6567e+010 = 9.6444e+010 = 2.0012e+011 = = 2.0711 = = 2.9284e+004所以,他们之间的一元线性关系为y=2.9282e+004+2.0711*x而= 2.0012e+011=1.9974e+011=-=3.8051e+008把各平方和与自由度移入方差分析表,继续进行计算得到下表:国内生产总值与第三产业增加值回归方程的方差分析表 来源 平方和 自由度 均方 F比 p值回归 =1.9974e+011 =1 =1.9974e+011 4.1995e+003 0.0000残差 =3.8051e+008 =8 =

5、 4.7564e+007总计 = 2.0012e+011 =9利用MATLAB软件来做F与R检验以及置信区间有:输入y(因变量,列向量)、x(1与自变量组成的矩阵),alpha是显著性水平(缺省时默认0.05)。输出,其中b中元素顺序与拟合命令polyfit的输出不同,bint是的置信区间,r是残差(列向量),rint是残差的置信区间,s包含4个统计量:决定系数(相关系数为R);F值;F(1,n-2)分布大于F值的概率p;剩余方差的值。其意义:的值越接近1,变量的线性相关性越强,说明模型有效;如果满足,则认为变量与显著地有线性关系,其中的值可查F分布表;如果表示线性模型可用。这三个值可以相互印

6、证。的值主要用来比较模型是否有改进,其值越小说明模型精度越高。clear;clc;format long;y=160713.4,185895.8,217656.6,268019.4 316751.7,. 345629.2,408903,484123.5,534123,588018.8;x=66282.8,76964.9,91180.1,115090.9,135906.9,. 153625.1,180743.4,214579.9,243030,275887;n=10;X=ones(n,1),x;b,bint,r,rint,s=regress(y,X,0.05);b,bint,s,rcoplot(

7、r,rint)运行后得到b = 1.0e+004 * 2.928407544898145 0.000207108239571bint = 1.0e+004 * 1.678049344139109 4.178765745657182 0.000199738360349 0.000214478118793s = 1.0e+007 * 0.000000099809862 0.000419946703500 0.000000000000000 4.756376812445453 则其中= 1.0e+007 *0.000000099809862=0.99809862, 由finv(0.95,1,8)=5

8、.32,即= 5.31F= 1.0e+007 * 0.000419946703500=,p0.00000000001,置信区间为bint的值为16780.49344139109 41787.65745657182和1.99738360349 2.14478118793 说明模型有效且能改进,即:可以通过残差图发现,第十个数据为奇异数据,去掉该数据后运行后得到b = 1.0e+004 * 2.278277164509946 0.000212679047129bint = 1.0e+004 * 1.460284634358639 3.096269694661254 0.00020734588043

9、3 0.000218012213826s = 1.0e+007 * 0.000000099921340 0.000889208025291 0.000000000000000 1.547287564648822则其中= 1.0e+007 * 0.000000099921340=0.99921340, 由finv(0.95,1,7)=5.59,即= 5.59F= 1.0e+007 * 0.000889208025291,p0.000000001,置信区间为14602.84634358639 30962.69694661254和2.07345880433 2.18012213826 说明模型有效且

10、有改进但通过残差图发现,第九个数据仍为奇异数据,去掉该数据后运行后得到b = 1.0e+004 * 1.917341884507555 0.000216005550143bint = 1.0e+004 * 1.187485632932248 2.647198136082862 0.000210722088470 0.000221289011816s = 1.0e+006 * 0.000000999400814 0.010007586361287 0.000000000000000 8.820891187750542则其中= 1.0e+006 * 0.000000999400814=0.9994

11、00814, 由finv(0.95,1,6)=5.99,即= 5.99F= 1.0e+006 *0.010007586361287,p0.000000001,置信区间为11874.85632932248 26471.98136082862以及2.10722088470 2.21289011816 说明模型有效且有改进可是通过残差图发现,第六个数据仍为奇异数据,去掉该数据后运行后得到b = 1.0e+004 * 1.891017643251107 0.000216825949481bint = 1.0e+004 * 1.392837534478213 2.389197752024002 0.000213157020044 0.000220494878919s = 1.0e+006 * 0.000000999783395 0.023078451418954 0.000000000000000 3.716348256595486则其中= 1.0e+006 * 0.000000999783395=0.9994783395, 由finv(0.95,1,5)=6.61,即= 6.61F= 1.0e+006 *0.023078451418954,p0.000000001,置信区间为13928.375344782

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号