数学实验第10次作业-回归分析

上传人:jiups****uk12 文档编号:90631388 上传时间:2019-06-14 格式:DOCX 页数:13 大小:283.59KB
返回 下载 相关 举报
数学实验第10次作业-回归分析_第1页
第1页 / 共13页
数学实验第10次作业-回归分析_第2页
第2页 / 共13页
数学实验第10次作业-回归分析_第3页
第3页 / 共13页
数学实验第10次作业-回归分析_第4页
第4页 / 共13页
数学实验第10次作业-回归分析_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《数学实验第10次作业-回归分析》由会员分享,可在线阅读,更多相关《数学实验第10次作业-回归分析(13页珍藏版)》请在金锄头文库上搜索。

1、回归分析一 实验目的1 了解回归分析的基本原理,掌握MATLAB实现的方法;2 练习用回归分析解决实际问题。二 实验内容1 电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表),建立回归模型并进行检验,诊断异常点的存在并进行处理。每周收入9690959295959494电视广告费用1.52.01.52.53.32.34.22.5报纸广告费用5.02.04.02.53.03.52.53.0初步解决:首先对于题目作初步分析,题目中电视广告费用和报纸广告费用都会对与每周收入产生影响,但是两者对于每周收入的影响都是独立的。首先画出散点图如下:观察散点图之后,假设自变量与因变量

2、满足多元线性关系。设电视广告费用为x1,报纸广告费用为x2,每周收入为y,那么每周收入与电视广告费用以及报纸广告费用的关系模型表示如下:y=0+1x1+2x2;下面在MATLAB中输入以下命令:输出结果如下所示:结果列表如下:回归系数回归系数估计值回归系数置信区间083.211678.8058,87.617411.29850.4007,2.196222.33721.4860,3.1883R2=0.9089,F=24.9408,p=0.00250.05,s2=0.4897于是由它得到的预测模型为y=83.2116+1.2985x1+2.3372x2。做出残差和置信区间的图像如下:由图像可以看出,

3、只有第一组数据的置信区间不包括零,改组数据可能有误,去掉之后再进行计算。在命令栏中输入以下命令:输出结果如下所示:将结果列表如下:回归系数回归系数估计值回归系数置信区间081.488178.7878,84.188311.28770.7964,1.779022.97662.3281,3.6250R2=0.9768,F=84.3842,p=0.00050.05,s2=0.1257由它得到的回归模型为y=81.4881+1.2877x1+2.9766x2。对于实验结果的分析:回归模型:y=81.4881+1.2877x1+2.9766x2。对比剔除异常点后的分析结果可知,第一次分析的过程中,第一组数

4、据的置信区间不包括零点,所以该点为异常点,需要剔除再进行一次计算。剔除之后,发现所有点的置信区间都包括了零点。剔除数据之后计算结果与剔除之前的比较00int11int22int原始数据83.211678.8058,87.61741.29850.4007,2.19622.33721.4860,3.1883剔除后81.488178.7878,84.18831.28770.7964,1.77902.97662.3281,3.6250纵向比较可以看出,剔除了异常数据之后,置信区间明显的有了缩小,所以说,剔除异常数据可以有利于更加精确地建立模型。2 汽车销售商认为汽车销售量与汽油价格、贷款利率有关,两种

5、类型汽车(普通型和豪华型)18个月的调查资料见下表,其中y1是普通型汽车售量(千辆),y2是豪华型汽车售辆(千辆),x1是汽油价格(元/gal),x2是贷款利率(%)。序号y1y2x1x2122.17.21.896.1215.45.41.946.2311.77.61.956.3410.32.51.828.2511.42.41.859.867.51.71.7810.3713.04.31.7610.5812.83.71.768.7914.63.91.757.41018.97.01.746.91119.36.81.705.21230.110.11.704.91328.29.41.684.31425.

6、67.91.603.71537.514.11.613.61636.114.51.643.11739.814.91.671.81844.315.61.682.3(1) 对普通型和豪华型汽车分别建立如下模型:y1=0(1)+1(1)x1+2(1)x2;y2=0(2)+1(2)x1+2(2)x2.给出的估计值和置信区间,决定系数R2,F值及剩余方差等;(2) 用x3=0,1表示汽车类型,建立统一模型:y=0+1x1+2x2+3x3,给出估计值和置信区间,决定系数R2,F值及剩余方差等。以x3=0,1代入统一模型,将结果与(1)的两个模型比较,解释二者的区别;(3) 对统一模型就每种类型汽车分别作x1

7、和x2与残差的散点图,有什么现象,说明模型有何缺陷?(4) 对统一模型增加二次项和交互项,考察结果有什么改进。初步解决:(1) 首先研究y1,在命令栏中输入以下命令:输出结果如下:结果列表如下:回归系数回归系数估计值回归系数置信区间090.181446.1971,134.16561-27.6588-54.5542,-0.76342-3.2283-4.2747,-2.1819R2=0.8593,F=45.7992,p0.05,s2=20.7910由它得到的回归模型为:y=90.1814-27.6588x1-3.2283x2。1、2的置信区间不包含零点,且p,且计算可得,F1,n-2,1-=4.4

8、940F,所以该模型有效。下面研究y2,在命令栏中输入以下内容:输出结果如下:结果列表如下:回归系数回归系数估计值回归系数置信区间024.54715.9201,43.17401-4.6285-16.0184,6.76152-1.4360-1.8792,-0.9929R2=0.8402,F=39.4474,p0.05,s2=3.7288由它得到的回归模型为:y=24.5471-4.6285x1-1.4360x2。1的置信区间包含了零点,所以该模型无效。(2) 对于统一模型,用x3来表示车的类型,x3=0表示普通型,x3=1表示豪华型。在命令栏中输入以下内容:输出结果如下所示:结果列表如下:回归系

9、数回归系数估计值回归系数置信区间064.575333.5007,95.64991-16.1436-35.1193,2.83202-2.3322-3.0705,-1.59393-14.4222-17.6546,-11.1898R2=0.8366,F=54.6111,p0.05,s2=22.6642由它得到的统一回归模型为:y=64.5753-16.1436x1-2.3322x2-14.4222x3。1的置信区间包含了零点,所以该模型无效。下面对这个统一模型进行研究:首先将x3=0代入统一模型,得到回归模型为y1=64.5753-16.1436x1-2.3322x2,然后将x3=1代入统一模型,得

10、到回归模型为y2=50.1531-16.1436x1-2.3322x2。与第一问的结果相比相差较大,说明该模型并不合适。(3) 对于第二问中求出的的统一模型,分别画出x1、x2与残差的散点图。首先是x1与残差的散点图:然后是x2与残差的散点图:对于两幅图,纵轴均为残差,横轴分别为x1和x2。两种类型的汽车残差分布不同,这说明x3(即汽车类型)与x1、x2有交互作用,模型中应添加交互项。(4) 在MATLAB中尝试使用逐步回归来建立包括二次项和交互项的模型。在命令栏中输入以下命令:然后经过不断的调试,找到使s最小的情况,如下图所示:于是,由它得到的模型为y=52.6799-71.5312x3-4.004x1x2+1.7005 x2x3+26.7164 x1x3+0.2888x22另外:R2=0.9396 , F= 93.3844,p 0.0000, s=2.9886

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号