应用回归分析实验报告

上传人:206****923 文档编号:37509388 上传时间:2018-04-17 格式:DOC 页数:24 大小:1.06MB
返回 下载 相关 举报
应用回归分析实验报告_第1页
第1页 / 共24页
应用回归分析实验报告_第2页
第2页 / 共24页
应用回归分析实验报告_第3页
第3页 / 共24页
应用回归分析实验报告_第4页
第4页 / 共24页
应用回归分析实验报告_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《应用回归分析实验报告》由会员分享,可在线阅读,更多相关《应用回归分析实验报告(24页珍藏版)》请在金锄头文库上搜索。

1、 一元线性回归一元线性回归 一、实验题目一、实验题目 1一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过 10 周的时间,收集了每周加班时间的数据和签发的新保单数目,x 为每周签发的新报数 目,y 为每周加班时间(小时) ,数据见下表:二、实验内容二、实验内容散点图如下所示:散点图如下所示:数据集1 描述性统计量描述性统计量均值标准 偏差Ny2.8501.434710x762.00379.74610相关性相关性yxy1.000.949Pearson 相关性x.9491.000y.000Sig. (单侧)x.000.y1010Nx1010输入移去的变量输入移去的变量b b

2、模型输入的变量移去的变量方法1xa.输入a. 已输入所有请求的变量。b. 因变量: y模型汇总模型汇总b b更改统计量模型RR 方调整 R 方标准 估计的误差R 方更改F 更改df1df2Sig. F 更改1.949a.900.888.4800.90072.39618.000a. 预测变量: (常量), x。b. 因变量: yAnovaAnovab b模型平方和df均方FSig.回归16.682116.68272.396.000a残差1.8438.2301总计18.5259a. 预测变量: (常量), x。b. 因变量: y系数系数a a非标准化系数标准系数B 的 95.0% 置信区间模型B标

3、准 误差试用版tSig.下限上限(常量).118.355.333.748-.701.9371x.004.000.9498.509.000.003.005a. 因变量: y残差统计量残差统计量a a极小值极大值均值标准 偏差N预测值.8894.9582.8501.361410标准 预测值-1.4401.548.0001.00010预测值的标准误差.154.291.209.05010调整的预测值.8345.2232.8571.394410残差-.8390.5259.0000.452610标准 残差-1.7481.096.000.94310Student 化 残差-1.9081.272-.0061.

4、05110已删除的残差-1.0003.7089-.0072.566210Student 化 已删除的残差-2.4191.332-.0581.17010Mahal。 距离.0282.398.900.85610Cook 的距离.001.416.129.15710居中杠杆值.003.266.100.09510a. 因变量: y残差图分析:1.x 与 y 之间大致呈线性关系。2、设回归方程为01yx =1 1221(2637021717)0.0036(71043005806440)( )nii i ni ix ynx yxn x 012.850.0036 7620.1068yx 0.10680.003

5、6yx 可得回归方程为3、 22ni=11()n-2iiyy 2n01 i=11()n-2iyx =0.23050.4801 4、 由于211(,)xxNL :1112()/xxxxLt L服从自由度为 n-2 的 t 分布。因而1 /2()|(2)1xxLPtn 也即:=1/211/2()xxxxpttLL 1可得195% 的置信度为的置信区间为0.4801/ 12978600.4801/ 1297860(0. 0036-1. 860,0. 0036+1. 860)即为:(0.0028,0.0044)2 2 001( )(,()xxxNnL :00002221( )1( )()xxxxt x

6、x nLnL 服从自由度为 n-2 的 t 分布。因而00 /2 2|(2)1 1( )xxPtn x nL 即220/200/21( )1( )()1xxxxxxpttnLnL 可得195%0.3567,0.5703 的置信度为的置信区间为()5、x 与 y 的决定系数 =0.90822121()()ni i ni iyy r yy 16.82027 18.5256、由于,拒绝,说明回归方程显著,x与y有显著的线性关系。(1,9)FF0H7、 其中112 /xxxxLtL22 21111()22nniii iieyynn0.003612978608.5420.04801/21.895t/28

7、.542tt接受原假设认为显著不为 0,因变量 y 对自变量 x 的一元线性回归成立。01:0,H18、 相关系数 1211()()()()nii xyinn xxyy ii iixxyyLrL Lxxyy =46530.94891297860 18.525小于表中的相应值同时大于表中的相应值,x 与 y 有显著的线性关系.r1%5% 9、从图上看,残差是围绕 e=0 随机波动,从而模型的基本假定是满足的。10、0010003.7x 新保单时,需要加班的时间为y小时。11、,00/200y(2) 1ytnh 的置信概率为1- 的置信区间精确为即为(2.7,4.7)近似置信区间为:,即(2.74

8、,4.66)02y 12、可得置信水平为为,即为1- 的置信区间0/200(2)ytnh (3.33,4.07).一、实验题目一、实验题目 2下表是 1985 年的美国 50 个洲和哥伦比亚特区公立学校中教师的人均年工资 y(美元) 和对学生的人均经费投入 x(美元) 。数据集1 二、实验内容二、实验内容(1)绘制绘制 y 对对 x 的散点图,可以用直线回归描述两者之间的关系吗?的散点图,可以用直线回归描述两者之间的关系吗?描述性统计量描述性统计量均值标准 偏差Ny24354.574178.82451x3694.651053.06051相关性相关性yxy1.000.835Pearson 相关性

9、x.8351.000y.000Sig. (单侧)x.000.y5151Nx5151输入移去的变量输入移去的变量b b模型输入的变量移去的变量方法1xa.输入a. 已输入所有请求的变量。b. 因变量: y模型汇总模型汇总b b更改统计量模型RR 方调整 R 方标准 估计的误差R 方更改F 更改df1df2Sig. F 更改1.835a.698.6912321.667.698112.986149.000a. 预测变量: (常量), x。b. 因变量: yAnovaAnovab b模型平方和df均方FSig.回归6.090E816.090E8112.986.000a残差2.641E849539013

10、6.6911总计8.731E850a. 预测变量: (常量), x。b. 因变量: y系数系数a a非标准化系数标准系数模型B标准 误差试用版tSig.(常量)12109.8791196.94810.117.0001x3.314.312.83510.630.000a. 因变量: y残差统计量残差统计量a a极小值极大值均值标准 偏差N预测值19722.5339779.8924354.573490.01951标准 预测值-1.3274.420.0001.00051预测值的标准误差325.1141487.149425.285176.41151调整的预测值19570.6038596.9524336.

11、123406.18351残差-3848.0225523.929.0002298.33351标准 残差-1.6572.379.000.99051Student 化 残差-1.6822.403.0031.01051已删除的残差-3963.5895635.19818.4532397.55651Student 化 已删除的残差-1.7152.532.0091.03051Mahal。 距离.00019.535.9802.76951Cook 的距离.000.316.023.05051居中杠杆值.000.391.020.05551a. 因变量: y标准残差的直方图和正概率图标准残差的直方图和正概率图1、由上

12、面的散点图分析可知: 可以用直线回归描述 y 与 x 之间的关系.2、回归方程为:12112.6293.314yx 3、从图上可看出,检验误差项服从正态分布。 实验二实验二 多元线性回归分析多元线性回归分析一、实验题目一、实验题目 1用下表的数据,建立 GDP 对1x和2x的回归。对得到的二元回归方程,你能够合理的解释两个回归系数吗?如果现在不能给出 21709. 1607. 06 .2914xxy合理的解释,不妨在学到第六章多重共线性后再来解释这个问题,在学过第七章岭回归后 再来改进这个问题。二、实验内容二、实验内容Model SummaryModelRR SquareAdjusted R

13、SquareStd. Error of the Estimate11.000a.999.9991187.620634109045600a. Predictors: (Constant), 第二产业增加值 x2, 第一产业增加值 x1ANOVAbModelSum of SquaresdfMean SquareFSig.Regression1.809E1029.047E96413.953.000aResidual16925313.247121410442.7711Total1.811E1014a. Predictors: (Constant), 第二产业增加值 x2, 第一产业增加值 x1b. D

14、ependent Variable: GDPCoefficientsaUnstandardized CoefficientsStandardized CoefficientsCollinearity StatisticsModelBStd. ErrorBetatSig.ToleranceVIF(Constant)2932.4651335.8892.195.049第一产业增加值 x1.602.298.0802.018.067.04920.2261第二产业增加值 x21.711.074.92123.213.000.04920.226a. Dependent Variable: GDP21711.

15、1602. 0465.2932xxy二元回归方程为:因为2R=0.999 表明回归方程非常显著,并且由方差分析表中可以看出: F=6413.953, P值=0.000 也表明回归方程高度显著,说明 x1 和 x2 整体上对 y 有高度显著影响,但是对于 x1 的系数来说,P 值=0.0670.05,则没通过检验,所以 0.602 明显不合理。从 Coefficients 中看出 VIF1=VIF2=20.22610,说明回归方程中存在着严重的多重共线性 实验三实验三 违背基本假设的情况违背基本假设的情况一、实验题目一、实验题目 1下列数据是用电高峰每小时用电量 y 与每月用电量 x 的数据二、实验内容二、实验内容(1)用普通最小二乘法建立用普通最小二乘法建立 y 与与 x 的回归方程,并画出残差散点图的回归方程,并画出残差散点图CoefficientsUnstandardized CoefficientsBStd. ErrorBetatSig.(Constant)-.831.441 -1.885.065Equ

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号