线性回归分析实验报告

上传人:第*** 文档编号:32762209 上传时间:2018-02-12 格式:DOC 页数:7 大小:319.50KB
返回 下载 相关 举报
线性回归分析实验报告_第1页
第1页 / 共7页
线性回归分析实验报告_第2页
第2页 / 共7页
线性回归分析实验报告_第3页
第3页 / 共7页
线性回归分析实验报告_第4页
第4页 / 共7页
线性回归分析实验报告_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《线性回归分析实验报告》由会员分享,可在线阅读,更多相关《线性回归分析实验报告(7页珍藏版)》请在金锄头文库上搜索。

1、实验一:线性回归分析实验目的:通过本次试验掌握回归分析的基本思想和基本方法,理解最小二乘法的计算步骤,理解模型的设定 T 检验,并能够根据检验结果对模型的合理性进行判断,进而改进模型。理解残差分析的意义和重要性,会对模型的回归残差进行正态型和独立性检验,从而能够判断模型是否符合回归分析的基本假设。实验内容:用线性回归分析建立以高血压作为被解释变量,其他变量作为解释变量的线性回归模型。分析高血压与其他变量之间的关系。实验步骤:1、选择 File | Open | Data 命令,打开 gaoxueya.sav图 1-1 数据集 gaoxueya 的部分数据2、 选择 Analyze | Regr

2、ession | Linear命令,弹出 Linear Regression (线性回归) 对话框,如图 1-2 所示。将左侧的血压( y)选入右侧上方的 Dependent(因变量) 框中,作为被解释变量。再分别把年龄(x1) 、体重(x2) 、吸烟指数(x3)选入 Independent (自变量)框中,作为解释变量。在 Method(方法)下拉菜单中,指定自变量进入分析的方法。图 1-2 线性回归分析对话框3、单击 Statistics按钮,弹出 Linear Regression : Statistics(线性回归分析:统计量)对话框,如图 1-3所示。1-3线性回归分析统计量对话框4

3、、单击 Continue 回到线性回归分析对话框。单击 Plots ,打开 Linear Regression:Plots(线性回归分析:图形)对话框,如图 1-4所示。完成如下操作。图 1-4 线性回归分析:图形对话框5、单击 Continue ,回到线性回归分析对话框,单击 Save按钮,打开 Linear Regression;Save 对话框,如图 1-5所示。完成如图操作。图 1-5 线性回归分析:保存对话框6、单击 Continue ,回到线性回归分析对话框,单击 Options 按钮,打开 Linear Regression;Options 对话框,如图 1-6所示。完成如下操作

4、。图 1-6 线性回归分析选项对话框 7、单击 Continue ,回到线性回归分析对话框,然后单击 OK,进入计算分析。实验结论:图 1-7给出了基本的描述性统计量,图中显示各个变量的全部观测量的 Mean(均值) 、Std.Deviation(标准差)和观测量总数 N。图 1-8给出了相关系数矩阵表,其中显示 4个自变量两两间的 Pearson相关系数,以及相关关系等于 0的假设的单位显著性检验概率。Descriptive StatisticsMeanStd. Deviation N血压 1.4444E2 14.30303 32吸烟 .5312 .50701 32年龄 53.4375 6.

5、89056 32体重指数 3.53484 .782755 32图1-7描述性统计量表Correlations血压 吸烟 年龄 体重指数Pearson Correlation血压 1.000 .243 .818 .659吸烟 .243 1.000 -.115 .069年龄 .818 -.115 1.000 .621体重指数 .659 .069 .621 1.000Sig. (1-tailed)血压 . .090 .000 .000吸烟 .090 . .266 .354年龄 .000 .266 . .000体重指数 .000 .354 .000 .N 血压 32 32 32 32吸烟 32 32

6、32 32年龄 32 32 32 32体重指数 32 32 32 32图1-8相关系数矩阵 从表中看到因变量血压与自变量年龄、体重系数的相关系数依次为 0.818、0.659,反应高血压与年龄、体重系数具有显著的相关关系。说明年龄和体重系数对人是否患高血压有显著影响。相比而言,吸烟这个自变量与因变量血压之间的相关系数较小,仅为0.243,说明他们之间的线性关系不显著。说明吸烟对人是否患高血压不具显著影响。此外年龄与体重系数相关系数为 0.621,说明年龄与体重系数之间存在显著性相关关系。图 7-9给出了进入模型和被剔除的变量的信息,从表中我们可以看出,3 个自变量都进入模型,说明我们的解释变量

7、都是显著并且是有解释力的。Variables Entered/RemovedbModelVariables EnteredVariables Removed Method1 体重指数, 吸烟, 年龄 a . Entera. All requested variables entered.b. Dependent Variable: 血压图1-9变量进入|剔除信息表图 1-10给出了模型整体拟合效果的概述,模型的拟合度系数为 0.895,反映了因变量与自变量之间具有高度显著的关系。Model SummarybModel R R SquareAdjusted R SquareStd. Error

8、of the Estimate Durbin-Watson1 .895a .801 .780 6.70636 1.213a. Predictors: (Constant), 体重指数, 吸烟, 年龄b. Dependent Variable: 血压图1-10 模型概述表图 1-11给出了方差分析表,我们可以看到模型的设定检验 F统计量的值为 37.669,显著性水平的 P值几乎为 0,于是我们的模型通过了设定检验,也就是说,因变量与自变量之间的显著性关系明显。ANOVAbModel Sum of Squares df Mean Square F Sig.Regression 5082.566

9、3 1694.189 37.669 .000aResidual 1259.309 28 44.9751Total 6341.875 31a. Predictors: (Constant), 体重指数, 吸烟, 年龄b. Dependent Variable: 血压图1-11 方差分析表图1-12给出了回归系数表和变量显著性的T值,我们发现,所有变量的T值都达到显著性水平。CoefficientsaUnstandardized CoefficientsStandardized CoefficientsModel B Std. Error Beta t Sig.(Constant) 45.724

10、9.746 4.692 .000吸烟 8.922 2.431 .316 3.670 .001年龄 1.547 .228 .745 6.798 .0001体重指数 3.195 1.995 .175 1.601 .120a. Dependent Variable: 血压图1-12 回归系数表图1-13给出了残差分析表,表中显示预测值、残差、标准化预测值、标准化最小值、最大值、均值、标准差及样本容量等。标准化残差的绝对值最大为2.044,小于3,说明样本中无奇异值。Residuals StatisticsaMinimum Maximum Mean Std. Deviation NPredicted

11、Value 119.5472 168.4835 1.4444E2 12.80444 32Std. Predicted Value -1.944 1.878 .000 1.000 32Standard Error of Predicted Value 1.648 5.992 2.245 .775 32Adjusted Predicted Value 118.7923 175.4356 1.4456E2 13.31790 32Residual -9.57664 13.71040 .00000 6.37361 32Std. Residual -1.428 2.044 .000 .950 32Stud

12、. Residual -1.474 2.206 -.003 1.012 32Deleted Residual -1.02007E1 15.96993 -.11840 7.34545 32Stud. Deleted Residual -1.507 2.384 .007 1.038 32Mahal. Distance .903 23.777 2.906 3.982 32Cooks Distance .000 .395 .043 .078 32Centered Leverage Value .029 .767 .094 .128 32a. Dependent Variable: 血压图1-13 残差

13、统计表图1-14 和1-15 给出了模型残差的直方图和正态概率P-P图。图1-14 残差分布直方图图1-15 正态概率P-P 图从正态概率P-P图,图中的散点大致散布于斜线附近,因此可以认为残差分布基本上是正态的。从之前的分析结果来看,我们的模型需要剔除变量x2,用本次试验同样的方法对y、x1、x3进行回归,得到结果如图1-16、1-17、1-18所示。Model SummarybModel R R SquareAdjusted R SquareStd. Error of the Estimate Durbin-Watson1 .840a .706 .686 8.01925 1.198a. P

14、redictors: (Constant), 体重指数, 年龄b. Dependent Variable: 血压图1-16 模型概述ANOVAbModel Sum of Squares df Mean Square F Sig.Regression 4476.931 2 2238.465 34.808 .000aResidual 1864.944 29 64.3081Total 6341.875 31a. Predictors: (Constant), 体重指数, 年龄b. Dependent Variable: 血压图1-17 方差分析表CoefficientsaUnstandardized CoefficientsStandardized CoefficientsModel B Std. Error Beta t Sig.(Constant) 54.798 11.273 4.861 .000年龄 1.379 .267 .664 5.173 .0001体重指数 4.513 2.347 .247 1.923 .064a. Dependent Variable: 血压4-18 方差分析表

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 工程造价

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号