线性回归分析实验报告

上传人:新** 文档编号:505278456 上传时间:2022-10-23 格式:DOC 页数:8 大小:311.50KB
返回 下载 相关 举报
线性回归分析实验报告_第1页
第1页 / 共8页
线性回归分析实验报告_第2页
第2页 / 共8页
线性回归分析实验报告_第3页
第3页 / 共8页
线性回归分析实验报告_第4页
第4页 / 共8页
线性回归分析实验报告_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《线性回归分析实验报告》由会员分享,可在线阅读,更多相关《线性回归分析实验报告(8页珍藏版)》请在金锄头文库上搜索。

1、实验一:线性回归分析实验目的:通过本次试验掌握回归分析的基本思想和基本方法,理解最小二乘法 的计算步骤,理解模型的设定T检验,并能够根据检验结果对模型的合理性进行 判断,进而改进模型。理解残差分析的意义和重要性,会对模型的回归残差进行 正态型和独立性检验,从而能够判断模型是否符合回归分析的基本假设。实验内容:用线性回归分析建立以高血压作为被解释变量,其他变量作为解释变 量的线性回归模型。分析高血压与其他变量之间的关系。 实验步骤:1、选择 File | Open | Data 命令,打开 gaoxueya.sav图1-1数据集gaoxueya的部分数据2、选择 Analyze I Regres

2、sion I Linear命令,弹出 Linear Regression (线性回归)对话框,如 图1-2所示。将左侧的血压(y)选入右侧上方的Dependent(因变量)框中,作为被解释 变量。再分别把年龄(xl)、体重(x2)、吸烟指数(x3)选入Independent (自变量) 框中,作为解释变量。在Method (方法)下拉菜单中,指定自变量进入分析的方法。图1-2线性回归分析对话框3、单击Statistics按钮,弹出Linear Regression : Statistics (线性回归分析:统计 量)对话框,如图1-3所示。HRjBgrGssion Caefficieirt 回

3、E湎st品 3 ConfidEnce interi/ais0 回ei TtCoriance mairi:HRjesMbals叼 Durhin-Wat=cnJ Casewise diagnostics Qutliers outside:1R squared change叵| DsscrptMSPart and parted airrelstians_| ColinMrrt/ di-cidicsstandard cteYialions)AI8 casesContiriueCancel1-3线性回归分析统计量对话框4、单击Continue回到线性回归分析对话框。单击Piots ,打开Linear R

4、egression:Plots (线性回归分析:图形)对话框,如图1-4所示。完成如下操作。图1- 4线性回归分析:图形对话框5、单击Continue,回到线性回归分析对话框,单击Save按钮,打开Linear Regression; Save对话框,如图1-5所示。完成如图操作。图1-5线性回归分析:保存对话框6、单击Con tinue ,回到线性回归分析对话框,单击Opt ions按钮,打开Linear Regression; Options对话框,如图1-6所示。完成如下操作。图1-6线性回归分析选项对话框7、单击Con tinue,回到线性回归分析对话框,然后单击OK,进入计算分析。实

5、验结论:图1-7给出了基本的描述性统计量,图中显示各个变量的全部观测量的Mean (均值)、 Std.Deviation (标准差)和观测量总数N。图1-8给出了相关系数矩阵表,其中显示4个自变量两两间的Pearson相关系数,以及相关关系等于0的假设的单位显著性检验概率。MeanStd.DeviationN血压1.4444E214.3030332吸烟.5312.5070132年龄53.43756.8905632体重指数3.53484.78275532Descriptive Statistics图1-7描述性统计量表血压吸烟年龄体重指数Pearson血压1.000.243.818.659Cor

6、relatio吸烟.2431.000-.115.069n年龄.818-.1151.000.621体重指数.659.069.6211.000Sig.血压.090.000.000(1-tailed)吸烟.090.266.354年龄.000.266.000体重指数.000.354.000N血压32323232吸烟32323232年龄32323232体重指数32323232Correlations图1-8相关系数矩阵从表中看到因变量血压与自变量年龄、体重系数的相关系数依次为0.818、0.659,反应高血压与年龄、体重系数具有显著的相关关系。说明年龄和体重系数对人是否患高血压有 显著影响。相比而言,吸

7、烟这个自变量与因变量血压之间的相关系数较小,仅为0.243,说 明他们之间的线性关系不显著。说明吸烟对人是否患高血压不具显著影响。此外年龄与体重 系数相关系数为0.621,说明年龄与体重系数之间存在显著性相关关系。图 7-9 给出了进入模型和被剔除的变量的信息,从表中我们可以看出,3 个自变量都进入 模型,说明我们的解释变量都是显著并且是有解释力的。Variables Entered/RemovedbModelVariablesEnteredVariablesRemovedMethod1体重指数,吸烟, 年龄aEntera. All requested variables entered.b.

8、 Dependent Variable:血压图1-9变量进入I剔除信息表图 1-10 给出了模型整体拟合效果的概述,模型的拟合度系数为 0.895,反映了因变量 与自变量之间具有高度显著的关系。Model SummarybModelRR SquareAdjusted RSquareStd. Error of theEstimateDurbin-Watson1.895a.801.7806.706361.213a. Predictors: (Constant),体重指数,吸烟,年龄b. Dependent Variable:血压图1-10 模型概述表图1-11给出了方差分析表,我们可以看到模型的设

9、定检验F统计量的值为37.669,显 著性水平的P值几乎为0,于是我们的模型通过了设定检验,也就是说,因变量与自变量之 间的显著性关系明显。ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression5082.56631694.18937.669000aResidual1259.3092844.975Total6341.87531a. Predictors: (Constant),体重指数,吸烟,年龄b. Dependent Variable:血压图1-11方差分析表图1-12给出了回归系数表和变量显著性的T值,我们发现,所有变量的T值都达到显著

10、性 水平。CoefficientsaModelUnstandardized CoefficientsStandardizedCoefficientstSig.BStd. ErrorBeta1(Constant)45.7249.7464.692.000吸烟8.9222.431.3163.670.001年龄1.547.228.7456.798.000体重指数3.1951.995.1751.601.120a. Dependent Variable:血压图1-12回归系数表图1-13给出了残差分析表,表中显示预测值、残差、标准化预测值、标准化最小值、最 大值、均值、标准差及样本容量等。标准化残差的绝对

11、值最大为2.044,小于3,说明样本中 无奇异值。Res dualsStatlsticsaMinimumMaximumMeanStd. DeviationNPredicted Value119.5472168.48351.4444E212.8044432Std. Predicted Value-1.9441.878.0001.00032Standard Error of PredictedValue1.6485.9922.245.77532Adjusted Predicted Value118.7923175.43561.4456E213.3179032Residual-9.5766413.7

12、1040.000006.3736132Std. Residual-1.4282.044.000.95032Stud. Residual-1.4742.206-.0031.01232Deleted Residual-1.02007E115.96993-.118407.3454532Stud. Deleted Residual-1.5072.384.0071.03832Mahal. Distance.90323.7772.9063.98232Cooks Distance.000.395.043.07832Centered Leverage Value.029.767.094.12832a. Dep

13、endent Variable:血压图1-13残差统计表图1-14和1-15给出了模型残差的直方图和正态概率P-P图。HistogramDependent Variable: lil jk.-I- 仆3Regression Standardized Residual图1-14残差分布直方图Normal P-P Plot of Regression Standardized ResidualDependent Variable: iLJK1.0or _ _ _.S.6.4.2 o o o Ed Eao ps養石C.i:1.00.0子0.0Observed Cum Prcb图1-15正态概率P-P图从正态概率P-P图,图中的散点大致散布于斜线附近,因此可以认为残差分布 基本上是正态的。从之前的分析结果来看,我们的模型需要剔除变量x2,用本次试验同样的方 法对y、xl、x3进行回归,得到结果如图1-16、1-17、1-18所示。Model SummarybModelRR SquareAdjusted RSquareStd. Error of theEstimateDurbin-Watson1.840a.706

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号