spss中多元回归分析实例解析

资源描述

《spss中多元回归分析实例解析》由会员分享，可在线阅读，更多相关《spss中多元回归分析实例解析（11页珍藏版）》请在金锄头文库上搜索。

1、SPSS 中多元回归分析实例中多元回归分析实例在大多数的实际问题中，影响因变量的因素不是一个而是多个，我们称这类回问题为多元回归分析。可以建立因变量 y 与各自变量 xj(j=1,2,3,n)之间的多元线性回归模型：其中：b0 是回归常数；bk(k=1,2,3,n)是回归参数；e 是随机误差。多元回归在病虫预报中的应用实例: 某地区病虫测报站用相关系数法选取了以下 4 个预报因子； x1 为最多连续 10 天诱蛾量(头)；x2 为 4 月上、中旬百束小谷草把累计落卵量(块)；x3 为 4 月中旬降水量(毫米)，x4 为 4 月中旬雨日(天)；预报一代粘虫幼虫发生量 y（头/m2

2、）。分级别数值列成表 2- 1。预报量 y：每平方米幼虫 010 头为 1 级，1120 头为 2 级，2140 头为 3 级， 40 头以上为 4 级。预报因子：x1 诱蛾量 0300 头为 l 级，301600 头为 2 级，6011000 头为 3 级， 1000 头以上为 4 级； x2 卵量 0150 块为 1 级， 15l300 块为 2 级， 301550 块为 3 级，550 块以上为 4 级；x3 降水量 010.0 毫米为 1 级，10.113.2 毫米为 2 级，13.317.0 毫米为 3 级，17.0 毫米以上为 4 级；x4 雨日 02 天为 1 级， 34

3、天为 2 级，5 天为 3 级，6 天或 6 天以上为 4 级。表表 2- 1 x1 x2 x3 x4 y 年蛾量级别卵量级别降水量级别雨日级别幼虫密度级别 1960 1022 4 112 1 4.3 1 2 1 10 1 1961 300 1 440 3 0.1 1 1 1 4 1 1962 699 3 67 1 7.5 1 1 1 9 1 1963 1876 4 675 4 17.1 4 7 4 55 4 1965 43 1 80 1 1.9 1 2 1 1 1 1966 422 2 20 1 0 1 0 1 3 1 1967 806 3 510 3 11.8 2

4、 3 2 28 3 1976 115 1 240 2 0.6 1 2 1 7 1 1971 718 3 1460 4 18.4 4 4 2 45 4 1972 803 3 630 4 13.4 3 3 2 26 3 1973 572 2 280 2 13.2 2 4 2 16 2 1974 264 1 330 3 42.2 4 3 2 19 2 1975 198 1 165 2 71.8 4 5 3 23 3 1976 461 2 140 1 7.5 1 5 3 28 3 1977 769 3 640 4 44.7 4 3 2 44 4 1978 255 1 65 1 0 1 0 1 11 2

5、数据保存在“DATA6- 5.SAV”文件中。 1）准备分析数据在 SPSS 数据编辑窗口中，创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密度”变量，并输入数据。再创建蛾量、卵量、降水量、雨日和幼虫密度的分级变量“x1”、“x2”、“x3”、“x4”和“y”，它们对应的分级数值可以在 SPSS 数据编辑窗口中通过计算产生。编辑后的数据显示如图 2- 1。图图 2- 1 或者打开已存在的数据文件“DATA6- 5.SAV”。 2）启动线性回归过程单击 SPSS 主菜单的“Analyze”下的“Regression”中“Linear”项，将打开如图 2- 2 所示的

6、线性回归过程线性回归过程窗口。图图 2- 2 线性回归对话窗口线性回归对话窗口 3) 设置分析变量设置因变量：设置因变量：用鼠标选中左边变量列表中的“幼虫密度y”变量，然后点击 “Dependent”栏左边的向右拉按钮，该变量就移到“Dependent”因变量显示栏里。设置自变量：设置自变量：将左边变量列表中的“蛾量x1”、 “卵量x2”、 “降水量x3”、 “雨日x4” 变量，选移到“Independent(S)”自变量显示栏里。设置控制变量设置控制变量: 本例子中不使用控制变量，所以不选择任何变量。选择标签变量选择标签变量: 选择“年份”为标签变量。选择加权变量选择加权变量

7、: 本例子没有加权变量，因此不作任何设置。 4）回归方式本例子中的 4 个预报因子变量是经过相关系数法选取出来的，在回归分析时不做筛选。因此在“Method”框中选中“Enter”选项，建立全回归模型。 5）设置输出统计量单击“Statistics”按钮，将打开如图 2- 3 所示的对话框。该对话框用于设置相关参数。其中各项的意义分别为：图图 2- 3 “Statistics”对话框对话框 “Regression Coefficients”回归系数回归系数选项： “Estimates”输出回归系数和相关统计量。 “Confidence interval”回归系数的 95%置信区间。

8、 “Covariance matrix”回归系数的方差- 协方差矩阵。本例子选择“Estimates”输出回归系数和相关统计量。 “Residuals”残差残差选项： “Durbin- Watson”Durbin- Watson 检验。 “Casewise diagnostic”输出满足选择条件的观测量的相关信息。选择该项，下面两项处于可选状态： “Outliers outside standard deviations”选择标准化残差的绝对值大于输入值的观测量； “All cases”选择所有观测量。本例子都不选。其它输入选项其它输入选项 “Model fit”输出相关系数、相关系

9、数平方、调整系数、估计标准误、ANOVA 表。 “R squared change”输出由于加入和剔除变量而引起的复相关系数平方的变化。 “Descriptives”输出变量矩阵、标准差和相关系数单侧显著性水平矩阵。 “Part and partial correlation”相关系数和偏相关系数。 “Collinearity diagnostics”显示单个变量和共线性分析的公差。本例子选择“Model fit”项。 6）绘图选项在主对话框单击“Plots”按钮，将打开如图 2- 4 所示的对话框窗口。该对话框用于设置要绘制的图形的参数。图中的“X”和“Y”框用于选择 X 轴和 Y 轴

10、相应的变量。图图 2- 4“Plots”绘图对话框窗口绘图对话框窗口左上框中各项的意义分别为左上框中各项的意义分别为： “DEPENDNT”因变量。 “ZPRED”标准化预测值。 “ZRESID”标准化残差。 “DRESID”删除残差。 “ADJPRED”调节预测值。 “SRESID”学生氏化残差。 “SDRESID”学生氏化删除残差。 “Standardized Residual Plots”设置各变量的标准化残差图形输出。其中共包含两个选项： “Histogram”用直方图显示标准化残差。 “Normal probability plots”比较标准化残差与正态残差的分布示意图。 “

11、Produce all partial plot”偏残差图。对每一个自变量生成其残差对因变量残差的散点图。本例子不作绘图，不选择。 7) 保存分析数据的选项在主对话框里单击“Save”按钮，将打开如图 2- 5 所示的对话框。图图 2- 5 “Save”对话框对话框 “Predicted Values”预测值栏选项：预测值栏选项： Unstandardized 非标准化预测值。就会在当前数据文件中新添加一个以字符“PRE_”开头命名的变量，存放根据回归模型拟合的预测值。 Standardized 标准化预测值。 Adjusted 调整后预测值。 S.E. of mean predi

12、ctions 预测值的标准误。本例选中“Unstandardized”非标准化预测值。 “Distances”距离栏选项：距离栏选项： Mahalanobis: 距离。 Cooks”: Cook 距离。 Leverage values: 杠杆值。 “Prediction Intervals”预测区间选项：预测区间选项： Mean: 区间的中心位置。 Individual: 观测量上限和下限的预测区间。在当前数据文件中新添加一个以字符“LICI_”开头命名的变量，存放预测区间下限值；以字符“UICI_”开头命名的变量，存放预测区间上限值。 Confidence Interval：置信度

13、。本例不选。 “Save to New File”保存为新文件：保存为新文件：选中“Coefficient statistics”项将回归系数保存到指定的文件中。本例不选。 “Export model information to XML file” 导出统计过程中的回归模型信息到指定文件。本例不选。 “Residuals” 保存残差选项：保存残差选项： “Unstandardized”非标准化残差。 “Standardized”标准化残差。 “Studentized”学生氏化残差。 “Deleted”删除残差。 “Studentized deleted”学生氏化删除残差。本例不选。

14、“Influence Statistics” 统计量的影响。统计量的影响。 “DfBeta(s)”删除一个特定的观测值所引起的回归系数的变化。 “Standardized DfBeta(s)”标准化的 DfBeta 值。 “DiFit” 删除一个特定的观测值所引起的预测值的变化。 “Standardized DiFit”标准化的 DiFit 值。 “Covariance ratio”删除一个观测值后的协方差矩隈的行列式和带有全部观测值的协方差矩阵的行列式的比率。本例子不保存任何分析变量，不选择。 8）其它选项在主对话框里单击“Options”按钮，将打开如图 2- 6 所示的对话框。图

15、图 2- 6 “Options”设置对话框设置对话框 “Stepping Method Criteria”框用于进行逐步回归时内部数值的设定。其中各项为： “Use probability of F”如果一个变量的 F 值的概率小于所设置的进入值（Entry），那么这个变量将被选入回归方程中；当变量的 F 值的概率大于设置的剔除值（Removal），则该变量将从回归方程中被剔除。由此可见，设置 “Use probability of F”时，应使进入值小于剔除值。 “Ues F value”如果一个变量的 F 值大于所设置的进入值（Entry），那么这个变量将被选入回归方程中；当变

16、量的 F 值小于设置的剔除值（Removal），则该变量将从回归方程中被剔除。同时，设置“Use F value”时，应使进入值大于剔除值。本例是全回归不设置。 “Include constant in equation”选择此项表示在回归方程中有常数项。本例选中“Include constant in equation”选项在回归方程中保留常数项。 “Missing Values”框用于设置对缺失值的处理方法。其中各项为： “Exclude cases listwise”剔除所有含有缺失值的观测值。 “Exchude cases pairwise”仅剔除参与统计分析计算的变量中含有缺失值的观测量。 “Replace with mean”用变量的均值取代缺失值。本例选中“Exclude cases listwise”。 9）提交执行在主对话框里单击“OK”，提交执行，结果

展开阅读全文