spss中多元回归分析实例解析

上传人:xzh****18 文档编号:44599762 上传时间:2018-06-14 格式:PDF 页数:11 大小:522.19KB
返回 下载 相关 举报
spss中多元回归分析实例解析_第1页
第1页 / 共11页
spss中多元回归分析实例解析_第2页
第2页 / 共11页
spss中多元回归分析实例解析_第3页
第3页 / 共11页
spss中多元回归分析实例解析_第4页
第4页 / 共11页
spss中多元回归分析实例解析_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《spss中多元回归分析实例解析》由会员分享,可在线阅读,更多相关《spss中多元回归分析实例解析(11页珍藏版)》请在金锄头文库上搜索。

1、SPSS 中多元回归分析实例中多元回归分析实例 在大多数的实际问题中,影响因变量的因素不是一个而是多个, 我们称这类回问 题为多元回归分析。可以建立因变量 y 与各自变量 xj(j=1,2,3,n)之间的多元线 性回归模型: 其中:b0 是回归常数;bk(k=1,2,3,n)是回归参数;e 是随机误差。 多元回归在病虫预报中的应用实例: 某地区病虫测报站用相关系数法选取了以下 4 个预报因子; x1 为最多连续 10 天 诱蛾量(头);x2 为 4 月上、中旬百束小谷草把累计落卵量(块);x3 为 4 月中旬降 水量(毫米),x4 为 4 月中旬雨日(天);预报一代粘虫幼虫发生量 y(头/m2

2、)。 分级别数值列成表 2- 1。 预报量 y:每平方米幼虫 010 头为 1 级,1120 头为 2 级,2140 头为 3 级, 40 头以上为 4 级。 预报因子:x1 诱蛾量 0300 头为 l 级,301600 头为 2 级,6011000 头为 3 级, 1000 头以上为 4 级; x2 卵量 0150 块为 1 级, 15l300 块为 2 级, 301550 块为 3 级,550 块以上为 4 级;x3 降水量 010.0 毫米为 1 级,10.113.2 毫米 为 2 级,13.317.0 毫米为 3 级,17.0 毫米以上为 4 级;x4 雨日 02 天为 1 级, 34

3、 天为 2 级,5 天为 3 级,6 天或 6 天以上为 4 级。 表表 2- 1 x1 x2 x3 x4 y 年 蛾量 级别 卵量 级别 降水量 级别 雨日 级别 幼虫密 度 级别 1960 1022 4 112 1 4.3 1 2 1 10 1 1961 300 1 440 3 0.1 1 1 1 4 1 1962 699 3 67 1 7.5 1 1 1 9 1 1963 1876 4 675 4 17.1 4 7 4 55 4 1965 43 1 80 1 1.9 1 2 1 1 1 1966 422 2 20 1 0 1 0 1 3 1 1967 806 3 510 3 11.8 2

4、 3 2 28 3 1976 115 1 240 2 0.6 1 2 1 7 1 1971 718 3 1460 4 18.4 4 4 2 45 4 1972 803 3 630 4 13.4 3 3 2 26 3 1973 572 2 280 2 13.2 2 4 2 16 2 1974 264 1 330 3 42.2 4 3 2 19 2 1975 198 1 165 2 71.8 4 5 3 23 3 1976 461 2 140 1 7.5 1 5 3 28 3 1977 769 3 640 4 44.7 4 3 2 44 4 1978 255 1 65 1 0 1 0 1 11 2

5、 数据保存在“DATA6- 5.SAV”文件中。 1)准备分析数据 在 SPSS 数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼 虫密度”变量,并输入数据。再创建蛾量、卵量、降水量、雨日和幼虫密度的分 级变量“x1”、“x2”、“x3”、“x4”和“y”,它们对应的分级数值可以在 SPSS 数据编 辑窗口中通过计算产生。编辑后的数据显示如图 2- 1。 图图 2- 1 或者打开已存在的数据文件“DATA6- 5.SAV”。 2)启动线性回归过程 单击 SPSS 主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图 2- 2 所示的

6、线性回归过程线性回归过程窗口。 图图 2- 2 线性回归对话窗口线性回归对话窗口 3) 设置分析变量 设置因变量:设置因变量:用鼠标选中左边变量列表中的“幼虫密度y”变量,然后点击 “Dependent”栏左边的向右拉按钮,该变量就移到“Dependent”因变量显示栏 里。 设置自变量:设置自变量: 将左边变量列表中的“蛾量x1”、 “卵量x2”、 “降水量x3”、 “雨日x4” 变量,选移到“Independent(S)”自变量显示栏里。 设置控制变量设置控制变量: 本例子中不使用控制变量,所以不选择任何变量。 选择标签变量选择标签变量: 选择“年份”为标签变量。 选择加权变量选择加权变量

7、: 本例子没有加权变量,因此不作任何设置。 4)回归方式 本例子中的 4 个预报因子变量是经过相关系数法选取出来的, 在回归分析时不做 筛选。因此在“Method”框中选中“Enter”选项,建立全回归模型。 5)设置输出统计量 单击“Statistics”按钮,将打开如图 2- 3 所示的对话框。该对话框用于设置相关参 数。其中各项的意义分别为: 图图 2- 3 “Statistics”对话框对话框 “Regression Coefficients”回归系数回归系数选项: “Estimates”输出回归系数和相关统计量。 “Confidence interval”回归系数的 95%置信区间。

8、 “Covariance matrix”回归系数的方差- 协方差矩阵。 本例子选择“Estimates”输出回归系数和相关统计量。 “Residuals”残差残差选项: “Durbin- Watson”Durbin- Watson 检验。 “Casewise diagnostic”输出满足选择条件的观测量的相关信息。选择该项, 下面两项处于可选状态: “Outliers outside standard deviations”选择标准化残差的绝对值大于输 入值的观测量; “All cases”选择所有观测量。 本例子都不选。 其它输入选项其它输入选项 “Model fit”输出相关系数、相关系

9、数平方、调整系数、估计标准误、ANOVA 表。 “R squared change”输出由于加入和剔除变量而引起的复相关系数平方的变化。 “Descriptives”输出变量矩阵、标准差和相关系数单侧显著性水平矩阵。 “Part and partial correlation”相关系数和偏相关系数。 “Collinearity diagnostics”显示单个变量和共线性分析的公差。 本例子选择“Model fit”项。 6)绘图选项 在主对话框单击“Plots”按钮,将打开如图 2- 4 所示的对话框窗口。该对话框用于 设置要绘制的图形的参数。图中的“X”和“Y”框用于选择 X 轴和 Y 轴

10、相应的变量。 图图 2- 4“Plots”绘图对话框窗口绘图对话框窗口 左上框中各项的意义分别为左上框中各项的意义分别为: “DEPENDNT”因变量。 “ZPRED”标准化预测值。 “ZRESID”标准化残差。 “DRESID”删除残差。 “ADJPRED”调节预测值。 “SRESID”学生氏化残差。 “SDRESID”学生氏化删除残差。 “Standardized Residual Plots”设置各变量的标准化残差图形输出。其中共包含 两个选项: “Histogram”用直方图显示标准化残差。 “Normal probability plots”比较标准化残差与正态残差的分布示意图。 “

11、Produce all partial plot”偏残差图。对每一个自变量生成其残差对因变量残差的 散点图。 本例子不作绘图,不选择。 7) 保存分析数据的选项 在主对话框里单击“Save”按钮,将打开如图 2- 5 所示的对话框。 图图 2- 5 “Save”对话框对话框 “Predicted Values”预测值栏选项:预测值栏选项: Unstandardized 非标准化预测值。就会在当前数据文件中新添加一个以字 符“PRE_”开头命名的变量,存放根据回 归模型拟合的预测值。 Standardized 标准化预测值。 Adjusted 调整后预测值。 S.E. of mean predi

12、ctions 预测值的标准误。 本例选中“Unstandardized”非标准化预测值。 “Distances”距离栏选项:距离栏选项: Mahalanobis: 距离。 Cooks”: Cook 距离。 Leverage values: 杠杆值。 “Prediction Intervals”预测区间选项:预测区间选项: Mean: 区间的中心位置。 Individual: 观测量上限和下限的预测区间。 在当前数据文件中新添加一个 以字符“LICI_”开头命名的变量,存放 预测区间下限值;以字符“UICI_”开头命名的变量,存放预测区间 上限值。 Confidence Interval:置信度

13、。 本例不选。 “Save to New File”保存为新文件:保存为新文件: 选中“Coefficient statistics”项将回归系数保存到指定的文件中。本例不选。 “Export model information to XML file” 导出统计过程中的回归模型信息 到指定文件。本例不选。 “Residuals” 保存残差选项:保存残差选项: “Unstandardized”非标准化残差。 “Standardized”标准化残差。 “Studentized”学生氏化残差。 “Deleted”删除残差。 “Studentized deleted”学生氏化删除残差。 本例不选。

14、“Influence Statistics” 统计量的影响。统计量的影响。 “DfBeta(s)”删除一个特定的观测值所引起的回归系数的变化。 “Standardized DfBeta(s)”标准化的 DfBeta 值。 “DiFit” 删除一个特定的观测值所引起的预测值的变化。 “Standardized DiFit”标准化的 DiFit 值。 “Covariance ratio”删除一个观测值后的协方差矩隈的行列式和带有全部 观测值的协方差矩阵的行列式的比率。 本例子不保存任何分析变量,不选择。 8)其它选项 在主对话框里单击“Options”按钮,将打开如图 2- 6 所示的对话框。 图

15、图 2- 6 “Options”设置对话框设置对话框 “Stepping Method Criteria”框用于进行逐步回归时内部数值的设定。 其中各 项为: “Use probability of F”如果一个变量的 F 值的概率小于所设置的进入值 (Entry),那么这个变量将被选入回归方程 中;当变量的 F 值的概率大于设置的剔除值(Removal),则该变量将 从回归方程中被剔除。由此可见,设置 “Use probability of F”时,应使进入值小于剔除值。 “Ues F value”如果一个变量的 F 值大于所设置的进入值(Entry),那么这个 变量将被选入回归方程中;当变

16、量的 F 值小于设置的剔除值 (Removal) , 则该变量将从回归方程中被剔除。 同时,设置“Use F value”时,应使进 入值大于剔除值。 本例是全回归不设置。 “Include constant in equation”选择此项表示在回归方程中有常数项。 本例选中“Include constant in equation”选项在回归方程中保留常数项。 “Missing Values”框用于设置对缺失值的处理方法。其中各项为: “Exclude cases listwise”剔除所有含有缺失值的观测值。 “Exchude cases pairwise”仅剔除参与统计分析计算的变量中含有缺失值 的观测量。 “Replace with mean”用变量的均值取代缺失值。 本例选中“Exclude cases listwise”。 9)提交执行 在主对话框里单击“OK”,提交执行,结果

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号