第十章spss之线性回归详解1(张文彤)

上传人:平*** 文档编号:10603110 上传时间:2017-10-09 格式:DOC 页数:11 大小:128.83KB
返回 下载 相关 举报
第十章spss之线性回归详解1(张文彤)_第1页
第1页 / 共11页
第十章spss之线性回归详解1(张文彤)_第2页
第2页 / 共11页
第十章spss之线性回归详解1(张文彤)_第3页
第3页 / 共11页
第十章spss之线性回归详解1(张文彤)_第4页
第4页 / 共11页
第十章spss之线性回归详解1(张文彤)_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《第十章spss之线性回归详解1(张文彤)》由会员分享,可在线阅读,更多相关《第十章spss之线性回归详解1(张文彤)(11页珍藏版)》请在金锄头文库上搜索。

1、第十章:多元线性回归与曲线拟合Regression 菜单详解(上)(医学统计之星:张文彤)上次更新日期: 10.1 Linear 过程10.1.1 简单操作入门10.1.1.1 界面详解10.1.1.2 输出结果解释10.1.2 复杂实例操作10.1.2.1 分析实例10.1.2.2 结果解释10.2 Curve Estimation 过程10.2.1 界面详解10.2.2 实例操作10.3 Binary Logistic 过程10.3.1 界面详解与实例10.3.2 结果解释10.3.3 模型的进一步优化与简单诊断10.3.3.1 模型的进一步优化10.3.3.2 模型的简单诊断回归分析是处

2、理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。10.1Linear 过程10.1.1 简单操作入门调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法,等)。例 10.1:请分析在数据集 Fat surfactant.sav 中变量 fat 对变量 spovl 的大小有无影响?显然,在这里 spovl 是连续性变量,而 fat 是分类变量,我们可用

3、用单因素方差分析来解决这个问题。但此处我们要采用和方差分析等价的分析方法-回归分析来解决它。回归分析和方差分析都可以被归入广义线性模型中,因此他们在模型的定义、计算方法等许多方面都非常近似,下面大家很快就会看到。这里 spovl 是模型中的因变量,根据回归模型的要求,它必须是正态分布的变量才可以,我们可以用直方图来大致看一下,可以看到基本服从正态,因此不再检验其正态性,继续往下做。10.1.1.1 界面详解在菜单中选择 Regression=liner,系统弹出线性回归对话框如下:除了大家熟悉的内容以外,里面还出现了一些特色菜,让我们来一一品尝。【Dependent 框】用于选入回归分析的应变

4、量。【Block 按钮组】由 Previous 和 Next 两个按钮组成,用于将下面 Independent 框中选入的自变量分组。由于多元回归分析中自变量的选入方式有前进、后退、逐步等方法,如果对不同的自变量选入的方法不同,则用该按钮组将自变量分组选入即可。下面的例子会讲解其用法。【Independent 框】用于选入回归分析的自变量。【Method 下拉列表】用于选择对自变量的选入方法,有 Enter(强行进入法)、Stepwise (逐步法)、Remove(强制剔除法)、 Backward(向后法)、Forward (向前法)五种。该选项对当前 Independent 框中的所有变量均

5、有效。【Selection Variable 框】选入一个筛选变量,并利用右侧的 Rules 钮建立一个选择条件,这样,只有满足该条件的记录才会进入回归分析。【Case Labels 框】选择一个变量,他的取值将作为每条记录的标签。最典型的情况是使用记录 ID 号的变量。【WLS钮 】可利用该按钮进行权重最小二乘法的回归分析。单击该按钮会扩展当前对话框,出现 WLS Weight 框,在该框内选入权重变量即可。【Statistics 钮】弹出 Statistics 对话框,用于选择所需要的描述统计量。有如下选项: o Regression Coefficients 复选框组:定义回归系数的输出

6、情况,选中 Estimates 可输出回归系数 B 及其标准误,t 值和 p 值,还有标准化的回归系数 beta;选中Confidence intervals 则输出每个回归系数的 95%可信区间;选中 covariance matrix则会输出各个自变量的相关矩阵和方差、协方差矩阵。以上选项默认只选中Estimates。 o Residuals 复选框组:用于选择输出残差诊断的信息,可选的有 Durbin-Watson 残差序列相关性检验、超出规定的 n 倍标准误的残差列表。 o Model fit 复选框:模型拟合过程中进入、退出的变量的列表,以及一些有关拟合优度的检验:,R,R2 和调整

7、的 R2, 标准误及方差分析表。 o R squared change 复选框:显示模型拟合过程中 R2、F 值和 p 值的改变情况。 o Descriptives 复选框:提供一些变量描述,如有效例数、均数、标准差等,同时还给出一个自变量间的相关矩阵。 o Part and partial correlations 复选框:显示自变量间的相关、部分相关和偏相关系数。o Collinearity diagnostics 复选框:给出一些用于共线性诊断的统计量,如特征根(Eigenvalues) 、方差膨胀因子 (VIF)等。以上各项在默认情况下只有 Estimates 和 Model fit

8、复选框被选中。【Plot 钮】弹出 Plot 对话框,用于选择需要绘制的回归分析诊断或预测图。可绘制的有标准化残差的直方图和正态分布图,应变量、预测值和各自变量残差间两两的散点图等。【Save 钮】许多时候我们需要将回归分析的结果存储起来,然后用得到的残差、预测值等做进一步的分析,Save 钮就是用来存储中间结果的。可以存储的有:预测值系列、残差系列、距离(Distances)系列、预测值可信区间系列、波动统计量系列。下方的按钮可以让我们选择将这些新变量存储到一个新的 SPSS 数据文件或 XML 中。【Options 钮 】设置回归分析的一些选项,有: o Stepping Method C

9、riteria 单选钮组:设置纳入和排除标准,可按P 值或 F 值来设置。o Include constant in equation 复选框:用于决定是否在模型中包括常数项,默认选中。o Missing Values 单选钮组:用于选择对缺失值的处理方式,可以是不分析任一选入的变量有缺失值的记录(Exclude cases listwise)而无论该缺失变量最终是否进入模型;不分析具体进入某变量时有缺失值的记录(Exclude cases pairwise);将缺失值用该变量的均数代替(Replace with mean)。10.1.1.2 输出结果解释根据题目的要求,我们只需要在 Depe

10、ndent 框中选入 spovl,Independent框中选入 fat 即可,其他的选项一律不管。单击 OK 后,系统很快给出如下结果:Regression这里的表格是拟合过程中变量进入/退出模型的情况记录,由于我们只引入了一个自变量,所以只出现了一个模型 1(在多元回归中就会依次出现多个回归模型),该模型中 fat 为进入的变量,没有移出的变量,具体的进入/ 退出方法为enter。上表为所拟合模型的情况简报,显示在模型 1 中相关系数 R 为 0.578,而决定系数 R2 为 0.334,校正的决定系数为 0.307。这是所用模型的检验结果,可以看到这就是一个标准的方差分析表!有兴趣的读者

11、可以自己用方差分析模型做一下,就会发现出了最左侧的一列名字不太一样外,其他的各个参数值都是相同的。从上表可见所用的回归模型 F 值为12.059,P 值为 0.002,因此我们用的这个回归模型是有统计学意义的,可以继续看下面系数分别检验的结果。由于这里我们所用的回归模型只有一个自变量,因此模型的检验就等价与系数的检验,在多元回归中这两者是不同的。上表给出了包括常数项在内的所有系数的检验结果,用的是 t 检验,同时还会给出标化/未标化系数。可见常数项和 fat 都是有统计学意义的,上表的内容如果翻译成中文则如下所示:未标准化系数 标准化系数 模型 系数 b 系数标准误 系数 t 值 P 值1 常

12、数 5.097 0.427 11.923 0.000fat 0.700 0.202 0.578 3.473 0.00210.1.2 复杂实例操作10.1.2.1 分析实例例 10.2:请分析在数据集 plastic.sav 中变量 extrusn、additive、gloss 和opacity 对变量 tear_res 的大小有无影响?已知 extrusn 对 tear_res 的大小有影响。显然,这里是一个多元回归,由于除了 extrusn 确有影响以外,我们不知道另三个变量有无影响,因此这里我们将 extrusn 放在第一个 block,进入方法为 enter(我们有把握 extrusn

13、一定有统计学意义);另三个变量放在第二个block,进入方法为 stepwise(让软件自动选择判断),操作如下:1. Analyze=Regression=Liner2. Dependent 框:选入 tear_res3. Independent 框:选入 extrusn;单击 next 钮4. Independent 框:选入 additive、gloss 和 opacity;Method 列表框:选择 stepwise5. 单击 OK 钮10.1.2.2 结果解释最终的结果如下:Regression上面的表格依次列出了模型的筛选过程,模型 1 用进入法引入了 extrusn,然后模型 2

14、 用 stepwise 法引入了 additive,另两个变量因没有达到进入标准,最终没有进入。上面的表格翻译出来如下:模型 进入的变量 移出的变量 变量筛选方法1 extrusn 进入法2 additive stepwise 法(标准:进入概率小于 0.05,移出概率大于 0.1)上表是两个模型变异系数的改变情况,从调整的 R2 可见,从上到下随着新变量的引入,模型可解释的变异占总变异的比例越来越大。上表是所用两个模型的检验结果,用的方法是方差分析,可见二个模型都有统计学意义。上表仍然为三个模型中各个系数的检验结果,用的是 t 检验,可见在模型2 中所有的系数都有统计学意义,上表的内容翻译如

15、下:未标化的系数 标化的系数 模型 B 标准误 Beta t 值 P 值1 (常数) 5.900 .265 22.278 .000extrusion .590 .167 .639 3.522 .0002 (常数) 5.315 .314 16.926 .000extrusion .590 .144 .639 4.905 .000additive .390 .144 .422 2.707 .000这是新出现的一个表格,反映的是没有进入模型的各个变量的检验结果,可见在模型 1 中,未引入模型的候选变量 additive 还有统计学意义,可能需要引入,而模型 2 中没有引入的两个变量其 P 值均大于

16、0.05,无需再进行分析了。10.2 Curve Estimation 过程Curve Estimation 过程可以用与拟合各种各样的曲线,原则上只要两个变量间存在某种可以被它所描述的数量关系,就可以用该过程来分析。但这里我们要指出,由于曲线拟合非常的复杂,而该模块的功能十分有限,因此最好采用将曲线相关关系通过变量变换的方式转化为直线回归的形式来分析,或者采用其他专用的模块分析。10.2.1 界面详解Curve Estimation 过程中有特色的对话框界面内容如下:下面我们分别解释一下它们的具体功能。【Dependent 框】用于选入曲线拟和中的应变量,可选入多个,如果这样,则对各个应变量分别拟合模型。【Independent 单选框组】用于选入曲线拟和中的自变量,有两种选择,可以选入普通的自变量,也可以选择时间作为自变量,如果这样做,则所用的数据应为时间序列数据格式。【Models 复选框组】是该对话框的重点,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号