第十章多元线性回归与曲线拟合-regression菜单详解上

上传人:bin****86 文档编号:49674697 上传时间:2018-08-01 格式:DOC 页数:13 大小:248KB
返回 下载 相关 举报
第十章多元线性回归与曲线拟合-regression菜单详解上_第1页
第1页 / 共13页
第十章多元线性回归与曲线拟合-regression菜单详解上_第2页
第2页 / 共13页
第十章多元线性回归与曲线拟合-regression菜单详解上_第3页
第3页 / 共13页
第十章多元线性回归与曲线拟合-regression菜单详解上_第4页
第4页 / 共13页
第十章多元线性回归与曲线拟合-regression菜单详解上_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《第十章多元线性回归与曲线拟合-regression菜单详解上》由会员分享,可在线阅读,更多相关《第十章多元线性回归与曲线拟合-regression菜单详解上(13页珍藏版)》请在金锄头文库上搜索。

1、第十章:多元线性回归与曲线拟合第十章:多元线性回归与曲线拟合RegressionRegression 菜单详解(上)菜单详解(上)(医学统计之星:张文彤)上次更新日期: 10.110.1 LinearLinear 过程过程 10.1.1 简单操作入门 10.1.1.1 界面详解 10.1.1.2 输出结果解释 10.1.2 复杂实例操作 10.1.2.1 分析实例 10.1.2.2 结果解释 10.210.2 CurveCurve EstimationEstimation 过程过程 10.2.1 界面详解 10.2.2 实例操作 10.310.3 BinaryBinary LogisticLo

2、gistic 过程过程 10.3.1 界面详解与实例 10.3.2 结果解释 10.3.3 模型的进一步优化与简单诊断 10.3.3.1 模型的进一步优化 10.3.3.2 模型的简单诊断回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学 领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的 含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说 明这种依存变化的数学关系。10.110.1 LinearLinear 过程过程10.1.110.1.1 简单操作入门简单操作入门调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中, 用户还可根据

3、需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后 法,等)。例 10.1:请分析在数据集 Fat surfactant.sav 中变量 fat 对变量 spovl 的大小有无影响?显然,在这里 spovl 是连续性变量,而 fat 是分类变量,我们可用用单因 素方差分析来解决这个问题。但此处我们要采用和方差分析等价的分析方法- 回归分析来解决它。回归分析和方差分析都可以被归入广义线性模型中,因此他们在模型的定 义、计算方法等许多方面都非常近似,下面大家很快就会看到。这里 spovl 是模型中的因变量,根据回归模型的要求,它必须是正态分布 的变量才可以,我们可以用直方图来大致看一下,可以

4、看到基本服从正态,因 此不再检验其正态性,继续往下做。10.1.1.1 界面详解在菜单中选择 Regression=liner,系统弹出线性回归对话框如下:除了大家熟悉的内容以外,里面还出现了一些特色菜,让我们来一一品尝。【Dependent 框】用于选入回归分析的应变量。【Block 按钮组】由 Previous 和 Next 两个按钮组成,用于将下面 Independent 框中选入的 自变量分组。由于多元回归分析中自变量的选入方式有前进、后退、逐步等方 法,如果对不同的自变量选入的方法不同,则用该按钮组将自变量分组选入即 可。下面的例子会讲解其用法。【Independent 框】用于选入

5、回归分析的自变量。【Method 下拉列表】用于选择对自变量的选入方法,有 Enter(强行进入法)、Stepwise(逐 步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)五 种。该选项对当前 Independent 框中的所有变量均有效。【Selection Variable 框】选入一个筛选变量,并利用右侧的 Rules 钮建立一个选择条件,这样,只 有满足该条件的记录才会进入回归分析。【Case Labels 框】选择一个变量,他的取值将作为每条记录的标签。最典型的情况是使用记 录 ID 号的变量。【WLS钮】可利用该按钮进行权重最小二乘法的回归分

6、析。单击该按钮会扩展当前对 话框,出现 WLS Weight 框,在该框内选入权重变量即可。【Statistics 钮】弹出 Statistics 对话框,用于选择所需要的描述统计量。有如下选项: oRegression Coefficients 复选框组:定义回归系数的输出情况,选中 Estimates 可输出回归系数 B 及其标准误,t 值和 p 值,还有标准化的回 归系数 beta;选中 Confidence intervals 则输出每个回归系数的 95%可 信区间;选中 covariance matrix 则会输出各个自变量的相关矩阵和方 差、协方差矩阵。以上选项默认只选中 Esti

7、mates。 oResiduals 复选框组:用于选择输出残差诊断的信息,可选的有 Durbin- Watson 残差序列相关性检验、超出规定的 n 倍标准误的残差列表。 oModel fit 复选框:模型拟合过程中进入、退出的变量的列表,以及一 些有关拟合优度的检验:,R,R2 和调整的 R2, 标准误及方差分析表。 oR squared change 复选框:显示模型拟合过程中 R2、F 值和 p 值的改变 情况。 oDescriptives 复选框:提供一些变量描述,如有效例数、均数、标准差 等,同时还给出一个自变量间的相关矩阵。 oPart and partial correlatio

8、ns 复选框:显示自变量间的相关、部分 相关和偏相关系数。 oCollinearity diagnostics 复选框:给出一些用于共线性诊断的统计量, 如特征根(Eigenvalues)、方差膨胀因子(VIF)等。以上各项在默认情况下只有 Estimates 和 Model fit 复选框被选中。【Plot 钮】弹出 Plot 对话框,用于选择需要绘制的回归分析诊断或预测图。可绘制的 有标准化残差的直方图和正态分布图,应变量、预测值和各自变量残差间两两 的散点图等。【Save 钮】许多时候我们需要将回归分析的结果存储起来,然后用得到的残差、预测 值等做进一步的分析,Save 钮就是用来存储中

9、间结果的。可以存储的有:预测 值系列、残差系列、距离(Distances)系列、预测值可信区间系列、波动统计 量系列。下方的按钮可以让我们选择将这些新变量存储到一个新的 SPSS 数据文 件或 XML 中。【Options 钮】设置回归分析的一些选项,有: oStepping Method Criteria 单选钮组:设置纳入和排除标准,可按 P 值或 F 值来设置。oInclude constant in equation 复选框:用于决定是否在模型中包 括常数项,默认选中。oMissing Values 单选钮组:用于选择对缺失值的处理方式,可以是 不分析任一选入的变量有缺失值的记录(Ex

10、clude cases listwise)而 无论该缺失变量最终是否进入模型;不分析具体进入某变量时有缺失值 的记录(Exclude cases pairwise);将缺失值用该变量的均数代替 (Replace with mean)。10.1.1.2 输出结果解释根据题目的要求,我们只需要在 Dependent 框中选入 spovl,Independent 框中选入 fat 即可,其他的选项一律不管。单击 OK 后,系统很快给出如下结果:RegressionRegression这里的表格是拟合过程中变量进入/退出模型的情况记录,由于我们只引入了一 个自变量,所以只出现了一个模型 1(在多元回归

11、中就会依次出现多个回归模 型),该模型中 fat 为进入的变量,没有移出的变量,具体的进入/退出方法为 enter。上表为所拟合模型的情况简报,显示在模型 1 中相关系数 R 为 0.578,而决定 系数 R2为 0.334,校正的决定系数为 0.307。这是所用模型的检验结果,可以看到这就是一个标准的方差分析表!有兴趣的 读者可以自己用方差分析模型做一下,就会发现出了最左侧的一列名字不太一 样外,其他的各个参数值都是相同的。从上表可见所用的回归模型 F 值为 12.059,P 值为 0.002,因此我们用的这个回归模型是有统计学意义的,可以继 续看下面系数分别检验的结果。由于这里我们所用的回

12、归模型只有一个自变量,因此模型的检验就等价与 系数的检验,在多元回归中这两者是不同的。上表给出了包括常数项在内的所有系数的检验结果,用的是 t 检验,同时还会 给出标化/未标化系数。可见常数项和 fat 都是有统计学意义的,上表的内容如 果翻译成中文则如下所示:未标准化系数标准化系数模型系数 b 系数标准误系数t 值P 值1常数5.0970.427 11.923 0.000fat 0.7000.2020.5783.473 0.00210.1.210.1.2 复杂实例操作复杂实例操作10.1.2.1 分析实例例 10.2:请分析在数据集 plastic.sav 中变量 extrusn、addit

13、ive、gloss 和 opacity 对变量 tear_res 的大小有无影响?已知 extrusn 对 tear_res 的大 小有影响。显然,这里是一个多元回归,由于除了 extrusn 确有影响以外,我们不知 道另三个变量有无影响,因此这里我们将 extrusn 放在第一个 block,进入方 法为 enter(我们有把握 extrusn 一定有统计学意义);另三个变量放在第二 个 block,进入方法为 stepwise(让软件自动选择判断),操作如下:1.Analyze=Regression=Liner 2.Dependent 框:选入 tear_res 3.Independent

14、 框:选入 extrusn;单击 next 钮 4.Independent 框:选入 additive、gloss 和 opacity;Method 列表 框:选择 stepwise 5.单击 OK 钮10.1.2.2 结果解释最终的结果如下:RegressionRegression上面的表格依次列出了模型的筛选过程,模型 1 用进入法引入了 extrusn,然后模型 2 用 stepwise 法引入了 additive,另两个变量因没有达到 进入标准,最终没有进入。上面的表格翻译出来如下:模型 进入的变量 移出的变量变量筛选方法1extrusn 进入法2additive stepwise 法

15、(标准:进入概率小于 0.05,移出概率大于 0.1)上表是两个模型变异系数的改变情况,从调整的 R2可见,从上到下随着新 变量的引入,模型可解释的变异占总变异的比例越来越大。上表是所用两个模型的检验结果,用的方法是方差分析,可见二个模型都 有统计学意义。上表仍然为三个模型中各个系数的检验结果,用的是 t 检验,可见在模型 2 中所有的系数都有统计学意义,上表的内容翻译如下:未标化的系数 标化的系数模型 B标准误 Betat 值P 值1(常数)5.900 .265 22.278 .000extrusion.590.167.6393.522.0002(常数)5.315 .314 16.926.0

16、00extrusion.590.144.6394.905.000additive .390.144.4222.707.000这是新出现的一个表格,反映的是没有进入模型的各个变量的检验结果, 可见在模型 1 中,未引入模型的候选变量 additive 还有统计学意义,可能需要引入,而模型 2 中没有引入的两个变量其 P 值均大于 0.05,无需再进行分析了。10.210.2 CurveCurve EstimationEstimation 过程过程Curve Estimation 过程可以用与拟合各种各样的曲线,原则上只要两个变 量间存在某种可以被它所描述的数量关系,就可以用该过程来分析。但这里我 们要指出,由于曲线拟合非常的复杂,而该模块的功能十分有限,因此最好采 用将曲线相关关系通过变量变换的方式转化为直线回归的形式来分析,或者采 用其他专用的模块分析。10.2.1 界面详解Curve Estimation 过程中有特色的对话框界面内容如下:下面我们分别解释一下它们的具体功能。【Dependent 框】用于选入曲线拟和中的应变量,可选入多个,如果这样,则对各个应变

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号