spss09回归分析电子教案

上传人:yulij****0329 文档编号:141464168 上传时间:2020-08-08 格式:PPT 页数:140 大小:984.50KB
返回 下载 相关 举报
spss09回归分析电子教案_第1页
第1页 / 共140页
spss09回归分析电子教案_第2页
第2页 / 共140页
spss09回归分析电子教案_第3页
第3页 / 共140页
spss09回归分析电子教案_第4页
第4页 / 共140页
spss09回归分析电子教案_第5页
第5页 / 共140页
点击查看更多>>
资源描述

《spss09回归分析电子教案》由会员分享,可在线阅读,更多相关《spss09回归分析电子教案(140页珍藏版)》请在金锄头文库上搜索。

1、第9章 回 归 分 析,Regression,返回,回归分析是处理两个及两个以上变量间线性依存关系的统计方法。回归分析就是用于说明这种依存变化的数学关系。,目 录,线 性 回 归 曲 线 估 计 二项逻辑斯谛回归 多分变量的逻辑斯谛回归 概率单位回归 非线性回归 加 权 回 归 两段最小二乘法 最优尺度回归 习题参考答案,返回,线 性 回 归,返回,调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法,等)。,一元线性回归有关公式,R2判定系数,方差分析,返回,(a) (b) (c) (d),(e) (f) (g

2、),一元线性回归各种残差与预测值关系示意图,返回,多元线性回归的概念,多元回归分析的模型,校正R2判定系数的公式,其中k为自变量的个数,n为观测量数目,偏回归系数和常数项的t检验的公式,返回,回归菜单,返回,回归分析和方差分析都可以被归入广义线性模型中,因此他们在模型的定义、计算方法等许多方面都非常近似,下面大家很快就会看到。 注意的是,模型中的因变量,根据回归模型的要求,它必须是正态分布的变量才可以,我们可以用直方图来大致看一下,可以看它是否基本服从正态,因此不再检验其正态性,继续往下做。例如:请分析在某数据集中变量fat对变量spovl的大小有无影响?,线性回归主对话框,返回,【Depen

3、dent框】选入回归分析的应变量。 【Block按钮组】 由Previous和Next两个按钮组成,用于将下面Independent框中选入的自变量分组。由于多元回归分析中自变量的选入方式有前进、后退、逐步等方法,如果对不同的自变量选入的方法不同,则用该按钮组将自变量分组选入即可。下面的例子会讲解其用法。 【Independent框】选入回归分析的自变量。 【Method下拉列表】 用于选择对自变量的选入方法,有Enter(强行进入法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)五种。该选项对当前Independent框中的所有

4、变量均有效。,【Case Labels框】选择一个变量,他的取值将作为每条记录的标签。最典型的情况是使用记录ID号的变量。 【WLS钮】可利用该按钮进行权重最小二乘法的回归分析。单击该按钮会扩展当前对话框,出现WLS Weight框,在该框内选入权重变量即可。,设定运算规则对话框,返回,【Selection Variable框】 选入一个筛选变量,并利用右侧的Rules钮建立一个选择条件,这样,只有满足该条件的记录才会进入回归分析。,输出统计量对话框,返回,Statistics对话框,用于选择所需要的描述统计量。有如下选项: Regression Coefficients复选框组:定义回归系数

5、的输出情况,选中Estimates可输出回归系数B及其标准误,t值和p值,还有标准化的回归系数beta;选中Confidence intervals则输出每个回归系数的95%可信区间;选中covariance matrix则会输出各个自变量的相关矩阵和方差、协方差矩阵。以上选项默认只选中Estimates。 Residuals复选框组:用于选择输出残差诊断的信息,可选的有Durbin-Watson残差序列相关性检验、超出规定的n倍标准误的残差列表。 Model fit复选框:模型拟合过程中进入、退出的变量的列表,以及一些有关拟合优度的检验:,R,R2和调整的R2, 标准误及方差分析表。 R s

6、quared change复选框:显示模型拟合过程中R2、F值和p值的改变情况。,Descriptives复选框:提供一些变量描述,如有效例数、均数、标准差等,同时还给出一个自变量间的相关矩阵。 Part and partial correlations复选框:显示自变量间的相关、部分相关和偏相关系数。 Collinearity diagnostics复选框:给出一些用于共线性诊断的统计量,如特征根(Eigenvalues)、方差膨胀因子(VIF)等。 以上各项在默认情况下只有Estimates和Model fit复选框被选中。,选择图形对话框,返回,弹出Plot对话框,用于选择需要绘制的回归

7、分析诊断或预测图。可绘制的有标准化残差的直方图和正态分布图,应变量、预测值和各自变量残差间两两的散点图等。,选择对话框,返回,设置回归分析的一些选项,有: Stepping Method Criteria单选钮组:设置纳入和排除标准,可按P值或F值来设置。 Include constant in equation复选框:用于决定是否在模型中包括常数项,默认选中。 Missing Values单选钮组:用于选择对缺失值的处理方式,可以是不分析任一选入的变量有缺失值的记录(Exclude cases listwise)而无论该缺失变量最终是否进入模型;不分析具体进入某变量时有缺失值的记录(Excl

8、ude cases pairwise);将缺失值用该变量的均数代替(Replace with mean)。,简单散点图对话框图,返回,我们只需要在Dependent框中选入spovl,Independent框中选入fat即可,其他的选项一律不管。单击OK后,系统很快给出如下结果:Regression,这里的表格是拟合过程中变量进入/退出模型的情况记录,由于我们只引入了一个自变量,所以只出现了一个模型1(在多元回归中就会依次出现多个回归模型),该模型中fat为进入的变量,没有移出的变量,具体的进入/退出方法为enter。,上表为所拟合模型的情况简报,显示在模型1中相关系数R为0.578,而决定系

9、数R2为0.334,校正的决定系数为0.307。,这是所用模型的检验结果,可以看到这就是一个标准的方差分析表!有兴趣的读者可以自己用方差分析模型做一下,就会发现出了最左侧的一列名字不太一样外,其他的各个参数值都是相同的。从上表可见所用的回归模型F值为12.059,P值为0.002,因此我们用的这个回归模型是有统计学意义的,可以继续看下面系数分别检验的结果。由于这里我们所用的回归模型只有一个自变量,因此模型的检验就等价与系数的检验,在多元回归中这两者是不同的。,上表给出了包括常数项在内的所有系数的检验结果,用的是t检验,同时还会给出标化/未标化系数。可见常数项和fat都是有统计学意义。,复杂实例

10、操作,请分析在数据集变量extrusn、additive、gloss和opacity对变量tear_res的大小有无影响?已知extrusn对tear_res的大小有影响。 显然,这里是一个多元回归,由于除了extrusn确有影响以外,我们不知道另三个变量有无影响,因此这里我们将extrusn放在第一个block,进入方法为enter(我们有把握extrusn一定有统计学意义);另三个变量放在第二个block,进入方法为stepwise(让软件自动选择判断),操作如下: Analyze=Regression=Liner Dependent框:选入tear_res Independent框:选入

11、extrusn;单击next钮 Independent框:选入additive、gloss和opacity;Method列表框:选择stepwise 单击OK钮,上面的表格依次列出了模型的筛选过程,模型1用进入法引入了extrusn,然后模型2用stepwise法引入了additive,另两个变量因没有达到进入标准,最终没有进入。,两个模型变异系数的改变情况,从调整的R2可见,从上到下随着新变量的引入,模型可解释的变异占总变异的比例越来越大。,两个模型的检验结果,用的方法是方差分析,可见二个模型都有统计学意义。,仍然为三个模型中各个系数的检验结果,用的是t检验,可见在模型2中所有的系数都有统计

12、学意义,翻译如下:,这是新出现的一个表格,反映的是没有进入模型的各个变量的检验结果,可见在模型1中,未引入模型的候选变量additive还有统计学意义,可能需要引入,而模型2中没有引入的两个变量其P值均大于0.05,无需再进行分析了。,曲 线 估 计,返回,Curve Estimation过程可以用与拟合各种各样的曲线,原则上只要两个变量间存在某种可以被它所描述的数量关系,就可以用该过程来分析。但这里我们要指出,由于曲线拟合非常的复杂,而该模块的功能十分有限,因此最好采用将曲线相关关系通过变量变换的方式转化为直线回归的形式来分析,或者采用其他专用的模块分析。,曲线估计对话框,返回,Depend

13、ent框:用于选入曲线拟和中的应变量,可选入多个,如果这样,则对各个应变量分别拟合模型。 Independent单选框组:用于选入曲线拟和中的自变量,有两种选择,可以选入普通的自变量,也可以选择时间作为自变量,如果这样做,则所用的数据应为时间序列数据格式。 Models复选框组:是该对话框的重点,用于选择所用的曲线模型,可用的有: Linear:拟合直线方程,实际上与Linear过程的二元直线回归相同; Quadratic:拟合二次方程Y = b0+b1X+b2X2; Compound:拟合复合曲线模型Y = b0b1X; Growth:拟合等比级数曲线模型Y = e(b0+b1X); Log

14、arithmic:拟合对数方程Y = b0+b1lnX; Cubic:拟合三次方程Y = b0+b1X+b2X2+b3X3; S:拟合S形曲线Y = e(b0+b1/X); Exponential:拟合指数方程Y = b0 eb1X; Inverse:数据按Y = b0+b1/X进行变换; Power:拟合乘幂曲线模型Y = b0X b1; Logistic:拟合Logistic曲线模型Y = 1/(1/u + b0b1X),如选择该线型则要求输入上界。 上面的几种线型和其他的模块有重复,如Logistic、Liner等,由于本模块的功能有限,在重复的情况下建议用其它专用模块来分析。,保存对话

15、框,返回,【Include constant in equation复选框】 确定是否在方程中包含常数项。 【Plot models复选框】 要求对模型做图,包括原始数值的连线图和拟合模型的曲线图。 【save钮】 弹出SAVE对话框,用于定义想要存储的中间结果,如预测值、预测值可信区间、残差等。 【Display ANOVA table复选框】 要求显示模型检验的方差分析表。,曲线回归实例散点图,返回,每加仑里程与车重散点图,曲线回归实例输出1,Quadratic模型拟合 系数及其检验结果,模型的方差分析结果,拟合优度的检验,二次模型分析结果,返回,曲线回归实例输出2,返回,三次模型分析结果

16、,CUBIC模型拟合 系数及其检验结果,模型的方差分析结果,拟合优度的检验,曲线回归实例输出3,返回,指数模型分析结果,Compound模型拟合 系数及其检验结果,模型的方差分析结果,拟合优度的检验,提醒,在曲线回归中,模型的简洁性和拟合优度的高低同样重要,拟合优度太高的模型往往对新样本的拟合度较差,我认为在这种情况下选择参数较少的模型为宜。 其实这里由于观察样本太少,无论选择哪种模型影响都不大,而且各人的意见不会相同,往往是有多少条曲线,就会有多少种意见,最后还是要结合专业知识来决定,曲线拟和是非常复杂的问题,千万不能轻易下结论。,二项逻辑斯谛回归,返回,Logistic模型和卡方在原理上是不一样的,在公式推演上也不可能划等号,只是一般来说两者的检验结果会非常接近而已,多数情况下可忽略其不同。,所谓Logistic模型,或者说Logistic回归模型,就是人们想为两分类的应变量作一个回归方程出来,可概率的取值在01之间,回归方程的应变量取值可是在实数集中,直接做会出现01范围之外的不可能结果

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号