回归分析SPSS操作课件

上传人:cl****1 文档编号:573945513 上传时间:2024-08-15 格式:PPT 页数:42 大小:1.41MB
返回 下载 相关 举报
回归分析SPSS操作课件_第1页
第1页 / 共42页
回归分析SPSS操作课件_第2页
第2页 / 共42页
回归分析SPSS操作课件_第3页
第3页 / 共42页
回归分析SPSS操作课件_第4页
第4页 / 共42页
回归分析SPSS操作课件_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《回归分析SPSS操作课件》由会员分享,可在线阅读,更多相关《回归分析SPSS操作课件(42页珍藏版)》请在金锄头文库上搜索。

1、回回归归分析分析1PPT学习交流 回归分析基本回归分析基本概念概念1 一元线性回归一元线性回归分析分析2多元线性回归分析多元线性回归分析32PPT学习交流回归分析基本概念回归分析基本概念1 回回归归分析主要解决以下几方面的分析主要解决以下几方面的问题问题:q 通通过过分析大量的分析大量的样样本数据,确定本数据,确定变变量之量之间间的数学关系式。的数学关系式。q 对对所确定的数学关系式的可信程度所确定的数学关系式的可信程度进进行各种行各种统计检验统计检验,并,并区分出区分出对对某一特定某一特定变变量影响量影响较为显较为显著的著的变变量和影响不量和影响不显显著的著的变变量。量。q 利用所确定的数学

2、关系式,根据一个或几个利用所确定的数学关系式,根据一个或几个变变量的量的值值来来预预测测或控制另一个特定或控制另一个特定变变量的取量的取值值,并,并给给出出这这种种预测预测或控制的或控制的精确度。精确度。 3PPT学习交流2.1 统计学上的定义和计算公式统计学上的定义和计算公式 定定义义:一元:一元线线性回性回归归分析是分析某一个因素分析是分析某一个因素(自(自变变量)是如何影响另一事物(因量)是如何影响另一事物(因变变量)的量)的过过程,程,所所进进行的分析是比行的分析是比较较理想化的。其理想化的。其实实,在,在现实现实生活生活中,任何一个事物(因中,任何一个事物(因变变量)量)总总是受到其

3、他多种事是受到其他多种事物(多个自物(多个自变变量)的影响。量)的影响。一元线性回归分析一元线性回归分析24PPT学习交流 研究问题研究问题 合成合成纤维纤维的的强强度与其拉伸倍数有关,度与其拉伸倍数有关,测测得得试验试验数据如表数据如表9-1所示。求合成所示。求合成纤维纤维的的强强度与拉伸倍数之度与拉伸倍数之间间是否存在是否存在显显著的著的线线性相关关系。性相关关系。2.2 SPSS中实现过程中实现过程5PPT学习交流表表表表1 1强度与拉伸倍数的试验数据强度与拉伸倍数的试验数据强度与拉伸倍数的试验数据强度与拉伸倍数的试验数据序序 号号拉拉 伸伸 倍倍 数数强度(强度(kg/mm2)12.0

4、1.622.52.432.72.543.52.754.03.564.54.275.25.086.36.497.16.5108.07.3119.08.01210.08.16PPT学习交流 实现步骤实现步骤图图图图1 1 在菜单中选择在菜单中选择在菜单中选择在菜单中选择“ “Linear”Linear”命令命令命令命令7PPT学习交流图图图图2 “Linear Regression”2 “Linear Regression”对话框对话框对话框对话框因变量因变量因变量因变量自变量自变量自变量自变量指定回归方法指定回归方法指定回归方法指定回归方法全部选入全部选入全部选入全部选入8PPT学习交流图图图图

5、3 “Linear Regression: statistics”3 “Linear Regression: statistics”对话框对话框对话框对话框与回归系数相与回归系数相与回归系数相与回归系数相关的统计量关的统计量关的统计量关的统计量提供决定系数、估提供决定系数、估提供决定系数、估提供决定系数、估计计计计标标标标准准准准误误误误、ANOVAANOVA表表表表等等等等异常值诊断异常值诊断异常值诊断异常值诊断报报报报告残差超告残差超告残差超告残差超过过过过2 2 2 2个个个个标标标标准差的被准差的被准差的被准差的被试试试试9PPT学习交流 图图图图4 “Linear Regressio

6、n4 “Linear Regression:Plots”Plots”对话框对话框对话框对话框 调整预测值调整预测值调整预测值调整预测值标准化预测值标准化预测值标准化预测值标准化预测值标准化残差标准化残差标准化残差标准化残差剔除残差剔除残差剔除残差剔除残差学生化残差学生化残差学生化残差学生化残差学生化剔除残差学生化剔除残差学生化剔除残差学生化剔除残差输出标准化残差相对输出标准化残差相对输出标准化残差相对输出标准化残差相对于因变量的散布图于因变量的散布图于因变量的散布图于因变量的散布图标准化残差图标准化残差图标准化残差图标准化残差图直方图直方图直方图直方图正态概率图正态概率图正态概率图正态概率图1

7、0PPT学习交流对应x值的残差图x0良好模式11PPT学习交流x0方差不齐12PPT学习交流x0不满足线性回归假设13PPT学习交流图图图图5 “Linear Regression5 “Linear Regression:Save”Save”对话框对话框对话框对话框 预测值预测值预测值预测值残差残差残差残差本对话框用来定义存储本对话框用来定义存储本对话框用来定义存储本对话框用来定义存储进入数据文件的新变量进入数据文件的新变量进入数据文件的新变量进入数据文件的新变量预测区间预测区间预测区间预测区间均数的置信区间均数的置信区间个体的容许区间个体的容许区间学生化残差学生化残差学生化残差学生化残差标准

8、化残差标准化残差标准化残差标准化残差未标准化残差未标准化残差未标准化残差未标准化残差14PPT学习交流 (1 1)输出的结果文件中的第一部分:)输出的结果文件中的第一部分:X与与Y的简单相关系数的简单相关系数2.3 结果和讨论结果和讨论15PPT学习交流1)决定系数R2它表示在因变量y的总变异中可由回归方程所解释部分的比例。0R21,越接近于1,说明回归方程效果越好。q2)校正的决定系数)校正的决定系数Adj R2 0AdjR21, 越接近于越接近于1, 说明回归方程效果越好。说明回归方程效果越好。q即使自变量对即使自变量对Y无显著意义,无显著意义,R2也随方程中的变量也随方程中的变量个数增加

9、而增加。个数增加而增加。Adj R2可以惩罚复杂模型。可以惩罚复杂模型。16PPT学习交流F=t2截距截距回归系数回归系数标准化回归系数结果显示:回归方程显著,即合成纤维的强度受拉伸倍数的显著影响结果显示:回归方程显著,即合成纤维的强度受拉伸倍数的显著影响17PPT学习交流(2 2)第二部分)第二部分 异常值分析异常值分析q 如果标准化残差超过如果标准化残差超过2/-2,称为异常值,称为异常值outliers。q 当样本量比较小,异常值又会影响回归系数的估计时,应当样本量比较小,异常值又会影响回归系数的估计时,应该关注异常值的影响。该关注异常值的影响。q 异常值 a 不影响 异常值 b 影响1

10、8PPT学习交流第i个观察值的学生化残差q 考虑了用来计算残差的考虑了用来计算残差的 值有不同的方差。这种值有不同的方差。这种调整能够使残差分析更加敏感地发现方差不齐。调整能够使残差分析更加敏感地发现方差不齐。q学生化残差学生化残差超超过过2 2和和-2的点可的点可认为认为是异常是异常值值19PPT学习交流(3)第三部分)第三部分 数据窗口的存储数据窗口的存储 未标准化残差 标准化残差 学生化残差预测区间预测区间预测区间预测区间均数的置信区间均数的置信区间个体的容许区间个体的容许区间20PPT学习交流1.7利用回归方程进行估计和预测均数的置信区间: 均数界值标准误 个体的容许区间(参考值范围)

11、: 均数界值标准差 21PPT学习交流可信区间与预测区间示意图22PPT学习交流3.1 统计学上的定义统计学上的定义 定定义义:在上一:在上一节节中中讨论讨论的回的回归问题归问题只涉及了一只涉及了一个自个自变变量,但在量,但在实际问题实际问题中,影响因中,影响因变变量的因素往量的因素往往有多个。例如,商品的需求除了受自身价格的影往有多个。例如,商品的需求除了受自身价格的影响外,响外,还还要受到消要受到消费费者收入、其他商品的价格、消者收入、其他商品的价格、消费费者偏好等因素的影响;影响水果者偏好等因素的影响;影响水果产产量的外界因素量的外界因素有平均气温、平均日照有平均气温、平均日照时时数、平

12、均湿度等。数、平均湿度等。多元线性回归分析多元线性回归分析323PPT学习交流研究者往往是根据自己的经验或借鉴他人的研究结果选定若干个自变量,这些自变量对因变量的影响作用是否都有统计学意义还有待于考察。在建立回归方程的过程中有必要考虑对自变量进行筛选,挑选出若干个与因变量作用较大的变量建立回归方程。剔除那些对因变量没有影响的变量,从而建立一个较理想和稳定的回归方程。3.2 逐步回归逐步回归24PPT学习交流逐步回归的思想:1.开始方程中没有自变量,然后按自变量对y的贡献大小由大到小依次挑选进入方程,每选入一个变量,都要对进行检验,决定变量的取或舍。q 2. 每一步都作一次如下的检验:每一步都作

13、一次如下的检验: H0 : p个自变量为好个自变量为好 H1 : p+1个自变量为好个自变量为好25PPT学习交流采用F作为统计量。 SSE (H0 )-SSE (H1 ) F SSE(H1 )/ (n-p-2) 其中SSE (H0 )表示用p个变量回归的残差平方和 SSE (H1 )表示用p+1个变量回归的残差平方和。 若FF(界值),则拒绝H0 ,可决定增多相应的自变量; 否则,不拒绝H0 ,可决定不增加相应的自变量。26PPT学习交流 研究问题研究问题 用多元回归分析来分析用多元回归分析来分析36个员工多个心理变量个员工多个心理变量值(值(z1z5)对员工满意度)对员工满意度my的预测效

14、果,测得试的预测效果,测得试验数据如表验数据如表9-2所示。所示。3.2 SPSS中实现过程中实现过程27PPT学习交流表表表表9-29-2员工多个心理变量值和员工满意度数据员工多个心理变量值和员工满意度数据员工多个心理变量值和员工满意度数据员工多个心理变量值和员工满意度数据z1z2z3z4Z5满满 意意 度度66.0064.0058.001.081.0025.0055.0050.0053.001.001.1122.0050.0047.0046.001.311.2020.0055.0059.0052.001.001.0020.0055.0059.0047.001.001.0024.0062.0

15、054.0046.001.081.0023.0060.0060.0052.001.081.0021.0052.0052.0057.001.001.0023.0056.0055.0044.001.691.0015.0050.0050.0045.001.081.1425.0058.0054.0052.001.001.0025.0053.0052.0065.001.081.0022.0052.0056.0063.001.461.4320.0056.0065.0062.001.001.0022.0050.0063.0055.001.001.0020.0063.0057.0051.001.001.002

16、6.0056.0046.0045.002.231.2921.0047.0050.0050.002.081.1420.0053.0066.0055.001.001.0025.0028PPT学习交流z1z2z3z4z5满满 意意 度度61.0055.0058.001.151.1423.0059.0064.0054.001.081.0026.0055.0060.0055.001.081.0026.0056.0052.0051.001.851.7130.0059.0051.0052.001.001.0025.0060.0053.0047.001.311.1427.0052.0051.0055.001.

17、231.1420.0056.0057.0059.001.001.1426.0068.0058.0053.001.001.0030.0060.0053.0056.001.001.0027.0064.0056.0059.001.851.1418.0067.0053.0053.001.001.0024.0056.0056.0056.001.001.0024.0053.0046.0050.001.311.1419.0053.0057.0067.001.771.4317.0060.0040.0056.001.081.0024.0054.0045.0042.001.001.0023.0029PPT学习交流

18、 实现步骤实现步骤图图图图7-7 “Linear Regression”7-7 “Linear Regression”对话框(二)对话框(二)对话框(二)对话框(二)逐步回归逐步回归逐步回归逐步回归Enter:所有自变量强制进入回归方程:所有自变量强制进入回归方程30PPT学习交流图图图图3 “Linear Regression3 “Linear Regression:Statistics”Statistics”对话框对话框对话框对话框描述性统计量描述性统计量描述性统计量描述性统计量部分相关和偏相关部分相关和偏相关部分相关和偏相关部分相关和偏相关共线性诊断共线性诊断共线性诊断共线性诊断德德德德

19、宾宾宾宾- - - -沃森自相关沃森自相关沃森自相关沃森自相关关于回归系数的选择项关于回归系数的选择项关于回归系数的选择项关于回归系数的选择项非非非非标标标标准化回准化回准化回准化回归归归归系数系数系数系数95%95%置信区置信区置信区置信区间间间间非非非非标标标标准化回准化回准化回准化回归归归归系数的方差系数的方差系数的方差系数的方差- - - -协协协协方差方差方差方差与回归系数相关的统计量与回归系数相关的统计量与回归系数相关的统计量与回归系数相关的统计量提供决定系数、估提供决定系数、估提供决定系数、估提供决定系数、估计计计计标标标标准准准准误误误误、ANOVAANOVA表表表表等等等等显

20、显显显示每个自示每个自示每个自示每个自变变变变量量量量进进进进入方程后入方程后入方程后入方程后对对对对R R R R2 2 2 2和和和和F F F F值值值值的影响的影响的影响的影响观测值诊断观测值诊断观测值诊断观测值诊断31PPT学习交流当自变量之间存在高度相关性,将引起回归方程估计结果不稳定,参数(回归系数)估计的标准误大大增加,称为共线性。共线性诊断:1)条件数(ConditionIndex):k10(轻度)10k30(严重)2)方差扩大因子(VIF):5或10,严重3)Tolence(容忍度):.1严重32PPT学习交流图图图图6 “Linear Regression6 “Linea

21、r Regression:Options”Options”对话框对话框对话框对话框 逐步回逐步回逐步回逐步回归归归归法法法法变变变变量取舍量取舍量取舍量取舍标标标标准准准准用用用用F F F F值值值值的的的的显显显显著性水平作著性水平作著性水平作著性水平作为标为标为标为标准准准准用用用用F F F F值值值值作作作作为标为标为标为标准准准准在回在回在回在回归归归归方程中包括常方程中包括常方程中包括常方程中包括常项项项项缺失缺失缺失缺失值值值值的的的的处处处处理方式理方式理方式理方式用均用均用均用均值值值值代替缺失代替缺失代替缺失代替缺失值值值值33PPT学习交流 (1 1)输出结果文件中的第

22、一部分:)输出结果文件中的第一部分:3.3 结果和讨论结果和讨论复相关=R2YR2y.12YX1X234PPT学习交流 (1 1)输出结果文件中的第一部分:)输出结果文件中的第一部分:3.3 结果和讨论结果和讨论R2的改变都是显著的,说明增加自变量可以显著的改变都是显著的,说明增加自变量可以显著地改善对因变量的预测地改善对因变量的预测第三个回归方程的解释率最高35PPT学习交流 2 2)输出的结果文件中第二部分:)输出的结果文件中第二部分:F检验的结果显示,三个回归方程都显著检验的结果显示,三个回归方程都显著1 H0 : B1=02 H0 : B1= B2=03 H0 : B1= B2= B3

23、=036PPT学习交流非标准化回归方程:非标准化回归方程:1Y=7.337+.276Z1+e2Y=14.129+.227Z1-3.301Z4+e3Y=4.335+.268Z1-6.286Z4+10.188Z5+e标准化回归方程:标准化回归方程:1Y=.413Z1+e2Y=.340Z1- .336Z4+ e3Y=.401Z1- 6.639Z4 + .477Z5+e多重回归的矩阵表达1. 一般公式一般公式 2. 矩阵表示矩阵表示 3. 最小二乘估计最小二乘估计37PPT学习交流YX1X2Zero-Order 零零阶阶相关相关/ /简单简单相关相关38PPT学习交流Part Correlation部

24、分相关部分相关YX1X2Part correlation Correlation between Y and X1 when variable due to X2 has been partialed out of X1, but not out of Y.39PPT学习交流Partial Correlation偏相关偏相关YX1X2partial correlation of Y and X, controlling for other predictors. Simple correlation of Y and X, after all influences of predictors have been partialed out of both Y and X.40PPT学习交流作业等距、等级和分类变量的相关一元回归二元回归各做一个分析,数据“作业.sav”41PPT学习交流此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!42PPT学习交流

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 市场营销

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号