SPSS-相关分析与回归分析专题.ppt

上传人:工**** 文档编号:567998080 上传时间:2024-07-23 格式:PPT 页数:123 大小:4.29MB
返回 下载 相关 举报
SPSS-相关分析与回归分析专题.ppt_第1页
第1页 / 共123页
SPSS-相关分析与回归分析专题.ppt_第2页
第2页 / 共123页
SPSS-相关分析与回归分析专题.ppt_第3页
第3页 / 共123页
SPSS-相关分析与回归分析专题.ppt_第4页
第4页 / 共123页
SPSS-相关分析与回归分析专题.ppt_第5页
第5页 / 共123页
点击查看更多>>
资源描述

《SPSS-相关分析与回归分析专题.ppt》由会员分享,可在线阅读,更多相关《SPSS-相关分析与回归分析专题.ppt(123页珍藏版)》请在金锄头文库上搜索。

1、相关分析与回归分析相关分析与回归分析专题相关分析与回归分析专题(Correlation & regression)相关分析与回归分析相关分析相关分析(Correlation Analysis)相关分析与回归分析一、相关分析的意义:一、相关分析的意义:研究问题过程:单变量分析研究问题过程:单变量分析 双变量分析双变量分析 多变量分析多变量分析多多变变量量分分析析与与单单变变量量分分析析的的最最大大不不同同:揭揭示示客客观观事事物物之之间间的关联性。的关联性。所以,相关分析的意义和目的在于:所以,相关分析的意义和目的在于:(1 1)在统计学中有理论与实践意义)在统计学中有理论与实践意义(2 2)对

2、相关关系的存在性给出判断)对相关关系的存在性给出判断 ( 3 ) ( 3 ) 对相关关系的强度给出度量和分析对相关关系的强度给出度量和分析相关分析与回归分析二、相关分析的概念二、相关分析的概念 变量之间的关系分为确定性关系和非确定性关系。变量之间的关系分为确定性关系和非确定性关系。 确定性关系:当一个变量值(自变量)确定后,另一个变确定性关系:当一个变量值(自变量)确定后,另一个变量值(因变量)也就完全确定了,确定性关系往往可以表量值(因变量)也就完全确定了,确定性关系往往可以表示成一个示成一个函数函数的形式,比如圆的面积和半径的关系:的形式,比如圆的面积和半径的关系: S= S= r r 非

3、确定性关系:给定了一个变量值后,另一个变量值可以非确定性关系:给定了一个变量值后,另一个变量值可以在一定范围内变化,例如家庭的消费支出和家庭收入的关在一定范围内变化,例如家庭的消费支出和家庭收入的关系。系。 研究者把研究者把非确定性关系称为相关关系非确定性关系称为相关关系。相关分析与回归分析三三. .相关分析的特点和应用相关分析的特点和应用 相关关系是普遍存在的,函数关系仅是相关关系的特例。相关关系是普遍存在的,函数关系仅是相关关系的特例。 1. 1.相关关系的类型相关关系的类型 相关关系多种多样,归纳起来大致有以下相关关系多种多样,归纳起来大致有以下6 6种:种:l 强正相关关系强正相关关系

4、,其特点是一变量,其特点是一变量X X增加,导致另一变量增加,导致另一变量 Y Y明显增加,说明明显增加,说明X X是影响是影响Y Y的主要因素。的主要因素。l 弱正相关关系弱正相关关系,其特点是一变量,其特点是一变量X X增加,导致另一变量增加,导致另一变量Y Y增加,但增加幅度不明显。增加,但增加幅度不明显。l 强负相关关系强负相关关系,其特点是,其特点是X X增加,导致增加,导致Y Y明显减少,说明显减少,说明明X X是影响是影响Y Y的主要因素的主要因素相关分析与回归分析l弱负相关关系弱负相关关系,其特点是变量,其特点是变量X X增加,导致增加,导致Y Y减少,但减少,但 减少幅度不明

5、显,说明减少幅度不明显,说明X X是是Y Y的影响因素,但不是唯一的影响因素,但不是唯一 因素。因素。l 非线性相关关系非线性相关关系,其特点是,其特点是X X、Y Y之间没有明显的线性之间没有明显的线性 关系,却存在着某种非线性关系,说明关系,却存在着某种非线性关系,说明X X仍是影响仍是影响Y Y的的 因素。因素。l 不相关不相关,其特点是,其特点是X X、Y Y不存在相关关系,说明不存在相关关系,说明X X不是不是 影响影响Y Y的因素。的因素。相关分析与回归分析2. 2.相关分析的应用相关分析的应用 (1 1)相关分析可以在影响某个变量的诸多变量中判断哪)相关分析可以在影响某个变量的诸

6、多变量中判断哪些是显著的,哪些是不显著的。而且在得到相关分析的些是显著的,哪些是不显著的。而且在得到相关分析的结果后,可以结果后,可以用于其他分析用于其他分析,如回归分析和因子分析。,如回归分析和因子分析。 (2 2) 相关分析方法已广泛用于心理学、教育学、医学、经济相关分析方法已广泛用于心理学、教育学、医学、经济学等各学科。它对试验数据的处理、经验公式的建立、学等各学科。它对试验数据的处理、经验公式的建立、管理标准的测定、自然现象和经济现象的统计预报,都管理标准的测定、自然现象和经济现象的统计预报,都是一种方便而且有效的工具。是一种方便而且有效的工具。相关分析与回归分析四、相关系数四、相关系

7、数l相相关关分分析析的的主主要要目目的的是是研研究究变变量量之之间间关关系系的的密密切切程程度度,以以及及根根据据样样本本的的资资料料推推断断总总体体是是否否样样关关。反反映映变变量量之之间间关关系系紧紧密密程程度度的的指指标标主主要要是是相相关关系系数数r r。相相关关系系数数r r取取值值在在- -1 1到到+1+1之之间间,当当数数值值愈愈接接近近- -1 1或或+1+1时时,说说明明关关系系愈愈紧紧密密,接接近近于于0 0时时,说说明明关关系系不不紧紧密密。相关分析与回归分析相关系数的计算相关系数的计算l样本的相关系数一般用样本的相关系数一般用r r表示,总体的相关系数一般用表示,总体

8、的相关系数一般用p p表表示。示。l对于不同类型的变量,相关系数的计算公式不同。在相关对于不同类型的变量,相关系数的计算公式不同。在相关分析中,常用的相关系数有:分析中,常用的相关系数有: PearsonPearson简单简单相关系数相关系数:对定距连续变量的数据进行计算。:对定距连续变量的数据进行计算。如测度收入和储蓄,身高和体重。如测度收入和储蓄,身高和体重。 SpearmanSpearman等级相关系数等级相关系数:用于度量定序变量间的线性相关:用于度量定序变量间的线性相关关系。如军队教员的军衔与职称。关系。如军队教员的军衔与职称。 Kendall Kendall r r相关系数相关系数

9、:用非参数检验方法来度量定序变量间的线性相用非参数检验方法来度量定序变量间的线性相关关系。计算基于数据的秩。关关系。计算基于数据的秩。相关分析与回归分析PearsonPearson相关系数应用广泛,其计算公式及其性质如下:相关系数应用广泛,其计算公式及其性质如下:相关分析与回归分析在在AnalyzeAnalyze的下拉菜单的下拉菜单CorrelateCorrelate命令项中有三个相关命令项中有三个相关分析功能子命令分析功能子命令:l Bivariate(两两相关分析过程)(两两相关分析过程)l Partial (偏相关分析过程)(偏相关分析过程)l Distances(距离分析过程)(距离分

10、析过程)五、五、SPSSSPSS中相关分析中相关分析CorrelationCorrelation菜单菜单 相关分析与回归分析Bivariate过程程相关分析与回归分析lBivariateBivariate过程用于进行两个或多个变量间的参数与非过程用于进行两个或多个变量间的参数与非参数相关分析,如为多个变量,给出两两相关的分析参数相关分析,如为多个变量,给出两两相关的分析结果。这是结果。这是correlatecorrelate菜单中最常用的一个过程,包括自菜单中最常用的一个过程,包括自动计算动计算PearsonPearson简单相关系数、简单相关系数、T T检验统计量和对应的检验统计量和对应的概

11、率概率P P值。值。相关分析与回归分析举例:举例:对肺活量和体重做相对肺活量和体重做相关分析关分析 1 1. .打开打开SAVSAV数据。数据。 2. 2.用散点图初步观察两变量用散点图初步观察两变量间有无相关趋势,依次单击间有无相关趋势,依次单击菜单菜单“Graphs-Chart Graphs-Chart Builder”Builder”打开图形构建器,打开图形构建器,选择做散点图(选择做散点图(Scatter Scatter /Dot)/Dot)。 相关分析与回归分析 3. 3.设置相关分析的参数。设置相关分析的参数。 依次单击依次单击“Analyze-Correlate-Analyze-

12、Correlate-Bivariate”Bivariate”执行两变量相关分析。其主设置面执行两变量相关分析。其主设置面板如图所示:板如图所示:待分析变量列表待分析变量列表变量列表变量列表相关系数相关系数显著性检验选项显著性检验选项相关分析与回归分析相关分析与回归分析(2 2)相关性输出,)相关性输出,“相关性相关性”表格给出的是表格给出的是PearsonPearson相关系数及其检验结果:相关系数及其检验结果:“相关系数相关系数”表格给出的表格给出的是两个非参数相关系数及其检验结果。可见,是两个非参数相关系数及其检验结果。可见,3 3个相个相关系数在关系数在0.010.01和和0.050.0

13、5的显著性水平(双边检验)上都的显著性水平(双边检验)上都非常显著,从而推断体重和肺活量之间存在着明显非常显著,从而推断体重和肺活量之间存在着明显的正相关关系。的正相关关系。(1 1)描述性输出,)描述性输出,“描述性统计量描述性统计量”表格给出了两表格给出了两个变量的基本统计信息,包括均值、标准差和频率。个变量的基本统计信息,包括均值、标准差和频率。相关分析与回归分析 Partial 过程相关分析与回归分析l偏相关分析偏相关分析也称净相关分析,它在控制其他变量的线性也称净相关分析,它在控制其他变量的线性影响下分析两变量间的线性相关,所采用的是工具是影响下分析两变量间的线性相关,所采用的是工具

14、是偏偏相关系数相关系数(净相关系数)。运用偏相关分析可以有效地(净相关系数)。运用偏相关分析可以有效地揭示变量间的真实关系,识别干扰变量并寻找隐含的相揭示变量间的真实关系,识别干扰变量并寻找隐含的相关性。关性。如控制年龄和工作经验的影响,估计工资收入与如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系。受教育水平之间的相关关系。lPartialPartial过程,当程,当进行行相关分析相关分析的两个的两个变量的取量的取值都受到其他都受到其他变量的量的影响影响时,就可以利用偏,就可以利用偏相关分析相关分析对其他其他变量量进行控制,行控制,输出控制其他出控制其他变量影响后的量影响后

15、的相关相关系数。系数。相关分析与回归分析举例:举例:分析身高与肺活量之间的相关性,要控制体重在分析身高与肺活量之间的相关性,要控制体重在相关分析过程中的影响。相关分析过程中的影响。1. 1.设置偏相关分析的参数。设置偏相关分析的参数。 依次单击依次单击“Analyze-Correlate-Analyze-Correlate-Patial”Patial”执行偏相关分析。其主设置面板如图所示执行偏相关分析。其主设置面板如图所示:相关分析与回归分析0 0阶偏相关阶偏相关(Pearson)Pearson)1 1阶偏相关阶偏相关显著相关显著相关相关不显著相关不显著相关分析与回归分析(1 1)描述性输出,

16、)描述性输出,“描述性统计量描述性统计量”表格给出了三个表格给出了三个变量的基本统计信息,包括均值、标准差和频率。变量的基本统计信息,包括均值、标准差和频率。(2 2)相关性输出,)相关性输出,“相关性相关性”表格给出了所有变量的表格给出了所有变量的0 0阶偏相关(阶偏相关(PearsonPearson简单相关)系数和简单相关)系数和1 1阶偏相关系数的阶偏相关系数的计算结果果、以及它们各自的显著性检验计算结果果、以及它们各自的显著性检验P P值。分析结值。分析结果显示:在体重果显示:在体重 不变的条件下,身高与肺活量之间不存在显著不变的条件下,身高与肺活量之间不存在显著 线性相关关系。线性相

17、关关系。相关分析与回归分析Distances过程过程相关分析与回归分析l距离分析:距离分析:此过程可以在观测记录之间或者此过程可以在观测记录之间或者 不同变量之间进行不同变量之间进行相似性和不相似性相似性和不相似性分析。相似性分分析。相似性分析可以用于检测观测值的接近程度,不相似性分析可析可以用于检测观测值的接近程度,不相似性分析可用于考察各变量的内在联系和结构。该过程一般不单用于考察各变量的内在联系和结构。该过程一般不单独使用,而是作为因子分析、聚类分析和多维尺度分独使用,而是作为因子分析、聚类分析和多维尺度分析等的预分析过程,以帮助了解复杂数据集的内部结析等的预分析过程,以帮助了解复杂数据

18、集的内部结构,为进一步的分析做准备。构,为进一步的分析做准备。l与距离分析有关的统计量分为相似性测度和不相似性与距离分析有关的统计量分为相似性测度和不相似性测试两大类。测试两大类。相关分析与回归分析l不相似性测度不相似性测度a a、对定距、对定距变量变量的测度可以使用的统计量有的测度可以使用的统计量有EuclidEuclid欧氏距离、欧氏距离、平方欧氏距离平方欧氏距离、契比雪夫距离、契比雪夫距离等。等。 b b、对、对定序变量,定序变量,使用卡方使用卡方不相似测度和不相似测度和PhiPhi方不相似测度方不相似测度。c c、对二值(只有两种取值)、对二值(只有两种取值)变量变量,使用欧氏距离、平

19、方欧,使用欧氏距离、平方欧氏距离、氏距离、Lane and Williams Lane and Williams 不相似测度。不相似测度。l相似性测度:相似性测度:a a、对定距、对定距变量的测度,主要有变量的测度,主要有统计量统计量PearsonPearson相关或余弦相关或余弦距距离离。 b b 、对二值变量的相似性测度主要包括简单匹配系数、对二值变量的相似性测度主要包括简单匹配系数、JaccarJaccard d相似性指数等。相似性指数等。在通常使用的距离中,最常用的是在通常使用的距离中,最常用的是欧式距离。欧式距离。相关分析与回归分析案例:打开案例:打开“地区经济发展水平指标地区经济发

20、展水平指标.sav”.sav”相关分析与回归分析参数设置:参数设置:距离的计算对象距离的计算对象距离的测度类型距离的测度类型分析变量例表分析变量例表相关分析与回归分析结果分析:结果分析:相关分析与回归分析(1 1)案例处理摘要。)案例处理摘要。“案例处理摘要案例处理摘要”表格给出了数表格给出了数据使用的基本情况。主要是对有无缺失值的统计信息,据使用的基本情况。主要是对有无缺失值的统计信息,可见本例的可见本例的1111个案例没有缺失,全部用于分析。个案例没有缺失,全部用于分析。(2 2)近似矩阵。)近似矩阵。“近似矩阵近似矩阵”表格给出的是各变量之表格给出的是各变量之间的相似矩阵,图中以线框标注

21、了相关系数较大的几对间的相似矩阵,图中以线框标注了相关系数较大的几对变量。它们在进一步的分析中应重点关注,或者直接对变量。它们在进一步的分析中应重点关注,或者直接对其进行适当的预处理(例如变量约减)其进行适当的预处理(例如变量约减)相关分析与回归分析相关分析与回归分析相关分析与回归分析线性回归线性回归相关分析与回归分析线性回归事事物物关系关系函数关系函数关系(一一对应)(一一对应)统计关系统计关系(非一一对应(非一一对应)线性相关线性相关非线性相关非线性相关相关分析与回归分析回归分析(regression analysis) 确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。p涉及

22、的自变量的多少a.一元回归分析b.多元回归分析p自变量和因变量之间的关系类型,a.线性回归分析b.非线性回归分析线性回归相关分析与回归分析回归分析一般步骤:确定回归方程中的解释变量(自变量)和被解释变量(因变量)确定回归模型建立回归方程对回归方程进行各种检验利用回归方程进行预测线性回归相关分析与回归分析一元线性回归模型是指只有一个解释变量的线性回归模型,用于揭示被解释变量与另一个解释变量之间的线性关系。一元线性回归数学模型:其中0和1是未知参数,分别称为回归常数和回归系数,称为随机误差,是一个随机变量,且应该满足两个前提条件: E( )=0 var()=2线性回归模型线性回归模型线性回归相关分

23、析与回归分析多元线性回归模型是指有多个解释变量的线性回归模型,用于揭示被解释变量与其他多个解释变量之间的线性关系。多元线性回归数学模型:其中0、1、 p都是未知参数,分别称为回归常数和偏回归系数,称为随机误差,是一个随机变量,且同样满足两个前提条件: E( )=0 var()=2线性回归线性回归模型线性回归模型相关分析与回归分析回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSEOLSE)线性回归方程确定后的任务是利用已经收集到的样本数据,根据一定的统计拟合准则,对方程中的各参数进行估计。普通最小二乘就是一种最为常见的统计拟合准则。最小二乘法将偏差距离定义为离差平方和,即 (1)最

24、小二乘估计就是寻找参数0 、1、 p的估计值0 、 1、 p,使式(1)达到极小。通过求极值原理(偏导为零)和解方程组,可求得估计值,SPSS将自动完成。线性回归相关分析与回归分析u回归方程的统计检验回归方程的统计检验u回归方程的拟合优度检验(相关系数检验)一元线性回归的拟合优度检验采用R2统计量,称为判定系数或决定系数,数学定义为其中 称为回归平方和(SSA) 称为总离差平方和(SST)线性回归相关分析与回归分析线性回归u回归方程的统计检验回归方程的统计检验u回归方程的拟合优度检验(相关系数检验) R2取值在0-1之间, R2越接近于1,说明回归方程对样本数据点的拟合优度越高。相关分析与回归

25、分析多元线性回归的拟合优度检验采用 统计量,称为调整的判定系数或调整的决定系数,数学定义为式中n-p-1、n-1分别是SSE和SST的自由度。其取值范围和意义与一元回归方程中的R2是相同的。u回归方程的统计检验回归方程的统计检验u回归方程的拟合优度检验(相关系数检验)线性回归相关分析与回归分析u回归方程的统计检验回归方程的统计检验u回归方程的显著性检验(F检验)一元线性回归方程显著性检验的零假设是1=0,检验采用F统计量,其数学定义为:即平均的SSA/平均的SSE,F统计量服从(1,n-2)个自由度的F分布。SPSS将会自动计算检验统计量的观测值以及对应的概率p值,如果p值小于给定的显著性水平

26、,则应拒绝零假设,认为线性关系显著。线性回归相关分析与回归分析u回归方程的统计检验回归方程的统计检验u回归方程的显著性检验(F检验)多元线性回归方程显著性检验的零假设是各个偏回归系数同时为零,检验采用F统计量,其数学定义为:即平均的SSA/平均的SSE,F统计量服从(p,n-p-1)个自由度的F分布。SPSS将会自动计算检验统计量的观测值以及对应的概率p值,如果p值小于给定的显著性水平,则应拒绝零假设,认为y与x的全体的线性关系显著。线性回归相关分析与回归分析u回归方程的统计检验回归方程的统计检验u回归系数的显著性检验(t检验)一元线性回归方程的回归系数显著性检验的零假设是1=0,检验采用t统

27、计量,其数学定义为:t统计量服从n-2个自由度的t分布。 SPSS将会自动计算t统计量的观测值以及对应的概率p值,如果p值小于给定的显著性水平,则应拒绝零假设,认为x对y有显著贡献,线性关系显著。线性回归相关分析与回归分析u回归方程的统计检验回归方程的统计检验u回归系数的显著性检验(t检验)多元线性回归方程的回归系数显著性检验的零假设是i=0,检验采用t统计量,其数学定义为:ti统计量服从n-p-1个自由度的t分布。 SPSS将会自动计算ti统计量的观测值以及对应的概率p值,如果p值小于给定的显著性水平,则应拒绝零假设,认为xi对y有显著贡献,应保留在线性方程中。(i=1,2, ,p)线性回归

28、相关分析与回归分析u回归方程的统计检验回归方程的统计检验u残差分析所谓残差是指由回归方程计算所得的预测值与实际样本值之间的差距,即它是回归模型中 的估计值。如果回归方程能较好地反映被解释变量的特征和变化规律,那么残差序列中应不包含明显的规律性和趋势性。线性回归相关分析与回归分析u回归方程的统计检验回归方程的统计检验u残差分析均值为0的正态性分析残差均值为0的正态性分析,可以通过绘制残差图进行分析,如果残差均值为0,残差图中的点应在纵坐标为0的横线上下随机散落着。正态性可以通过绘制标准化(或学生化)残差的累计概率图来分析线性回归相关分析与回归分析u回归方程的统计检验回归方程的统计检验u残差分析独

29、立性分析 绘制残差序列的序列图以样本期(或时间)为横坐标,残差为纵坐标,如果残差随时间的推移呈规律性变化,则存在一定的正或负相关性。计算残差的自相关系数取值在-1到+1之间,接近于+1表明序列存在正自相关性。 DW(DurbinWatson)检验DW取值在0至4之间,直观判断标准是DW=4,残差序列完全负自相关;DW=2,完全无自相关;DW=0,完全正自相关。线性回归相关分析与回归分析u回归方程的统计检验回归方程的统计检验u残差分析异方差分析 绘制残差图如果残差的方差随着解释变量值的增加呈增加(或减少)的趋势,说明出现了异方差现象。线性回归相关分析与回归分析u回归方程的统计检验回归方程的统计检

30、验u残差分析异方差分析 等级相关分析得到残差序列后首先对其取绝对值,然后计算出残差和解释变量的秩,最后计算Spearman等级相关系数,并进行等级相关分析。具体过程见相关分析相关章节。线性回归相关分析与回归分析u回归方程的统计检验回归方程的统计检验u残差分析探测样本中的异常值和强影响点(对于y值)标准化残差ZRE由于残差是服从均值为0的正态分布,因此可以根据3准则进行判断,首先对残差进行标准化 ,绝对值大于3对应的观察值为异常值。学生化残差SRE剔除残差DRE(或剔除学生化残差SDRE)上述SRE、SDRE的直观判断标准同标准化残差ZRE。线性回归相关分析与回归分析多元回归分析中的其他问题u变

31、量筛选问题变量筛选问题向前筛选策略 解释变量不断进入回归方程的过程,首先选择与被解释变量具有最高线性相关系数的变量进入方程,并进行各种检验;其次在剩余的变量中挑选与解释变量偏相关系数最高并通过检验的变量进入回归方程。向后筛选策略 变量不断剔除出回归方程的过程,首先所有变量全部引入回归方程并检验,然后在回归系数显著性检验不显著的一个或多个变量中,剔除t检验值最小的变量。逐步筛选策略 向前筛选与向后筛选策略的综合线性回归相关分析与回归分析多元回归分析中的其他问题u变量多重共线性问题变量多重共线性问题容忍度Tol容忍度值越接近于1,表示多重共线性越弱。SPSS变量多重共线性的要求不很严格,只是在容忍

32、度值太小时给出相应警告信息。方差膨胀因子VIF膨胀因子是容忍度的倒数,越接近于1,表示解释变量间的多重共线性越弱。通常如果VIFi大于等于10,说明解释变量xi与其余解释变量之间有严重的多重共线性。特征根和方差比这里的特征根是指相关系数矩阵的特征根。如果最大特征根远远大于其他特征根的值,则说明这些解释变量之间具有相当多的重叠信息。条件指数ki10 ki 100时,认为多重共线性较强, ki 100时,认为多重共线性很严重线性回归相关分析与回归分析n回归分析基本操作回归分析基本操作(1)选择菜单AnalyzeRegressionLinear,出现如下对话框因变量自变量条件变量标志变量筛选策略线性

33、回归相关分析与回归分析(2)将因变量选入Dependent框(3)将一个或多个自变量选入Independengt(s)框(4)在Method框中选择回归分析中自变量的筛选策略。其中Enter表示所选变量强行进入回归方程,是SPSS默认策略,通常用在一元线性回归分析中;Remove表示从回归方程中剔除所选变量;Stepwise表示逐步筛选策略;Backward、Forward分别表示向后、向前筛选策略。n回归分析基本操作回归分析基本操作线性回归相关分析与回归分析(5)上述(3)、(4)中确定的自变量和筛选策略可放置在不同的Block中,单击 “Next”和“Previous”按钮设置多组自变量和

34、变量筛选策略,并放在不同Block中,SPSS将按照设置顺序依次进行分析。“Block”设置便于作各种探索性的回归分析。n回归分析基本操作回归分析基本操作线性回归相关分析与回归分析(6)选择一个变量作为条件变量到Selection Variable框中,并单击“Rule”按钮给定一个判断条件。只有变量值满足给定条件的样本数据才参与线性回归分析。线性回归n回归分析基本操作回归分析基本操作相关分析与回归分析(7)在Case Labels框中指定哪个变量作为数据样本点的标志变量,该变量的值将标在回归分析的输出图形中。(8)WLS Weight中选人权重变量,主要用于加权最小二乘法。 至此便完成了线性

35、回归分析的基本操作,SPSS将根据指定自动进行回归分析,并将结果输出到输出窗口中。线性回归n回归分析基本操作回归分析基本操作相关分析与回归分析n回归分析的其他操作回归分析的其他操作StatisticsStatistics选项选项输出与回归系数相关的统计量,包括回归系数、回归系数标准误、标准化回归系数、回归系数显著性检验的t统计量和概率p值,个解释变量的容忍度。每个非标准化回归系数的95%置信区间输出各解释变量间的相关系数、协方差以及各回归系数的方差线性回归相关分析与回归分析输出判定系数、调整的判定系数、回归方程的标准误、回归方程显著性检验的方差分析表每个解释变量进入方程后引起的判定系数的变化量

36、和F值的变化量(偏F统计量)输出个解释变量和被解释变量的均值、标准差、相关系数矩阵及单侧检验概率值输出方程中各解释变量与被解释变量之间的简单相关、偏相关系数和部分相关线性回归n回归分析的其他操作回归分析的其他操作StatisticsStatistics选项选项相关分析与回归分析多重共线性分析:输出各解释变量的容忍度、方差膨胀因子、特征值、条件指标、方差比例等DW值输出标准化残差绝对值大于等于3(默认)的样本数据的相关信息线性回归n回归分析的其他操作回归分析的其他操作StatisticsStatistics选项选项相关分析与回归分析PlotsPlots选项选项标准化预测值标准化残差剔除残差调整的

37、预测值学生化残差剔除学生化残差标准化残差序列直方图标准化残差序列正态分布累计概率图依次绘制被解释变量与各解释变量的散点图线性回归n回归分析的其他操作回归分析的其他操作相关分析与回归分析SaveSave选项选项该窗口将回归分析的某些结果以SPSS变量的形式保存到数据编辑窗口中,并可同时生成XML格式的文件,便于分析结果的网络发布。线性回归n回归分析的其他操作回归分析的其他操作相关分析与回归分析SaveSave选项选项保存剔除第i个样本后各统计量的变化量回归系数变化量标准化回归系数变化量预测值变化量标准化预测值变化量协方差比线性回归n回归分析的其他操作回归分析的其他操作相关分析与回归分析Optio

38、nsOptions选项选项设置多元线性回归分析中解释变量进入或剔除出回归方程的标准偏F统计量的概率值线性回归n回归分析的其他操作回归分析的其他操作相关分析与回归分析u线性回归分析的应用举例线性回归分析的应用举例为研究高校人文社会科学研究中立项课题数受哪些因素的影响,收集某年31个省市自治区部分高校有关社科研究方面的数据,并利用线性回归方法进行分析。这里,被解释变量为立项课题数X5,解释变量为投入人年数( X2)、投入高级职称的人年数( X3)、投入科研事业费( X4)、专著数( X6)、论文数( X7 )、获奖数( X8 )。具体操作如前所述。分析结果如下线性回归相关分析与回归分析相关分析与回

39、归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析线性回归相关分析与回归分析u线性回归分析的应用举例线性回归分析的应用举例立项课题数多元线性回归分析结果(强制进入策略)(一)立

40、项课题数多元线性回归分析结果(强制进入策略)(一)回归方程的拟合优回归方程的拟合优度较高度较高线性回归相关分析与回归分析u线性回归分析的应用举例线性回归分析的应用举例立项课题数多元线性回归分析结果(强制进入策略)(二)立项课题数多元线性回归分析结果(强制进入策略)(二)SSASSASSESSESSTSST被解释变量与解释变量的全体的线性关系显著线性回归相关分析与回归分析u线性回归分析的应用举例线性回归分析的应用举例立项课题数多元线性回归分析结果(强制进入策略)(三)立项课题数多元线性回归分析结果(强制进入策略)(三)偏回归系数检验只有x2的是显著的,其他均不显著,即与0无显著差异各解释变量之间

41、存在很强共线性线性回归相关分析与回归分析u线性回归分析的应用举例线性回归分析的应用举例立项课题数多元线性回归分析结果(强制进入策略)(四)立项课题数多元线性回归分析结果(强制进入策略)(四)由特征根的较大差异、条件指数以及方差比进一步证实了各解释变量之间存在严重的线性自相关。线性回归相关分析与回归分析u线性回归分析的应用举例线性回归分析的应用举例立项课题数多元线性回归分析结果(向后筛选策略)(一)立项课题数多元线性回归分析结果(向后筛选策略)(一)由此可见,不能以一味追求高的拟合优度为目标,还要重点考察解释变量对被解释变量的贡献线性回归相关分析与回归分析u线性回归分析的应用举例线性回归分析的应

42、用举例立项课题数多元线性回归分析结果(向后筛选策略)(二)立项课题数多元线性回归分析结果(向后筛选策略)(二)SSASSASSESSESSTSST线性回归相关分析与回归分析u线性回归分析的应用举例线性回归分析的应用举例立项课题数多元线性回归分析结果(向后筛选策略)(三)立项课题数多元线性回归分析结果(向后筛选策略)(三)由此可清楚地看到变量剔除的过程线性回归相关分析与回归分析u线性回归分析的应用举例线性回归分析的应用举例立项课题数多元线性回归分析结果(向后筛选策略)(四)立项课题数多元线性回归分析结果(向后筛选策略)(四)线性回归相关分析与回归分析u线性回归分析的应用举例线性回归分析的应用举例

43、通过上述回归方程的分析以及各种检验,得出如下回归通过上述回归方程的分析以及各种检验,得出如下回归方程:方程:立项课题数立项课题数=-=-94.524+0.49294.524+0.492投入人年数,意味着投入人年数每增加一投入人年数,意味着投入人年数每增加一个单位会使立项课题数平均增加个单位会使立项课题数平均增加0.4920.492个单位。个单位。线性回归相关分析与回归分析曲线估计相关分析与回归分析曲线估计曲线估计变量间相关关系的分析中,变量之间的关系并不总是表现出线性关系,非线性关系也极为常见。非线性又可划分为:本质线性关系本质线性关系形式上虽然呈非线性,但可通过变量转换化为线性关系。本质非线

44、性关系本质非线性关系不仅形式上呈非线性,也无法通过变量转换化为线性关系。这里的曲线估计是解决本质线性关系问题的。相关分析与回归分析模型名模型名回归方程回归方程变量变换后的线性方程变量变换后的线性方程二次曲线(Quadratic)复合曲线(Compound)增长曲线(Growth)对数曲线(Logarithmic)三次曲线(Cubic)S曲线(S)指数曲线(Exponential)逆函数(Inverse)幂函数(Power)逻辑函数(Logistic)常见本质线性模型常见本质线性模型曲线估计曲线估计相关分析与回归分析在SPSS曲线估计中,首先在不能明确哪种模型更接近样本数据时可在上述可选择的模型

45、中选择几种模型,然后,SPSS自动完成模型的参数估计,并输出回归方程显著性检验的F值和概率P值、判定系数R2等统计量;最后以判定系数为主要依据选择其中的最优模型,并进行预测分析。曲线估计曲线估计相关分析与回归分析基本操作:基本操作:(1)选择菜单Analyze Regression Curve Estimation。(2)选择被解释变量到Dependent框。(3)曲线估计中解释变量可以是相关因素变量,也可以是时间变量。如果解释变量为相关因素变量。则选择Variable选项,并指定一个解释变量到Independent框;如果选择Time参数表示解释变量为时间变量。(4)在Models中选择几种

46、模型。(5)选择Plot Models选项绘制回归线;选择Display ANOVA table输出各个模型的方差分析表和各回归系数显著性检验结果。曲线估计曲线估计相关分析与回归分析曲线估计应用举例曲线估计应用举例为研究居民家庭教育支出和消费性支出之间的关系,收集到1990年至2002年全国人均消费性支出和教育支出的数据。曲线估计曲线估计相关分析与回归分析相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析教育支出和年人均消费性支出的散点图曲线估计曲线估计相关

47、分析与回归分析曲线估计应用举例曲线估计应用举例观察散点图发现两变量之间呈非线性关系,可尝观察散点图发现两变量之间呈非线性关系,可尝试选择二次、三次曲线,复合函数、幂函数等模试选择二次、三次曲线,复合函数、幂函数等模型。型。曲线估计曲线估计相关分析与回归分析相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计曲线估计相关分析与回归分析曲线估计应用举例曲线

48、估计应用举例观察散点图发现两变量之间呈非线性关系,可尝试选择二次、三次曲线,复合函数、幂函数等模型。拟合优度比较曲线估计曲线估计相关分析与回归分析曲线估计应用举例曲线估计应用举例与实际不符回归系数检验不通过曲线估计曲线估计相关分析与回归分析曲线估计应用举例曲线估计应用举例曲线估计曲线估计相关分析与回归分析曲线估计应用举例曲线估计应用举例 复合函数和幂函数的拟合优度都很好,同时两种模型的回归系数显著性检验也都通过 ,因此可考虑采用这两种模型。另外,由于复合函数数值增长速度高于幂函数,从居民消费未来趋势看,教育支出将可能占消费性支出的较大比例,并呈快速增长的趋势,而且复合函数拟合优度高于幂函数,因此可最终考虑采用复合函数。曲线估计曲线估计相关分析与回归分析曲线估计应用举例曲线估计应用举例曲线估计曲线估计相关分析与回归分析谢谢谢谢

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号