SPSS第四讲相关分析和回归分析

上传人:飞****9 文档编号:143970901 上传时间:2020-09-04 格式:PPT 页数:46 大小:357.50KB
返回 下载 相关 举报
SPSS第四讲相关分析和回归分析_第1页
第1页 / 共46页
SPSS第四讲相关分析和回归分析_第2页
第2页 / 共46页
SPSS第四讲相关分析和回归分析_第3页
第3页 / 共46页
SPSS第四讲相关分析和回归分析_第4页
第4页 / 共46页
SPSS第四讲相关分析和回归分析_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《SPSS第四讲相关分析和回归分析》由会员分享,可在线阅读,更多相关《SPSS第四讲相关分析和回归分析(46页珍藏版)》请在金锄头文库上搜索。

1、SPSS第四讲,相关分析和回归分析,2,3,第一节 相关分析,一、预备知识 研究变量间密切程度的一种常用统计方法 1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。 2、偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系,4,相关系数的计算有三种: Pearson、Spearman和Kendall Pearson相关系数:对定距变量的数据进行计算 Spearman和Kendall相关系数:对分类变量的数据或变量值的分布明显非正态或分布不明时,计算时先对离散数据进行排序或对定距变量

2、值排(求)秩,5,(三)相关分析的SPSS过程 在Analyze+Correlate下的三个子菜单: 1、Bivariate-相关分析,计算指定的两个变量间的相关关系,可选择Pearson相关、Spearman和Kendall 相关;同时对相关系数进行检验,检验的零假设为:相关系数为0(不相关)。给出相关系数为0的概率 2、Partial - 偏相关分析,计算两个变量间在控制了其他变量的影响下的相关关系,对相关系数也进行检验,检验的零假设为:相关系数为0 3、Distance- 相似性测度,对变量或观测量进行相似性或不相似性测度,6,二、Bivariate过程,主要功能 调用此过程可对变量进行

3、相关关系的分析,计算有关的统计指标,以判断变量之间相互关系的密切程度。调用该过程命令时,系统输出的是变量间两两相关的相关系数。,7,例某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分析。,8,数据准备 激活数据管理窗口,定义变量名:发硒为X,血硒为Y,按顺序输入相应数值,建立数据库,9,绘图,绘制散点图,大致判断两变量之间的关系 Graphs Legacy Dialogs scatter simple scatter,10,统计分析 激活Analyze菜单选Correlate中的Bivariate.命令项,弹出Bivariate Correlation对话

4、框。在对话框左侧的变量列表中选x、y,点击钮使之进入Variables框;再在Correlation Coefficients框中选择相关系数的类型,共有三种:Pearson为通常所指的相关系数(r),Kendells tau-b为非参数资料的相关系数,Spearman为非正态分布资料的Pearson相关系数替代值,本例选用Pearson项;在Test of Significance框中可选相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,本例选双侧检验。,11,相关系数的类型,相关系数检验方式,是否显示检验概率,如果有3个以上变量,输出两两变量的相关系数,12,13,

5、Correlations,结果解释: 在结果输出窗口中将看到XY两两对应的相关系数及其双侧检验的概率,本例r = 0.872,P = 0.001。,相关分析表,相关系数 检验概率 样本量,14,三、Partial过程,主要功能 调用此过程可对变量进行偏相关分析。在偏相关分析中,系统可按用户的要求对两相关变量之外的某一或某些影响相关的其他变量进行控制,输出控制其他变量影响后的相关系数。,例 某地29名13岁男童身高(cm)、体重(kg)和肺活量(ml)的数据如下表, 试对该资料作控制体重影响作用的身高与肺活量相关分析。,15,16,数据准备 激活数据管理窗口,定义变量名:身高为height,体重

6、为weight,肺活量为vc,按顺序输入相应数值,建立数据库。 绘制散点图,大致判断两变量之间的关系 Graphs Legacy Dialogs scatter matrix scatter,17,统计分析 激活Analyze菜单选Correlate中的Partial.命令项,弹出Partial Correlations对话框。现欲在控制体重的影响下对变量身高与肺活量进行偏相关分析,故在对话框左侧的变量列表中选变量height、vc,点击钮使之进入Variables框,选要控制的变量weight,点击钮使之进入Controlling for框中, 在Test of Significance框中

7、选双侧检验,然后点击OK钮即可。,18,控制变量列表,19,20,Partial Corr,结果解释 在结果输出窗口中将看到如下统计数据:控制体重的影响后,身高与肺活量的相关系数为0.269,经检验P = 0.167,故身高与肺活量的线性相关不存在。,21,结果比较 控制体重的影响后,身高与肺活量的相关系数为0.269,经检验P = 0.167,故身高与肺活量的线性相关不存在。 如果不控制体重的影响,则身高与肺活量的相关系数为0.5884,P为0.001。 可见身高与肺活量的相关是由与体重协同作用而产生的。,22,问题的解决,寻找控制银行不良贷款的因素,23,一、预备知识 (一)概念 寻求有关

8、联(相关)的变量之间的关系 主要内容: 从一组样本数据出发,确定这些变量间的定量关系式 对这些关系式的可信度进行各种统计检验 从影响某一变量的诸多变量中,判断哪些变量的影响显著,哪些不显著 利用求得的关系式进行预测和控制,第二节 回归分析,24,(二)回归分析的模型 按是否线性分:线性回归模型和非线性回归模型 按自变量个数分:简单的一元回归,多元回归 基本的步骤:利用SPSS得到模型关系式,是否是我们所要的,要看回归方程的显著性检验(F检验)和回归系数b的显著性检验(T检验),还要看拟合程度R2 (相关系数的平方,一元回归用R Square,多元回归用Adjusted R Square),25

9、,26,(三)回归分析的过程 在回归过程中包括: Linear:线性回归 Curve Estimation:曲线估计 Binary Logistic: 二分变量逻辑回归 Multinomial Logistic:多分变量逻辑回归 Ordinal 序回归 Probit:概率单位回归 Nonlinear:非线性回归 Weight Estimation:加权估计 2-Stage Least squares:二段最小平方法 Optimal Scaling 最优编码回归 我们只讲前面2个简单的(一般教科书的讲法),27,二、Linear过程,主要功能 调用此过程可完成二元或多元的线性回归分析。在多元线性

10、回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法等)。,28,例某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为因变量的回归方程。,29,数据准备 激活数据管理窗口,定义变量名:体表面积为Y,保留3位小数;身高、体重分别为X1、X2,1位小数。输入原始数据,结果如图所示。,30,31,统计分析 激活Analyze菜单选Regression中的Linear.项,弹出Linear Regression对话框。从对话框左侧的变量列表中选y,点击钮使之进入Dependent框,选x1

11、、x2,点击钮使之进入Indepentdent(s)框;在Method处下拉菜单,共有5个选项:Enter(全部入选法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)。本例选用Enter法。点击OK钮即完成分析。,32,因变量,自变量列表,统计分析,33,用户还可点击Statistics.钮选择是否作变量的描述性统计、回归方程因变量的可信区间估计等分析; 点击Plots.钮选择是否作变量分布图(本例要求对标准化Y预测值作变量分布图); 点击Save.钮选择对回归分析的有关结果是否作保存; 点击Options.钮选择变量入选与剔除的

12、、值和缺失值的处理方法。,34,Regression,变量进入方式,回归模型拟合度表,拟合度,F检验值,检验概率 a 接受H0,35,结果显示 本例以X1、X2为自变量,Y为因变量,采用全部入选法enter建立回归方程。回归方程的复相关系数为0.950,决定系数(即R2)为0.902,调整后的R2为0.874。经方差分析,F=32.145,P=0.0000,回归方程有效。 回归方程为Y=-2.856+0.069X1+0.184X2+。,回归系数表,系数值,系数检验值,检验概率 越小,越显著,(-0.475) (0.919) (3.234),36,课堂练习1,地区经济发展水平与人口预期寿命的回归

13、分析 (1) 写出人均GDP与人口预期寿命的线性回归方程。 (2) 检验回归方程是否显著? (3) 检验各回归系数是否显著? (4) 解释各回归系数的实际意义。 资料来源:国家统计局 ,37,三、Curve Estimation过程,主要功能:调用此过程可完成下列有关曲线拟合的功能:,38,非线性回归(实例),【例】为研究生产率与废品率之间的关系,记录数据如下表。试拟合适当的模型。,39,生产率与废品率的散点图,40,数据准备 激活数据管理窗口,定义变量名:废品率为Y,生产率为X,输入原始数据。 统计分析 激活Analyze菜单选Regression中的Curve Estimation.项,弹

14、出Curve Estimation对话框。从对话框左侧的变量列表中选y,点击钮使之进入Dependent框,选x,点击钮使之进入Indepentdent(s)框;在Model框内选择所需的曲线模型,本例选择Linear模型和Exponential 模型(即指数曲线);点击Display ANOVA table按钮,要求输出方差分析结果。再点击OK钮即可。,41,模型类型,是否显示方差分析表,是否对模型作图,42,Linear,回归系数表,方差分析表,回归模型拟合度表,y =01x+,43,Exponential,.002,y = ex,44,结果解释 用线性模型:y =01x+ ,有 y = 2.628+0.002x + 用指数模型: y = ex ,有 lny = 4.003+0.002x + y =54.775 e0.002x + 结果比较 直线的判定系数R20.886小于指数模型的判定系数R20.941。指数模型略好于直线模型,45,46,地区粮食产量与地区耕地面积、化肥施用量、农业机械总动力的回归分析 (1) 写出粮食产量与耕地面积、化肥施用量、农业机械总动力的线性回归方程。 (2) 检验回归方程是否显著? (3) 检验各回归系数是否显著? (4) 解释各回归系数的实际意义。 资料来源:国家统计局 ,课堂练习2,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 经营企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号