spss统计分析及应用教程-第6章相关和回归分析资料

上传人:w****i 文档编号:95443311 上传时间:2019-08-18 格式:PPT 页数:142 大小:3.10MB
返回 下载 相关 举报
spss统计分析及应用教程-第6章相关和回归分析资料_第1页
第1页 / 共142页
spss统计分析及应用教程-第6章相关和回归分析资料_第2页
第2页 / 共142页
spss统计分析及应用教程-第6章相关和回归分析资料_第3页
第3页 / 共142页
spss统计分析及应用教程-第6章相关和回归分析资料_第4页
第4页 / 共142页
spss统计分析及应用教程-第6章相关和回归分析资料_第5页
第5页 / 共142页
点击查看更多>>
资源描述

《spss统计分析及应用教程-第6章相关和回归分析资料》由会员分享,可在线阅读,更多相关《spss统计分析及应用教程-第6章相关和回归分析资料(142页珍藏版)》请在金锄头文库上搜索。

1、第6章 相关和回归分析,第6章 相关和回归分析,本章学习目标 理解相关和回归分析的基本思想、原理与两者之间关系; 明确相关和回归分析的实验目的、实验步骤和实验内容; 掌握实验结果的统计分析; 熟练使用散点图; 相关和回归分析应用在经济管理数据分析中的应用。,第6章 相关和回归分析,相关和回归分析是分析客观事物之间相关性的数量分析方法。客观事物之间的关系可分为函数关系和统计关系。函数关系指客观事物之间的一一对应关系,即当一组变量取一定值时,另一变量y可以依确定的函数取唯一确定的值。统计关系指客观事物之间的一种非一一对应关系,即当一组变量取一定值时,另一变量y无法依确定的函数取唯一确定的值。事物之

2、间的函数关系比较容易分析,而事物之间的统计关系不像函数关系那样直接。相关和回归分析正是以不同的方式处理事物间的统计关系。 。,实验一 相关分析,实验目的 了解相关分析的方法原理; 熟练掌握相关分析的SPSS操作命令; 熟练应用三个常用相关系数的计算方法及其数据测度要求; 运用相关分析解决管理学实际问题的能力。,实验一 单一样本t检验,准备知识 简单相关分析的概念,统计学中,相关分析是以分析变量间的线性关系为主,是研究它们之间线性相关密切程度一种统计方法。它是通过几个描述相关关系的统计量来确定相关的密切程度和线性相关的方向。这些统计量包括皮尔逊(Pearson)相关系数、斯皮尔曼(Spearma

3、n)和肯德尔(Kendall)秩相关系数,一般用符号r来表示。,准备知识 简单相关分析的概念,相关系数具有一些特性: (1)它的取值极限在-1和+1之间,即-1r+1。 (2)它具有对称性,即X与Y之间的相关系数和Y与X之间的相关系数相同。 (3)它与原点和测度都无关,即如果定义和,其中,且c和d都是常数,则和之间的r无异于原始变量X与Y之间的r。 (4)如果X和Y统计上独立的,则它们之间的相关系数r=0;但反过来,r=0不等于说X和Y是独立的。 (5)它仅是线性关联的一个度量,不能用于描述非线性关系。,相关系数的计算方法 皮尔逊(Pearson)相关系数,通常,仅对刻度级(Scale)变量计

4、算皮尔逊(Pearson)相关系数,公式为: 其中 , 分别为 , (i=1,2,n)的算术平均值。,相关系数的计算方法 斯皮尔曼和肯德尔秩相关关系,用于反映两个序次或等级变量的相关程度。计算Spearman相关数据时,要求先对原始变量的数据排序,根据秩使用Spearman相关系数公式进行计算。公式可为: 式中, 、 分别是 , 的秩。 、 分别是变量 、 的平均值。至于肯德尔秩相关系数的计算公式,此处不再列出。,关于相关系数统计意义的检验,我们通常利用样本来研究总体的特性,由于抽样误差的存在,样本中两个变量之间的相关系数不为0,不能直接就断定总体中两个变量间的相关系数不是0,而必须进行检验。

5、 给出显著性水平,做出判断。对给定的显著性水平,与检验统计量相对应的p值进行比较:当p值(SPSS中常用Sig值来表示)小于显著性水平,则拒绝原假设,认为相关系数不为零。如=0.05,P=0.01,则P,拒绝零假设,即两个变量相关系数r0,计算得到的相关系数是有意义,可以对它进行说明两个变量之间的相关程度:反之,当p值大于显著性水平,则不能拒绝原假设,认为相关系数为零,不能根据计算得到的相关系数来说明两者之间相关程度。,实验一 相关分析,实验内容 某大学一年级12名女生的胸围(cm)、肺活量(L)身高(m),数据见表6-1-1。试分析胸围与肺活量两个变量之间相关关系。,表6-1-1 胸围、肺活

6、量与身高相关数据表,实验步骤,(1)绘制散点图,以判断两个变量之间有无线性相关趋势,见图,(2)从菜单上依次选择“分析相关双变量(二元相关)”命令,打开对话框,如图6-1-2所示。选择“胸围”、“肺活量”到变量框;选择“相关系数-pearson”、“显著性检验-双侧检验”、“标记显著性相关”。单击“确定”按钮。,实验结果,胸围与肺活量相关性,实验分析,胸围与肺活量相关性,由结果表可以看出,变量间相关系数是用2*2方阵形式出现的。每一行和每一列的两个变量对应的单元格就是这两个变量相关分析结果,有三个数字,分别为Pearson 相关性、显著性(双侧)、N(样本量)。如表格中黑色单元格所示。胸围与肺

7、活量的Pearson 相关系数为0.549,显著性检验为0.064,样本量为12。如果单从相关系数可以看出两者是正相关的而且具有中等相关性。但是,显著性检验0.0640.05,接受原假设,所以Pearson 相关系数为0.549的值没有通过显著检验。根据这12个小样本来推断该大学一年级女生胸围与肺活量之间的没有线性相关性。,实验二 偏相关分析,实验目的 准确理解偏相关分析的方法原理和使用前提; 熟练掌握偏相关分析的SPSS操作; 了解偏相关分析在中介变量运用方法。,实验二 偏相关分析,准备知识 偏相关分析的概念,在多元相关分析中,由于其他变量的影响,Pearson相关系数只是从表面上反映两个变

8、量相关性,相关系数不能真正反映两个变量间的线性相关程度,甚至会给出相关的假想。因此,在有些场合中,简单的Pearson相关系数并不是测量相关关系的本质性统计量。当其他变量控制后,给定的任意两个变量之间的相关系数叫做偏相关系数。偏相关系数才是真正反映两个变量相关关系的统计量。,偏相关系数的计算公式,设有n 个变量 , , ,每两个变量间的简单相关关系,即皮尔逊(Pearson)相关系数所构成的相关系数对称矩阵为: 其中, ,i,j=1,2,n。,偏相关系数的计算公式,如设 为此矩阵的行列式,既 ,则变量 与 之间的偏相关关系为: 其中 分别为中元素 的代数余子式。,实验二 偏相关分析,实验内容

9、研究人员收集了26个旅游景点某年的商店投资数据、游客增长率和风景区的经济增长率。问景区商业投资是否确实导致了风景区的经济增长率?,实验二 偏相关分析,实验步骤,(1)在SPSSl7.0中打开数据文件6-2.sav,通过选择“文件打开”命令将数据调入SPSSl7.0的工作文件窗口 。,旅游投资数据文件,(2)从菜单上依次选择“分析-相关-偏相关”命令,打开其对话框,如图所示。选择“商业投资”与“经济增长”作为相关分析变量,送入变量框中;选择“游客增长率”作为控制变量,用箭头送入右边的控制框中。,(3)点击“选项”按钮,见图,选择零阶相关系数(也就是两两简单相关系数,可以用与偏相关系数比较)。点击

10、“继续”按钮回到主分析框。点击“确定”按钮。,实验结果,描述性统计分析,偏相关分析,实验三 简单线性回归分析,实验目的 准确理解简单线性回归分析的方法原理; 熟练掌握简单线性回归分析的SPSS操作与分析; 了解相关性与回归分析之间关系; 培养运用简单线性回归分析解决实际问题的能力。,知识准备 线性回归分析问题,线性回归分析一般解决以下问题:第一,确定因变量与若干自变量之间的定量表达式,通常称为回归方程式,并确定它们联系的密切程度;第二,通过控制可控变量的数值,利用求出的回归方程式来预测或控制因变量的取值和精度;第三,进行自变量分析,找出影响因素最为显著的,以区别重要因素和次要因素。 回归分析主

11、要研究变量之间的线性相关关系时,称为线性回归分析,否则称为非线性回归分析。又按照自变量多少分为一元线性回归和多元线性回归。,知识准备 简单线性回归分析的理论模型,其理论假设为: 简单线性回归的主要任务是根据样本数据求出未知参数 和 的 估计值 和 ,从而得到估计的回归方程:,知识准备 SPSS线性回归分析的数据要求,线性回归过程中包括一元、多元线性回归、多元逐步回归。可以给出所求回归方程的回归系数估计值(即回归系数参数估计和区间估计)、协方差矩阵、复相关系数R、方差分析表、因变量的最佳预测值等,还可以输出变量值的散点图等图形。 线性回归过程对数据的要求是:自变量和因变量必须是具有刻度级测度的数

12、值型变量;标志或分类变量,必须记录为二元的哑变量(虚拟变量)或者其他类型的对立变量。 对于因变量的所有观察值(样本)应该认为是来自于相互独立的等方差的正态总体(i.i.d),并且因变量与各个自变量之间应具有一定的线性关系。,简单线性回归分析中的统计检验和残差分析 拟合优度检验,定线性回归直线拟合优度的检验统计为: 式中, =SST,称为总平方和, =SSR,称为回归平方和,SSE=SST-SSR= ,称为残差平方和。 称为判定系数或拟合效度等。,简单线性回归分析中的统计检验和残差分析 F检验,回归方程显著性检验的统计量为F统计量: 式中,p为自变量个数,n为样本观测个数。对于一元线性回归方程,

13、p=1。同时注意到 ,即拟合优度越好,F值越大,越有可能是显著的,方程成立可能性越大。说明R方是直观地体现出拟合效果,而F是统计量定量说明这个效果是否显著,一般两者配套使用。,简单线性回归分析中的统计检验和残差分析 DW检验,在回归模型的诊断中,有一个非常重要的回归模型假设需要诊断,那就是回归模型中的误差项的独立性。如果误差项不独立,那么对回归模型的任何估计与假设所作出的结论都是不可靠的。其参数称为DW。取值范围是0DW4,统计学意义如下:当残差与自变量互为独立时,DW2;当相邻两点的残差为正相关时,DW2;当相邻两点的残差为负相关时,DW2。,简单线性回归分析中的统计检验和残差分析 残差分析

14、,所谓残差就是指回归方程计算得到的预测值与实际值之间的误差: 它是回归模型中的 估计值,有多个 形成的序列称为残差序列。可通过残差序列分析来证实模型假设。常以预测值 为横轴,以误差 为纵轴(或学生化残差),绘制残差的散点图。如果散点图呈现明显的规律性,则认为存在自相关性,或者存在非线性、非常数方差的问题。利用残差图还可以判断模型的拟合效果。在残差图中,如果各点呈随机状,并绝大部分落在范围 (68%的点落在 内,96%的点落在 之中),说明模型对于数据的拟合效果较好。,知识准备 简单线性回归分析的基本步骤,回归分析之前,需要对样本资料是否满足要求进行判断。可以先使用相关分析法确定自变量与因变量之

15、间的相关系数,或者运用散点图(Scatter)功能,产生直观的散点图,观察自变量与因变量之间关系,以及奇异值等情况。如果图中发现有明显远离主体的观测值,则称之为异常点(Outlier),这些点很可能对正确评价两变量之间关系有较大影响。,知识准备 简单线性回归分析的基本步骤,分析因变量的正态性、方差齐性,确定是否可以进行线性回归分析。模型拟合完毕,通过残差分析结果来考察模型是否可靠。如果变量进行了变换,则应重新绘制散点图并观察数据分布。,知识准备 简单线性回归分析的基本步骤,利用检验统计量对回归预测模型进行显著性检验,得到拟合回归直线。,知识准备 简单线性回归分析的基本步骤,考察数据是否符合模型

16、假设条件,主要包括以下两个方面。首先残差是否独立?实际上就是考察因变量取值是否相互独立,采用Durbin-Watson,DW残差序列相关性进行分析,其取值范围为:0DW4。统计意义为:若DW2,表明相邻两点的残差项相互独立;若0DW2,表明相邻两点的残差项正相关;若2DW4,表明相邻两点的残差项负相关。其次,考察残差分布是否为正态?实际上就是考察因变量趋势是否服从正太分布,可以采用残差列表及相关指标法进行分析,直方图是图示法观察用的。,知识准备 简单线性回归分析的基本步骤,线性回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围,此时求得的预测值成为内插(Interpolation),而超出自变量取值范围所得到的预测

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号