spss5.4相关分析剖析

上传人:今*** 文档编号:107690420 上传时间:2019-10-20 格式:PPT 页数:27 大小:1.53MB
返回 下载 相关 举报
spss5.4相关分析剖析_第1页
第1页 / 共27页
spss5.4相关分析剖析_第2页
第2页 / 共27页
spss5.4相关分析剖析_第3页
第3页 / 共27页
spss5.4相关分析剖析_第4页
第4页 / 共27页
spss5.4相关分析剖析_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《spss5.4相关分析剖析》由会员分享,可在线阅读,更多相关《spss5.4相关分析剖析(27页珍藏版)》请在金锄头文库上搜索。

1、5.4 相关分析,一、相关分析的概念与相关分析过程 (一)相关分析 相关分析是研究不同变量间密切程度的一种十分常用的统计方法。相关系数是描述两个变量间的线性关系程度和方向的统计量。 相关系数通常用r表示,它没有单位,其值在 -1+1之间。 r等于+1或 -l时,其中一个变量记为Y可以确切地用另一变量记为X的线性函数来表示。 r的绝对值越接近1,则变量X、Y间线性相关的程度就越大。 若变量Y随着变量X的增、减而增、减,即两变量变化的方向一致,则这种相关称为正相关,r大于零; 若变量Y随着变量X的增加而减少,变化方向相反,则称为负相关,r小于零;若r等于零,则可认为变量X、Y不是线性相关。,由于我

2、们通常是通过抽样方法,利用样本研究总体的特性。但是由实际情况抽样而得到的数据总存在抽样误差,即样本中两变量间相关系数不为0,不能说明总体中两个变量间的相关系数不是0,同样,样本中两变量间相关系数不为0,也不能保证实际中这两个变量相关,因此相关分析必须通过检验。 检验的假设是:总体中两个变量间的相关系数为0。 SPSS的相关分析过程给出该假设成立的概率。一般的,我们给出假设成立概率p的域值为,当概率p小于时,则拒绝原假设,认为原假设不成立;否则不能拒绝原假设。另外,在SPSS的相关分析过程的输出中还给出相关系数的值。 偏相关分析是相关分析中的重要部分,它主要用在当控制了一个或几个变量的影响下两变

3、量间的相关性。 例如,可以控制体重影响作用,对人的身高与肺活量进行偏相关分析。,(二) 相关分析的功能和应用 相关关系多种多样,归纳起来有六种类型: 1强正相关关系,其特点是一变量X增加,导致另一变量Y明显增加,说明X是影响Y的主要因素。 2弱正相关关系,其特点是一变量X增加,也导致另一变量Y增加,但不明显,说明X是影响Y的因素,但不是唯一因素。 3强负相关关系,其特点是X增加,导致Y明显减少,说明X是影响Y的主要因素。 4弱负相关关系,其特点是一变量X增加,也导致另一变量Y减少,但不明显,说明X是影响Y的因素,但不是唯一因素。 5非线性相关关系,其特点是X,Y之间虽然没有通常所指的那种线性关

4、系,却存在着某种非线性关系,说明X仍是影响Y的因素。 6不相关关系,其特点是X,Y之间不存在相关关系,说明X不是影响Y的因素。,(三) 相关分析的SPSS过程 在“分析”下拉菜单的“相关”命令项具有三个相关分析功能与命令。它们分别是“双变量”、“偏相关”和“距离”,对应于相关分析、偏相关分析和距离分析。 1双变量:计算指定的两个变量间的相关系数,可以选择Pearson相关(积差相关)、Spearman等级相关和Kendall相关,同时对相关系数进行假设检验。可选择进行单尾或双尾检验,给出相关系数为0的概率。当资料不服从双变量正态分布或总体分布型未知,或原始数据是用等级表示时,宜用Spearma

5、n或Kendall相关。 2偏相关:计算两个变量间再控制了其他变量影响下的相关系数,即偏相关系数可以进行单尾或双尾检验,检验的假设是:偏相关系数为0,然后给出偏相关系数为0的概率。还可以计算其它描述统计量。 3、距离:对变量和观测量值进行相似性或不相似性测度。,二、两个变量的相关分析“双变量” 1、二元变量相关分析的功能和应用 二元变量的相关分析研究的是两个变量之间的相关关系,这种关系称为单相关,即这种相关关系只涉及一个自变量和一个因变量. 三个或三个以上变量之间的相关关系称为复相关,这种相关涉及到一个因变量与两个以上的自变量。例如,同时研究亩产量与降雨量、施肥量、种植密度之间的关系就是复相关

6、关系。在实际工作中,如果存在多个自变量与一个因变量的关系,可以抓住其中最主要的因素,研究其相关关系,或将复相关化为单相关问题进行研究。 调用“双变量”过程命令时允许同时输入两个变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。,2、二元变量相关分析的应用示例 下面用一个例题来说明二元变量的相关分析。 例5-4-1尽管采取了时速限制及改进路面等措施,公路死亡人数仍在年复一年的上升。某安全负责人相信速度与事故数有联系,并从12个州搜集到如下资料,数据如下表所示。(e5-4-1) 表5-4-1 公路平均速度X与公路死亡增长百分比Y数据表,操作步骤: 分析 相关 双变量 (1)主对话框中的选

7、择项,分析方法选择项: Pearson相关复选项,皮尔逊相关,积差相关,计算连续变量或是等间距测度的变量间的相关分析。 Kendalls tau-b复选项,肯德尔b,等级相关,计算分类变量间的秩相关。 Spearman复选项,等级相关,计算斯皮尔曼相关。 对于非等间距测度的连续变量,因为分布不明可以使用等级相关分析,也可以使用 Pearson相关分析;对于完全等级的离散变量必须使用等级相关分析相关性。当资料不服从双变量正态分布或总体分布型未知,或原始数据是用等级表示时,宜用Spearman或 Kendall相关。,选择显著性检验类型: 双尾检验:当事先不知道相关方向(正相关还是负相关)时选择此

8、项。 单尾检验:如果事先知道相关方向可以选择此项。 “标记显著性相关”复选项:如果选中此项,输出结果中在相关系数数值右上方使用“”表示显著水平为5;用“”表示其显著水平为1。,(2)“选项”对话框中的选择项:,统计量选择项: 均值与标准差 叉积偏差和 缺失值处理方法选择项: 按对排除个案,仅剔除正在参与计算的两个变量值是缺失值的观测量。这样在多元相关分析中或多对两两相关分析中,有可能相关系数矩阵中的相关系数是根据不同数量的观测量计算出来的。 按列表排除个案,剔除在主对话框中“变量”矩形框中列出的变量带有缺失值的所有观测量。这样计算出来的相关系数矩阵,每个相关系数都是依据相同数量的观测量计算出来

9、的。,(3)输出结果和解释结果 (1)第一行中的数值是行变量与列变量的相关系数矩阵。行、列变量相同的相关系数自然为l。 (2)第二行中的数值是相关系数为零的假设成立的概率。 (3)第三行中的数值是参与该相关系数计算的观测量数目 对计算结果的解释主要是考察 0假设检验是否成立。当 P小于 1或 5时(相关系数数值上方使用“*”表示显著水平为5%;用“*”表示其显著水平为1),则应拒绝相关系数为0的假设,可以认为两个变量之间是相关的。,例5-4-2 某地一年级12名女大学生的体重(kg)X与肺活量(l)Y如下表,试计算肺活量与体重的相关系数,并检验两者间是否有直线相关关系。(e5-4-2) 体重

10、42 42 46 46 46 50 50 50 52 52 58 58 肺活量 2.55 2.20 2.75 2.40 2.80 2.81 3.40 3.10 3.46 2.85 3.50 3.00,例5-4-3某地在作肝癌病因研究时,调查了10个乡肝癌死亡率(1/10万,用X表示)与某种食物中的黄曲霉毒素的相对含量有关(用Y表示),数据见下表(e5-4-3) ,试作等级相关分析。(Spearman相关分析),对以上结果的解释是,Spearman等级相关系数为0.745,P=0.013,相关具有统计学意义,故可以认为黄曲霉毒素相对含量与肝癌死亡率间存在正相关,虽然不是很强的正相关。,下面再给出

11、使用Kendall相关方法的例题,它适用于有序数据或不满足正态分布的数据。 例5-4-4为研究平均工资与劳动生产率的关系,从一总体中抽选 20个企业,而获得20对数据,并以劳动生产率(单位:万元人)为自变量,平均工资(单位:元人)为因变量,编制成数据文件,如下图所示(e5-4-4) 。 从“分析”-“相关”-“双变量”,进入双变量相关分析主对话框,将变量“劳动生产率x”、“平均工资y”选择进人变量栏,在相关系数类型中只选择 Kendalls tau-b等级相关,其余使用默认值,点击“确定”按钮运行程序。,对以上结果的解释是,Kendall等级相关系数为0.919, p=0.00,相关具有统计学

12、意义,故可认为劳动生产率与平均工资间存在很强正相关。,三、偏相关分析 1、偏相关分析的基本概念 相关分析计算两个变量之间的相互关系,分析两个变量间线性关系的程度。往往因为第三个变量的作用,使得相关系数不能真实地反映两个变量间的线性相关程度。这样也就决定了二元变量的相关分析的不精确性。例如身高、体重与肺活量之间的关系。如果使用Pearson相关计算其相关系数,可以得出肺活量、身高和体重均存在较强的线性相关性质。但实际上呢?对体重相同的人而言,”是否身高值越大,其肺活量也越大呢?答案是否定的。正是因为身高与体重有着线性关系,肺活量与体重有着线性关系,因此得出了身高与肺活量之间存在较强的线性关系的错

13、误结论。偏相关分析就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。,偏相关系数衡量任何两个变量之间的关系,而使与这两个变量有联系的其他变量都保持不变。例如,我们研究销售额与人口数、销售额与总收入之间的关系,人口数量的多少会影响销售额,总收入的大小亦会影响销售额。由于人口数量的变化,总收入的大小也在经常的变化之中,应用简单相关系数往往不能说明现象之间的关系程度。这时,必须在消除其他变量的影响后来研究两个变量之间的相互关系,这种相关分析称为偏相关分析,这种相关系数称为偏相关系数。例如,在研究销售额和总收入的相互关系时,可假定人口数量不变;在研究销售额与人口数的相互关系时,可假定总

14、收入不变。 例如,变量X,Y,Z之间彼此存在着关系,为了衡量X和Y之间的关系,就必须假定 z保持不变,计算 x和 Y的偏相关系数,我们用 rxy,表示。rxy称为 z保持不变时,X和Y的偏相关系数。偏相关系数是由简单相关系数决定的。,2、 偏相关分析的功能与应用 应用SPSS的偏相关分析过程可对变量进行偏相关分析;在偏相关分析中,系统可按用户的要求对两相关变量之外的某一或某些影响相关的其他变量进行控制,输出控制其他变量影响后的相关系数。 偏相关分析的主要用途如下: 根据观测资料应用偏相关分析计算偏相关系数,可以判断哪些自变量对因变量的影响较大,而选择作为必须考虑的自变量。至于哪些对因变量影响较

15、小的自变量,则可舍去不顾。这样在计算多元回归分析时,只要保留起主要作用的自变量,用较少的自变量描述因变量的平均变动量。 偏相关分析应用的领域也非常广,涉及自然科学和社会科学的各个方面,3、 偏相关分析应用示例 下面举例说明偏相关分析的应用。 例5-4-5 某农场在一块试验地作测定施肥量 X,害虫危害程度Y(用数值表示,数值越大表示危害越严重),和亩产Z的试验,所得数据如下表所示。 (e5-4-5) 第一年 第二年 第三年 第四年 施肥量X 14 27 39 67 害虫危害程度Y 43 15 9 2 亩产Z 30 76 85 12 操作步骤: 分析-相关-偏相关,(1)主对话框中的选择项 变量:用于存放偏相关分析的量 控制:用于存放控制变量 假设检验类型的选择 双尾检验。当事先不知道相关方向(正相关还是负相关)时选择此项,用于正负相关两种可能的情况,是系统默认值。 单尾检验。如果事先知道相关方向可以选择此项,用于只可能是正向或只可能是负向的情况。,是否显示实际的显著性水平 选择 “显示实际显著水平”在显示相关系数的同时,显示实际的显著性概率。不选择此项,其显著性概率使用星号来代替。一个星号“”表示其显著性概率 在5%一1之间。两个星号“*”表示其显著性水平小于或等于1。 (2)“选项”对话框中的选择项 在主对话框的右下角有一个“选项”按钮,单击它,便进入选项对话框 。,Stat

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号