第6讲spss相关

上传人:今*** 文档编号:108161134 上传时间:2019-10-22 格式:PPT 页数:25 大小:903.50KB
返回 下载 相关 举报
第6讲spss相关_第1页
第1页 / 共25页
第6讲spss相关_第2页
第2页 / 共25页
第6讲spss相关_第3页
第3页 / 共25页
第6讲spss相关_第4页
第4页 / 共25页
第6讲spss相关_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《第6讲spss相关》由会员分享,可在线阅读,更多相关《第6讲spss相关(25页珍藏版)》请在金锄头文库上搜索。

1、第六章 SPSS相关分析,本章主要内容:,概述 简单相关分析 偏相关分析 距离分析,整体分析与设计的内容,一、背景概述,相关分析概述,任何事物的存在都不是孤立的,而是相互联系、相互制约的。例如,经济学中投资与消费、收入与消费、生产与投入等都存在一定的联系。 将客观事物相互间的密切程度用适当的统计指标表示出来,这个过程就是相关分析。其特点为:一个变量的取值不能由另一个变量唯一确定,即当自变量x取某个值的时候,因变量y的值可能会有多个。这种关系不确定的变量显然不能用函数形式予以描述,但也不是杂乱无章的。大量的偶然性中蕴含着必然的内在规律。而相关分析,则正是通过对大量数据的观察和研究,来发现这些可能

2、存在的某种客观规律的。 SPSS中的操作菜单:“分析相关”。,二、概念了解,1)函数关系和相关关系 事物或现象之间总是相互联系的,并且可以通过一定的数量关系反映出来。例如:教育需求量与居民收入水平之间,科研投入与科研产出之间等,都存在一定的依存关系。这些依存关系一般可分为函数关系和相关关系两类。,整体分析与设计的内容,二、概念了解,相关分析概述,函数关系,是指事物或现象之间存在严格的依存关系。 其主要特征是它的确定性,即对于一个变量的每一个值,另一个变量都有唯一确定的值与之对应。这些对应关系,通常可用函数式y=f(x)确切的表达出来。 相关关系,是变量间的某种不稳定、不精确的变化关系。 研究的

3、事物或对象之间,存在一定的数量关系,即当一个或几个相互联系的变量取一定数值时,与之对应的另一个变量的值虽然不确定,但会按某种规律在一定的范围内变化。 相关关系反映出变量之间虽然相互影响,具有依存关系,但彼此之间是不能一一对应的。例如,学习成绩与智力因素、各科学习成绩之间的关系、社会环境和人民健康的关系等。 复杂的社会系统中,各事物或现象之间的联系大多体现为相关关系,而不是函数关系,这主要是由于影响一个变量的因素很多,而其中一些因素还没有被人们所完全认识和掌握,或是处于已经认识但对其产生的影响还不能完全控制和测量。另外,有的因素尽管可以控制和测量,但在操作中或多或少都会有误差,所有这些偶然因素的

4、综合作用导致了变量之间的不确定性。,整体分析与设计的内容,相关分析概述,二、概念了解,2)相关关系的类型 根据相关程度的不同: 完全相关:当一种现象的数量变化完全由另一种现象的数量变化所确定时,这两种现象间的关系为完全相关。例如,在价格保持不变的情况下,某种商品的销售总额与其销售量之间的关系总是成正比-此时,相关关系就成了函数关系,因此,也可以说函数关系是相关关系的一个特例。 不相关:如果两个现象之间互不影响,其数量变化各自独立,则称其为不相关现象。例如,一般而言学习成绩高低与天气变化是不相关的。 不完全相关:若两种现象间的关系介于完全相关和不相关之间,则称其为不完全相关。通常我们看到的相关现

5、象,都属于这种不完全相关。 根据变量值变动方向的趋势: 正相关:一个变量的数值增加或减少时,另一个变量的数值也随之增加或减少,两个变量变化方向相同。例如,技能水平随着练习次数的增加而提高。 负相关:指两个变量的变化方向相反,与正相关恰好相反。例如,练习次数与遗忘量之间的关系。,整体分析与设计的内容,相关分析概述,二、概念了解,2)相关关系的类型 根据变量关系的形态: 直线相关:两个变量之间的增加或减少关系,近似的表现为一条直线,这种相关关系就称为直线相关。在散点图上可呈现为一条直线的倾向。 曲线相关:两个变量之间的增加或减少关系,是不均等的,不是线性的,而是近似的表现为一条曲线,这种相关关系就

6、是曲线相关。在散点图上,可近似的呈现为弯月形。 根据研究变量的多少: 单相关:只是两个变量之间的相关关系,可成为单相关。 复相关:一个变量与两个或两个以上的其他变量的相关关系,成为复相关。例如,研究人的营养与人的身高、体重之间的关系,学生的学习成绩与其学习动机、方法、习惯等方面的关系等,都属于复相关。,整体分析与设计的内容,相关分析概述,二、概念了解,3)相关分析 在数据处理中,一般将描述和分析两个或两个以上变量之间相关的性质及其相关程度的过程,成为相关分析。 其主要目的是力求通过具体的数量描述,呈现研究变量之间的相互关系的密切程度及其变化规律,探求相互关系的研究模式,以利于统计预测和推断,为

7、作出正确决策提供参考依据。 相关分析的作用: 判断变量之间有无联系。确定研究现象之间是否具有依存关系,这是相关分析的起点,也是我们研究各种现象之间相互关系的前提条件。因为,只有确定了依存关系的存在,才有继续研究和探索各种现象之间相互作用、制约以及变化规律的必要和价值。 确定选择相关关系的表现形式及相关分析方法。确定了变量之间存在依存关系之后,就需要明确体现变量相互关系的具体表现形式了。-此时,需要选择恰当的相关分析方法,才能确保研究的目的实现,收到预期的效果。否则,若把非线性相关误判为线性相关,则会导致错误的结论。 把握相关关系的方向与密切程度。 相关分析不但可描述变量间的关系,而且可用来预测

8、。还可以用来评价测量量具的信度、效度及项目的区分度等。,整体分析与设计的内容,相关分析概述,二、概念了解,4)相关系数 相关系数,是在直线条件下,说明两个变量之间相关程度及相关方向的统计分析指标。一般可通过计算得到。作为样本相关系数,常用字母r表示;作为总体相关系数,常用 表示。,相关系数范围:-11之间,常用小数表示,一般精确到小数点后两位 相关程度:用相关系数的绝对值表示。越接近1,表示相关程度越高;越接近0,说明相关程度越低;等于1,则说明两者完全直线相关;等于0,则说明完全不相关。 几个注意事项 相关系数受变量取值区间大小及样本数目的影响比较大。一般而言,变量取值区间越大,样本数目越多

9、,相关系数受抽样误差影响就越小,计算结果就越可靠;反之,计算结果则有可能是错误的。一般的,计算相关的成对数据的数目不应少于30对。,整体分析与设计的内容,相关分析概述,二、概念了解,4)相关系数,几个注意事项 来自不同群体且不同质的事物的相关系数不能进行比较。 对于不同类型的数据,计算相关系数的方法也不相同。,整体分析与设计的内容,简单相关分析,一、方法原理,简单相关分析是研究两个变量之间关联程度的统计方法,主要是通过计算简单相关系数来反映变量之间关系的强弱。一般有图形和数值两种表示方式。 1)相关图 在统计中制作相关图,可以直观地判断事物现象之间大致上呈现何种关系的形式。相关图是相关分析的重

10、要方法,利用直角坐标系第一象限,把第一个变量置于横轴上,第二个变量置于纵轴上,而将两个变量对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形,就是相关图。例如,通过观察散点图能够发现变量间的统计关系以及它们的强弱程度。 在SPSS中提供了四种散点图,分别是简单散点图(Simple)、重叠散点图(Overlay)、矩阵散点图(Matrix)和三维散点图(3-D)。 2)相关系数 虽然相关图能够展现变量间的数量关系,但这也只是一种直观判断方法。为了更精确的用数据表达,则可以计算变量计算之间的相关系数。对不同类型的变量应当采取不同的相关系数来度量,常用的相关系数主要有以下几种:,整体分析

11、与设计的内容,简单相关分析,一、方法原理,2)相关系数 皮尔松(Pearson)相关系数 该系数常称为积差相关系数,适用于研究连续变量之间的相关程度。例如,收入和储蓄存款、身高和体重等变量之间的线性相关关系。 注意:Pearson系数适用于线性相关的情形,对于曲线相关等更为复杂的情形,系数的大小并不能代表其相关性的强弱。其计算公式如下:,整体分析与设计的内容,简单相关分析,一、方法原理,2)相关系数 皮尔松(Pearson)相关系数,取值范围 直线相关程度 - |r|=0 完全不相关 0|r|=0.3 微弱相关 0.3|r|=0.5 低度相关 0.5|r|=0.8 显著相关 0.8|r|1 高

12、度相关 |r|=1 完全相关,整体分析与设计的内容,简单相关分析,一、方法原理,2)相关系数 斯皮尔曼(Spearman)等级相关系数(非参数相关系数) 该系数是用来度量顺序水准变量之间的线性相关关系,它是利用两变量的秩次大小做线性相关分析,适用条件如下: 两个变量的变量值是以等级次序表示的资料 一个变量的变量值是等级数据,另一个变量的变量值是等差或等比数据,且其两总体不要求是正态分布,样本容量不一定大于30. 可以看出,等级相关的应用范围要比积差相关广泛,它的突出优点是对数据的总体分布、样本大小都不做要求,但计算精度不高。其基本公式如下:,两个变量每对数据等级之差,整体分析与设计的内容,简单

13、相关分析,一、方法原理,2)相关系数 肯德尔(Kendall)等级相关系数(非参数相关系数) 它是用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情况。这种指标采用非参数检验方法测度变量间的相关关系。它利用变量的秩计算一致对数目和非一致对数目。如果两变量具有较强的正相关性,则一致对数目U应较大;若两变量相关性弱,则一致对数目U和非一致对数目V应大致相等。其公式如下:,整体分析与设计的内容,简单相关分析,二、操作,实践数据:“股票指数间的关系.sav” 菜单:“分析相关双变量”,选入两个或两个以上变量,与前面所讲述的系数一致。其中,对于非等间距测度的连续变量,因为分布不明,可以使用等级

14、相关分析,也可使用Pearson相关分析;对于完全等级的离散变量,必须使用等级相关分析其相关性。当资料不服从双变量正态分布、总体分布类型未知或原始数据是用等级表示时候,宜用Spearman或Kendall相关分析。,双尾检验和单尾检验。单尾检验和双尾检验的区别在于他们拒绝H0的标准。单尾检验允许你在差异相对较小时拒绝H0,这个差异被规定了方向。另一方面,双尾检验需要相对较大的差异,这个差异不依赖于方向。,显著水平0.01下,相关系数带两个星号(*);显著水平0.05下,一个星号(*),整体分析与设计的内容,简单相关分析,二、操作,选项对话框:,输出反映选中的每一对变量之间的叉积离差矩阵和协方差

15、矩阵。,整体分析与设计的内容,简单相关分析,三、输出结果,Pearson系数高达0.995,其概率P值则明显小于显著性水平0.01,说明两者高度正相关。,相关系数都小于Pearson系数,这是由于秩变换或数据按有序分类处理时损失信息所导致的。,整体分析与设计的内容,简单相关分析,四、制图方法,选简单散点图。,整体分析与设计的内容,简单相关分析,四、制图方法,选简单分布,整体分析与设计的内容,偏相关分析,一、方法原理,简单相关分析是计算两个变量之间的相互关系,分析两个变量间线性相关的程度。 但是,在现实中事物之间的联系可能存在于多个主体之间,因此,往往因为第三个变量的作用使得相关系数不能真实地反

16、映两个变量间的线性相关程度。例如,身高、体重和肺活量之间的关系。 偏相关分析就是在研究两个变量之间的线性相关关系时,控制可能对其产生影响的变量。 偏相关分析是在相关分析的基础上,考虑了两个因素以外的各种作用,或者说是在扣除了其他因素的作用大小以后,重新来测度这两个因素间的关联程度。这种方法的目的就在于消除其他变量关联性的传递效应。 偏相关分析在计算时,可首先分别计算三个因素之间的相关系数,然后通过三个简单相关系数来计算偏相关系数,公式如下:,整体分析与设计的内容,偏相关分析,二、操作,实践数据:“股票市场和债券市场.sav” 菜单:“分析相关偏相关”,选入两个或两个以上变量,作为检验变量,至少选入一个变量,作

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号