SPSS相关分析案例讲解

上传人:雨水 文档编号:146301190 上传时间:2020-09-29 格式:DOCX 页数:15 大小:517.51KB
返回 下载 相关 举报
SPSS相关分析案例讲解_第1页
第1页 / 共15页
SPSS相关分析案例讲解_第2页
第2页 / 共15页
SPSS相关分析案例讲解_第3页
第3页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《SPSS相关分析案例讲解》由会员分享,可在线阅读,更多相关《SPSS相关分析案例讲解(15页珍藏版)》请在金锄头文库上搜索。

1、相关分析一、两个变量的相关分析:Bivariate1相关系数的含义相关分析是研究变量间密切程度的一种常用统计方法。相关系数是描述相关关系强弱程度和方向的统计量,通常用r表示。相关系数的取值范围在-1和+1之间,即:1r 1。计算结果,若r为正,则表明两变量为正相关;若r为负,则表明两变量为负相关。相关系数r的数值越接近于1(1或+1),表示相关系数越强;越接近于0,表示相关系数越弱。如果r=1或1,则表示两个现象完全直线性相关。如果=0,则表示两个现象完全不相关(不是直线相关)。,称为微弱相关、,称为低度相关、,称为显著(中度)相关、,称为高度相关r值很小,说明X与Y之间没有线性相关关系,但并

2、不意味着X与Y之间没有其它关系,如很强的非线性关系。直线相关系数一般只适用与测定变量间的线性相关关系,若要衡量非线性相关时,一般应采用相关指数R。2常用的简单相关系数(1)皮尔逊(Pearson)相关系数皮尔逊相关系数亦称积矩相关系数,1890年由英国统计学家卡尔皮尔逊提出。定距变量之间的相关关系测量常用Pearson系数法。计算公式如下: (1)(1)式是样本的相关系数。计算皮尔逊相关系数的数据要求:变量都是服从正态分布,相互独立的连续数据;两个变量在散点图上有线性相关趋势;样本容量。(2)斯皮尔曼(Spearman)等级相关系数Spearman相关系数又称秩相关系数,是用来测度两个定序数据

3、之间的线性相关程度的指标。当两组变量值以等级次序表示时,可以用斯皮尔曼等级相关系数反映变量间的关系密切程度。它是根据数据的秩而不是原始数据来计算相关系数的,其计算过程包括:对连续数据的排秩、对离散数据的排序,利用每对数据等级的差额及差额平方,通过公式计算得到相关系数。其计算公式为: (2)(2)式中,为等级相关系数;为每对数据等级之差;为样本容量。斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究。(3)肯德尔(Kendal

4、l)等级相关系数肯德尔(Kendall)等级相关系数是在考虑了结点(秩次相同)的条件下,测度两组定序数据或等级数据线性相关程度的指标。它利用排序数据的秩,通过计算不一致数据对在总数据对中的比例,来反映变量间的线性关系的。其计算公式如下: (3)(3)式中,是肯德尔等级相关系数;是不一致数据对数;为样本容量。计算肯德尔等级相关系数的数据要求与计算斯皮尔曼等级相关系数的数据要求相同。3相关系数的显著性检验通常,我们用样本相关系数r作为总体相关系数的估计值,而r仅说明样本数据的X与Y的相关程度。有时候,由于样本数据太少或其它偶然因素,使得样本相关系数r值很大,而总体的X与Y并不存在真正的线性关系。因

5、而有必要通过样本资料来对X与Y之间是否存在真正的线性相关进行检验,即检验总体相关系数是否为零(即原假设是:总体中两个变量间的相关系数为0)。SPSS的相关分析过程给出了该假设成立的概率(输出结果中的Sig.)。样本简单相关系数的检验方法为:当原假设:,时,检验统计量为: (4)当原假设:,时,检验统计量为: (5)式中,为简单相关系数;为观测值个数(或样本容量)。4背景材料设有10个厂家,序号为1,2,10,各厂的投入成本记为,所得产出记为。各厂家的投入和产出如表7-18-1所示,根据这些数据,可以认为投入和产出之间存在相关性吗?表1 10个厂家的投入产出 单位:万元厂家12345678910

6、投入产出20304060204030601030104020402050203030705操作步骤5-1 绘制散点图的步骤(1)选择菜单命令“Graphs”“Legacy Dialogs”“Scatter/Dot”,打开Scatter/Dot对话框,如图1所示。图1 选择散点图窗口(2)选择散点图类型。SPSS提供了五种类型的散点图。(3)根据所选择的散点图类型,单击“Define”按钮设置散点图。不同类型的散点图的设置略有差别。简单散点图(Simple Scatter)简单散点图的设置窗口如图2所示。图2 简单散点图的设置窗口从对话框左侧的变量列表中指定某个变量为散点图的纵坐标和横坐标,分别

7、选入Y-Axis和X-Axis框中。这两项是必选项。可以把作为分组的变量指定到Set Markers by框中,根据该变量取值的不同对同一个散点图中的各点标以不同的颜色(或形状)。该项可以省略。把标记变量指定到Label Cases by框中,表示将标记变量的各变量值标记在散点图的旁边。该项可以省略。从左侧变量列表框中选择变量到Panel by框中作为分类变量,可以使该变量作为行(Rows)或列(Columns)将数据分成不同的组,便于比较。该项可以省略。选择Use Chart Specifications From选项,可以选择散点图的文件模板,单击“File”可以选择指定的文件。单击“Ti

8、tle”按钮可以对散点图的标题进行设置,单击“Options”按钮可以对缺失值以及是否显示数据的标注进行设置。重叠散点图(Overlay Scatter)重叠散点图能同时生成多对相关变量间统计关系的散点图,首先根据分类变量的不同取值对原始数据进行分类,然后对各分类数据做简单散点图。重叠散点图的设置窗口如图7-18-3所示。图3 重叠散点图的设置窗口从左侧框中选择一对变量进入Pairs框中,其中前一个为图的纵坐标变量(Y-Variable),后一个作为图的横轴变量(X-Variable),可以通过点击按钮进行横纵轴变量的调换。其他设置与同简单散点图都相同。矩阵散点图(Matrix Scatter

9、)矩阵散点图以方形矩阵的形式在多个坐标轴上分别显示多对变量间的统计关系。矩阵散点图的关键是弄清各矩阵单元中的横纵变量。矩阵散点图的设置窗口如图4所示。图4 矩阵散点图的设置窗口把参与绘图的若干变量指定到Matrix Variables框中。选择变量的先后顺序决定了矩阵对角线上变量的排列顺序。其他设置也与简单散点图相同。三维散点图(3-D Scatter)三维散点图生成三个相关变量的三维散点图,由三个坐标轴对应变量的数据决定,它以立体图的形式展现三对变量间的统计关系。设置窗口如图5所示。图5 三维散点图设置窗口从左侧的变量列表中指定三个变量分别选入Y-Axis、X-Axis、Z-Axis框中。其

10、他设置均与简单散点图相同。单点散点图(Sample Dot)单点散点图生成单个变量的散点图,显示数值型变量的每一个观测值,这些值都堆积在X轴附近,由于没有指定Y轴,所以数据点的Y坐标没有特殊的含义。设置窗口如图6所示。图6 单点散点图设置窗口从左侧变量列表中选择一个变量选入X-Axis Variable框中。其他设置与简单散点图相同。5-2 计算简单相关系数的操作步骤通过散点图可以初步判断变量是否具有线性趋势。对具有线性趋势的变量计算相应的简单相关系数的步骤如下:(1)选择菜单命令“Analyze”“Correlate”“Bivariate”,打开两变量相关分析的对话框,如图7所示。图7 两变

11、量相关分析窗口(2)选入需要进行相关分析的变量进入Variables框,至少需要选入两个,如选入“投入”、“产出”变量。(3)在Correlation Coefficients复选框中选择需要计算的相关系数。主要有:Pearson复选框:选择进行积距相关分析,即最常用的参数相关分析;Kendalls tau-b复选框:计算Kendalls等级相关系数;Spearman复选框:计算Spearman相关系数,即最常用的非参数相关分析(秩相关)。(4)Test of Significance单选框用于确定是进行相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,系统默认双侧检验

12、。(5)Flag significant correlations用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时P0.05的系数值旁会标记一个星号,P0.01的则标记两个星号。(6)单击Options按钮,弹出Options对话框,选择需要计算的描述统计量和统计分析,如图8所示。图8 两变量相关分析的Options子对话框在Statistics复选框中定义各变量输出的描述统计量。Means and standard deviations选项表示每个变量的样本均值和标准差;Cross-product deviations and covariances选项表示各对变量的离差

13、平方和、样本方差、两变量的叉积离差以及协方差阵。叉积离差为Pearson相关系数公式中的分子部分;协方差为叉积离差/(n-1)。在Missing Values单选框中定义分析中对缺失值的处理方法,可以是具体分析用到的两个变量有缺失值才去除该记录(Exclude cases pairwise),或只要该记录中进行相关分析的变量有缺失值(无论具体分析的两个变量是否缺失),则在所有分析中均将该记录去除(Excludes cases listwise)。(7)单击“OK”按钮完成设置,提交运行。6结果解析根据背景资料,利用表1中的数据,建立SPSS数据文件,分别将变量投入、产出选入Variables框

14、中,并在Options子对话框选中Means and standard deviations选项和Cross-product deviations and covariances选项,其他选择默认。结果如表2、表3所示。6-1 表2为描述统计量,表3为相关分析结果。从表3中可以看出皮尔逊相关系数为0.759,即投入与产出的相关系数为0.759,双侧检验的P值为0.011,明显小于0.05,拒绝二者不相关的原假设。因此,我们可以得出结论:可以认为投入与产出之间存在正相关,当投入增加时,产出也会相应增加。表2 描述统计量 Descriptive StatisticsMeanStd. Deviati

15、onN投入22.009.18910产出45.0014.33710表3 简单相关系数分析结果Correlations投入产出投入Pearson Correlation1.759*Sig. (2-tailed).011Sum of Squares and Cross-products760.000900.000Covariance84.444100.000N1010产出Pearson Correlation.759*1Sig. (2-tailed).011Sum of Squares and Cross-products900.0001850.000Covariance100.000205.556N1010*. Correlation is significant at the

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号