SPSS统计分析第七章相关分析ppt课件

上传人:我*** 文档编号:148530050 上传时间:2020-10-20 格式:PPT 页数:33 大小:306.50KB
返回 下载 相关 举报
SPSS统计分析第七章相关分析ppt课件_第1页
第1页 / 共33页
SPSS统计分析第七章相关分析ppt课件_第2页
第2页 / 共33页
SPSS统计分析第七章相关分析ppt课件_第3页
第3页 / 共33页
SPSS统计分析第七章相关分析ppt课件_第4页
第4页 / 共33页
SPSS统计分析第七章相关分析ppt课件_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《SPSS统计分析第七章相关分析ppt课件》由会员分享,可在线阅读,更多相关《SPSS统计分析第七章相关分析ppt课件(33页珍藏版)》请在金锄头文库上搜索。

1、第七章 相关分析,一、相关分析的概念,相关分析是研究变量间密切程度的一种常用统计方法。 线性相关分析研究两个变量间线性关系的程度。 相关系数是描述这种线性关系程度和方向的统计量,通常用r表示。相关系数r没有单位;其值在-l+1之间。当数值愈接近-l或+1之间时,关系愈紧密,接近于0时,关系愈不紧密。 对其数值可以从小到大排列的数据才能计算其相关系数。例如不能计算宗教信仰与颜色喜好之间的关系。,二、相关系数,积矩相关系数(Pearson相关系数) Spearman和Kendall秩相关系数 偏相关系数,1、积矩相关系数(Pearson相关系数),积矩相关系数(又称积差相关系数)适用于等间隔测度,

2、相关系数采用Pearson积矩相关。,2、Spearman和Kendall秩相关系数,Spearman和Kendall秩相关系数是一种非参测度,是 根据秩而不是根据实际值计算的 秩相关适用于下列资料 不服从双变量正态分布; 总体分布型未知; 用等级表示的资料。,Spearman相关系数是Pearson相关系数的非参形式。是根据数据的秩而不是根据实际值计算的。也就是说,先对原始变量的数据排秩,根据各秩使用相关系数公式进行计算。它适合有序数据或不满足正态分布假设的等间隔数据。相关系数的值范围也是在-l+1之间。绝对值越大表明相关越强。相关系数的符号也表示相关的方向。这两种相关系数的计算必须对连续变

3、量值排秩,对离散变量排序。,例如,我们可以将一组学生按入学考试成绩和第一学年结业成绩的顺序排队。如果将入学考试成绩的评秩记为X1,X2,Xn,而学年结业成绩的评秩记为Y1,Y2,Yn,我们就可以用秩相关度量来决定X和Y之间的相关性。,Ri为第i个X值的秩,Si为第i个Y值的秩。,Kendalls tau-b也是一种对两个有序变量或两个秩变量间的关系程度的测度,因此也属于一种非参测度 。 以一个例子来进行Kendall秩相关系数的计算。如果两位鉴定家各自以吸引力的大小将7幅抽象派画评定了秩,那么可能知道这些秩评定之间的相符的程度。,依次取观测2(鉴别家2)给出的秩,数出每一个右面在秩次上比自己小

4、的个数,并将这些个数加起来。例如抽象画2的秩为2,其个数是1,因为其右边的只有抽象画5的秩比它小。6个数依次为1,1,0,0,1和0,所以总和为Q3,Kendall秩相关系数则为: R=1-4Q/n(n-1)=1-12/42=0.714,3、偏相关系数,偏相关系数描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性。 例如:可以控制年龄和工作经验两个变量的影响,估计工资收入与受教育程度之间的相关关系。 控制了变量Z,变量X与 Y之间的偏相关,和控制了两个变量 Z1、Z2,变量 X与Y之间的偏相关系数计算公式不同。,两个或若干变量之间或两组观测量之间的关系有时也可以用相似性或不相似

5、性来描述。相似性测度用大数值表示很相似,较小的数值表明相似性小。不相似性使用距离或不相似性来描述。大值表示相差甚远。,三、相关系数统计意义的检验,由于我们通常是通过抽样方法;利用样本研究总体的特性。由于抽样误差的存在,样本中两个变量间相关系数不为0,不能说明总体中这两个变量间的相关系数不是0,因此必须经过检验。检验的零假设是:总体中两个变量间的相关系数为0。SPSS的相关分析过程给出这假设成立的概率。,四、相关分析的 SPSS过程,Bivarate(相关分析)命令项调用Correlations过程和 Nonpar Corr 过程,按指定项显示变量的描述统计量。计算指定的两个变量间的相关系数,可

6、以选择Pearson相关、Spearman和Kendalls tau-b 相关;同时对相关系数进行检验。检验的零假设是:相关系数为0。可以对检验进行单尾或双尾的选择。给出相关系数为0的概率。,Partial(偏相关分析)命令项调用Partial Corr过程,计算两个变量间在控制了其他变量的影响下的相关系数。可以选择单尾或双尾显著性检验。检验的零假设是:偏相关系数为零。还可以要求计算其他描述统计量。,Distance(距离分析)命令项调用Proximities 过程,对变量或观测量进行相似性或不相似性测度。因此分析的变量可以是连续变量、表示频数分布的变量,某些测度还可以适用于二值变量。可以对原

7、始数据和计算出的距离数据进行标准化。,如果需要确定两个变量或若干自变量与因变量具体的函数关系,使用相关分析不能达到目的,必须使用回归分析。如果要将观测量或变量归到确定的类中,必须使用聚类分析中的观测量聚类或变量聚类的相应过程。,(一)两个变量间的相关分析,本节介绍两变量间的相关。包括两个连续变量间的相关和两个等级变量间的秩相关。这两种相关使用同一个命令项Bivarate调用,通过选择不同的分析方法调用不同的分析过程。选择哪一种分析方法要看具体的数据类型。对于连续变量和等级变量选择不同的分析方法。,Pearson调用correlation过程计算连续变量或等间隔测量的变量间的相关系数。 Kend

8、alls tau-b调用Nonpar corr过程计算分类变量间的秩相关。 Spearman调用Nonpar corr过程计算斯皮尔曼秩相关。 如果参与分析的变量是连续变量,选择Kendalls tau-b或Spearman相关,则系统自动对连续变量的值先求秩,再计算其秩分数间的相关系数。,使用系统默认值进行相关分析,l9621988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的相关分析为例,说明使用系统默认值进行连续变量相关分析的方法。 数据编号data1001。 变量包括:income国民收入(亿元),deposit城乡居民储蓄存款余额, number序号,year年份。,例 一,Da

9、ta0903是银行雇员数据,要求分析起始工资、当前工资、与雇员年龄、受教育水平、工作经验职务等之间是否存在线性关系。 生成新变量:age=1999-Xdate.year(bdate),例二,10名运动员长拳和长兵器两项得分,分析两项得分是否存在相关关系。 Data1002,例三,10名学生两科课程的名次排列,要求求出其等级相关系数,检验其显著性。 Data1003,练习题,某妇幼保健医院对33名产妇进行产前检查并得到婴儿体重的原始观测值包括髂前上棘间径(x1),髂脊间径(x2),耻骶外径(x3),坐骨间径(x4),血红蛋白(x5),婴儿体重(X6)等6个指标。试分析各指标的相关系数。 Hong

10、1.sav,(二)偏相关分析,相关分析计算两个变量间的相关系数,分析两个变量间线形关系的程度。往往因为第三个变量的作用,使相关系数不能真正反映两个变量间线形程度。例如身高、体重与肺活量之间的关系。使用Pearson相关计算其相关系数,可以得出肺活量与身高和体重均存在较强的线形关系。,但实际上,如果对体重相同的人,分析身高和肺活量。是否身高值越大,肺活量越大呢?结论是否定的。正是因为身高与体重有着线形关系,体重与肺活量才存在线形关系,因此,得出身高与肺活量之间存在较强的线形关系的错误结论。偏相关分析的任务就是在研究两个变量之间的线形相关关系时控制可能对其产生影响的变量。,例一,分析身高、体重、肺

11、活量间的关系 数据编号data1004 分别调用bivariate和partial过程,比较其结,例二,四川绵阳地区3年生中山柏的数据。分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度四个气候因素哪个因素有关。Month:月份,hgrow:生长量,temp:月平均气温,rain: 月降雨量,hsun: 月平均日照时数,humi: 月平均湿度。 数据编号data1005 分析变量:hgrow(生长量)与hsun(月平均日照时数) 控制变量:humi(月平均湿度)、rain(月降雨量)、temp(月平均气温),综合分析结果,中山柏生长量与气温关系最密切,其次湿度;日照时间,相关系数0

12、.6318,不相关概率p=.068,没有显著意义;与降雨量没有线形关系,降雨量过大,还会影响其生长。,练习题,从下表所给资料分析血小板和出血症的关系。试分析上述资料有无相关关系。,Spearman.sav,(三)距离分析,距离分析是对观测量之间或变量之间相似性或不相似程度的一种测度。是计算一对变量之间或一对观测量之间的广义距离。这些相似性或距离测度可用于因子分析和聚类分析等。,有关统计量,不相似性测度 等间隔数据的不相似性(距离)测度可以使用的统计量:欧几米德(欧氏)距离、欧氏距离平方等。 计数数据,使用卡方。 二值(只有两种取值)数据,使用欧氏距离、欧氏距离平方等。 相似性测度 等间隔数据使用统计量皮尔逊相关或余弦。 测度二元数据的相似性使用的统计量有二十余种。,仍以四川绵羊地区中山柏生长的数据为例(data1005)。对观测量距离的分析要求使用字符型变量标识观测量。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号