第5讲 相关分析与相关系数

上传人:夏** 文档编号:431008600 上传时间:2023-06-16 格式:DOCX 页数:9 大小:87.96KB
返回 下载 相关 举报
第5讲 相关分析与相关系数_第1页
第1页 / 共9页
第5讲 相关分析与相关系数_第2页
第2页 / 共9页
第5讲 相关分析与相关系数_第3页
第3页 / 共9页
第5讲 相关分析与相关系数_第4页
第4页 / 共9页
第5讲 相关分析与相关系数_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《第5讲 相关分析与相关系数》由会员分享,可在线阅读,更多相关《第5讲 相关分析与相关系数(9页珍藏版)》请在金锄头文库上搜索。

1、一、“相关”的意义(一)相关现象教育工作者常发觉,许多教育现象之间或教育行为之间存在着一定的相互联系。例如,在 学习行为上,隐约地表现出这么一些特点:学生的数学成绩和物理成绩之间关系密切,似乎许 多数学成绩优秀的学生在物理科目上的成绩大多也是优秀的,许多数学水平中等的学生在物理 科目上的学习水平大多数也是中等的,许多数学成绩较差的学生物理科目上的学习成绩大多也 是较差的。这说明数学成绩和物理成绩之间存在一种“水涨船高、水落船低”的互相关联的 趋势。当然,并不是所有事物之间都有这么一种相同的明显的关联趋势。比如,数学成绩与语文 成绩之间或语文成绩与化学成绩之间,其相互关联的趋势就不是那么明显可察

2、。而另外一些教 育现象,例如对学习材料的复习次数与遗忘量之间的关系,其遗忘量在一定范围内随着复习次 数的增加而减小。可见,行为变量或现象之间存在着种种不同模式不同程度的联系。(二)、相关的直观意义一散点图分析正相关与负相关一一 如果相互关联着的两变量,一个增大另一个也随之增大,一个减 小另一个也随之减小,变化方向一致,就称两变量之间有正相关。如果相互关联着的两变量, 一个增大另一个反而减小,变化方向相反,就称叫两变量之间有负相关。直线性相关与曲线相关一一直线性相关是所有关联模式中最简单的一种,有关联的两个变 量各自以大体均等的速度变化着。若以平面坐标散点图来理解,直线性相关意指:两个变量的 成

3、对观测数据在平面直角坐标系上描点构成的散点图分布的教点会环绕在某一条直线附近。直线性相关的含义,是以平面坐标散点图来理解,我们还可以从相关散点图的几何分布形 态来认识相关的强度与方向,如果散点图形杂乱无章,没有显示出向某个方向延伸的情形,则说 明相关程度很低;如果散点图分布形成一个边界不规则的椭圆,则说明两个变量存在中等程度 的相关;若这里的椭圆越扁长,则相关程度越高。至于相关的方向,则可以通过散点椭圆图形 的长轴所在直线的斜率来判断。从左下方往右上方延伸的情形是正相关;从左上方往右下方延 伸的情形是负相关。这样,我们可以从散点图的分布情况,初步判断两个变量之间的相关情况。二、相关的计算及分析

4、(一)、(积差)相关系数r定义,设两个现象有如下两组观测值X : x ,x,xy : 3,y (X X)(Y - Y)称r = ,=1为“X与Y的相关系数”j (XX)2 浴(% - Y)2 i=1 i=1相关系数用r表示,r在-1和+1之间取值。相关系数r的绝对值大小(即),表示两个 变量之间的直线相关强度;相关系数r的正负号,表示相关的方向,分别是正相关和负相关;若 相关系数r=0,称零线性相关,简称零相关;相关系数 =1时,表示两个变量是完全相关, 这时,两个变量之间的关系成了确定性的函数关系,这种情况在行为科学与社会科学中是极少存 在的。一般说来,若观测数据的个数足够多的话,计算出来的

5、相关系数r就会更真实地反映客观事 物之间的本来面目。 M 07 04当0.7一门1,称为高度相关;当0.4一,时,称为中等相关;当0.2一,时,,广|称为低度相关;当时,称极低相关或接近零相关。由于事物之间联系的复杂性,在实际研究中,通过统计方法确定出来的相关系数r即使是高 度相关,我们在解释相关系数的时候,还要结合具体变量的性质特点和有关专业知识进行。两 个高度相关的变量,它们之间可能具有明显的因果关系;也可能只具有部分因果关系;还可能没 有直接的因果关系,其数量上的相互关联,只是它们共同受到其他第三个变量所支配的结果。 除此之外,相关系数r接近零,这只是表示这两个变量不存在明显的直线性相关

6、模式,但不能肯 定地说这两个变量之间就没有规律性的联系。通过散点图我们有时会发现,两个变量之间存在 明显的某种曲线性相关,但计算直线性相关系数时,其r值往往接近零。对于这一点,读者应 该有所认识。在统计学教科书中,除非特别说明,直线性相关一般情况下就称相关;直线性相关系数就 称相关系数。相关系数的计算方法多种多样,这里主要介绍:积差相关、等级相关和点双列相 关。这些相关分析方法在行为科学研究以及在教育与心理测量研究中有广泛的应用。【例1】练习(用“统计计算器”)算出某学生X (数学)与Y (语文)成绩之间的相关系 数(表1):学生号工;段工送01748254766724606802717550

7、4156265325038081680065616480048589722579217565057682577667246232067789592979216853077788592977446776086884462470565712097480547664005920107487547675696438756837573527024563369说明该系数的含义。(答:0.48)(二)、等级相关的概念及基本公式针对两列顺序变量数据之间的相关问题,英国心理学家与统计学家斯皮尔曼(C.E.Spearman)在皮尔逊积差相关法思想的基础上,导出了等级相关的计算方法。等级相关 是根据两列顺序变量数据

8、中各对等级数据的差数来计算相关系数的方法。对于连续变量的数据, 必要时可分别把两列数据按大小顺序赋给名次等级,进而采用等级相关法计算相关系数。等级 相关系数的基本计算公式如下:式中:rR是等级相关的记号;n是成对观测数据的数量;D是成对的等级数据的差数,简 Yd2 v称等级差数;乙 是所有等级差数的平方和。(答:0.6667)【例2】表2:等级相关系数计算示例0745-110886242/28【例3】 两位教育专家对5篇论文进行独自评价,各自对这5篇论文排出名次顺序,其结 果见表2中第2栏和第3栏有关数据。试问这两位教育专家在评价优秀论文时,他们评价意见 一致性如何?分析解答一般说来,要研究两

9、位专家的评判标准或评价意见的一致性程度,可以通过 相关分析的方法。由于这里的评价意见最终是以排定的名次出现的,故要用等级相关法。具体 计算仿照上例,其结果如表3。据此求得:6尤口 6x22 r =1 -=1- 22= _0 r食-1)5x(52 -1)可见这两位专家对5篇论文的评价意见一致性很差。表3等级相关系数计算示例2关于Spearman等级相关系数计算中出现“相同等级”时的处理方法:把相同等级处理成算术平均数;或者在把相同等级处理成算术平均数的同时,对另一变量的对 应等级也处理成算术平均数。(三)、点双列相关相关的概念及基本公式在研究一些教育问题时,我们常遇到两个变量中的一个是连续变量,

10、另一个是二分类的称 名变量,并且要求分析它们之间的相关连带关系的情况。【例4】某研究人员取得14位学生参加国际中学生奥林区克数学竞赛地区选拔赛的成绩, 其数据如表3所示,试问性别和数学能力之间有连带关系吗?表4: 14名学生参加奥林区克数学选拔赛成绩一览表学生代号ABCDEFGHIJKLMN性另U男男男男男男男男男女女女女女数学成绩6940304361574865334460402330这里的性别变量是称名变量,是名副其实的二分类称名变量,而数学成绩是连续变量数据。对这样类型的两列数据,怎样研究变量之间的相关呢?显然,前面介绍的方法都不适用为此, 我们介绍一种新的相关分析法,即点双列相关。1、

11、点双列相关适用范围及基本公式点双列相关适用于双变量数据,例如有一列数据是连续变量数据,如体重、身高以及许多 测验与考试的分数;包括一列数据是二分类的称名变量数据,如性别(分男与女)、态度(分 赞成和不赞成)、学习经历(分有与无)、考试结果(分合格与不合格)、题目解答(分答对 与答错)等数据。点双列相关的基本公式为:XY式中:9是点双列相关系数的符号;P是二分类数据中某类事物所占的比例;q是二分类 数据中另一类事物所占的比例,=1 一 P ;是P类事物的连续变量数据的平均数;,“是 q类事物的连续变量数据的平均数;”是全部连续变量数据的标准差。2、点双列相关系数计算根据上述点双列相关的基本公式,

12、可从已知数据出发,分步进行计算。【例3】 根据本节表4-7的有关数据,研究一下数学能力与性别之间有多大的关联。分析解答采用点双列相关法来研究教学能力和性别之间的相关情况,可按公式,由表 中的数据资料分步计算。(1) 在14名学生中有9名男生和5名女生,若用p表示男生的人数比例,q表示女生的 人数比例,则有:9p= = 0.64 算=-p = 0.357114(2) 把14名学生的数学比赛成绩按男生和女生分成两部分,第一部分即p部分是9名男生 的数学成绩,第二部分即q部分是5名女生的数学成绩,并分别计算这两部分数据的平均数。男生成绩:69,40,30,43,61,57,48,65,33女生成绩:

13、44,60,40,23,3069 + 40 + 30 + 43 + 61 + 57 + 48 + 65 + 33 446 小 矿 =49.5556X w9944 + 60 + 40 + 23 + 30 197V = 39.4的二55(3) 计算14名学生的数学成绩的标准差Sx。为此,根据第二章中标准差的公式,表中的数 据通过计算可得下列各值:(4) 把上述各值代入公式,求得点双列相关系数为:项=% 一、应=45556 - 39.4 0 6429x0.3571 = 0.5780 乩 13.9667注:这个计算结果是错的!应为0.35.因此,从本研究的数据来看,奥林匹克数学竞赛地区选拔赛的数学成绩

14、与学生性别之间存 在中等程度的相关。具体地讲,从男生组和女生组的平均分数来比较,似乎男生的数学平均分 数较明显地高于女生的数学平均分数。当然,计算点双列相关第数也可以设计一张表格来完成上述各个数量的计算。同学不妨利 用这种计算格式来完成后面的有关练习题。特别应提到的是,若用数字“1”和“0”分别表示 二分类称名变量数据中的男生和女生,或选择题的答对与答错反应,再应用积差相关系数公式 或等级相关公式来计算,其计算结果相同。原来,点双列相关公式就是按照积差相关的思路推导 出来的,因而,点双列相关是积差相关的特殊应用。在这种特殊情形下,不论积差相关系数也 好,点双列相关系数也好,正负相关的意义对结果的解释都要结合具体问题情况来进行解释。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 活动策划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号