相关系数 -

上传人:suns****4568 文档编号:94783942 上传时间:2019-08-11 格式:PDF 页数:56 大小:861.34KB
返回 下载 相关 举报
相关系数 -_第1页
第1页 / 共56页
相关系数 -_第2页
第2页 / 共56页
相关系数 -_第3页
第3页 / 共56页
相关系数 -_第4页
第4页 / 共56页
相关系数 -_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《相关系数 -》由会员分享,可在线阅读,更多相关《相关系数 -(56页珍藏版)》请在金锄头文库上搜索。

1、1 相关关系 2 引例 考试交卷时间与成绩之间的关系: 3 主要内容 基本概念基本概念 积差相关积差相关* 等级相关等级相关 斯皮尔曼等级相关、肯德尔系数 其它相关种类其它相关种类 点二列相关、二列相关、系数 4 第一节基本概念 5 变量间的关系 因果关系因果关系:一种现象是另一种现象的因,而另一种现 象则是果。 例:努力成绩;刺激强度反应强度 共变关系共变关系:两事物本身之间没有直接的关系,但它们 都受第三种现象的影响而发生变化。 阅读能力与鞋码大小;拥有金表的数量与寿命 相关关系相关关系:两类现象在发展变化的方向与大小方面存 在一定关系,但不能确定两者中哪个是因,哪个是果。 不存在共变关系

2、(两者并不同时受第三因素的影响)。 友谊态度;看电视攻击性行为 6 相关 因果 7 相关的种类 变化方向变化方向 正相关:两列变量变动方向相同(e.g. 身高-体重) 负相关:两列变量变动方向相反(e.g. 练习次数-错误率) 零相关:两列变量之间无关系(e.g. 相貌-成绩) 相关关系的程度相关关系的程度(与特定相关形式的拟合程度) 高相关:.70/.80 中等程度相关:.30(.40)-.70(.80) 低相关:=30为宜。 没有线性相关,不一定没有关系,可能是非线性的。 13 小练习 相关 -.80所呈现的数据点比相关+.50所呈现的数据点更为 密集地聚集在直线周围。 如果数据密集地聚集

3、在一条从左至右下降的直线上,这 表明这个相关在+.90左右。 相关从未比1.00 大过。 已知r1= -0.7, r2= 0.7。下列表述正确的是( )。 A . r1和 r2代表的意义相同 B . r2代表的相关程度高于r1 C. r1和 r2代表的相关程度相同 D. r1和 r2的散点图相同 14 第二节积差相关 15 积差相关的概念和适用条件 积差相关(皮尔逊相关)是揭示两个变量线性相 关方向和程度最常用和最基本的方法。 适用条件: 要求成对的数据,两列数据都是测量的数据(数值 型变量); 正态双变量; 两列变量之间的关系应是线性的,如果是非线性的, 则不能计算线性相关; n 30。 1

4、6 积差相关的计算公式 单独变化的程度和 共同变化的程度和 YX YX r = YX SNS YYX r = )(-X( N XX S X = 2 )( N YY SY = 2 )( 22 )()( )(-X()(-X( YYXX YYX SNS YYX r YX = = 17 原始观测值计算公式 22 )()( )(-X()(-X( YYXX YYX SNS YYX r YX = = N X XX 2 22 )( )-X( = = N Y Y N X X N YX XY r 2 2 2 2 )()( 18 下面是10名学生身高与体重的测量结果,问身 高与体重的关系如何? 19 解:已知n=1

5、0,利用原始分数计算积差相关的公式得: 答:这10名学生身高与体重的相关系数为0.79 79 . 0 5 . 86 5 . 962 5 . 228 10 485 23609 10 1725 298525 10 4851725 83891 )()( 22 2 2 2 2 = = = = N Y Y N X X N YX XY r 20 积差相关与Z分数 积差相关测量了一个个体在X分布上的位置与在Y 分布上的位置之间的关系。而Z分数提供了一个精确 的方式来表示一个分数在分布中的位置。所以积差相 关的公式可以用Z分数表示: 21 小练习 积差和的值可能小于0吗? 计算下列数据的皮尔逊相关。 )(YY

6、XX XY 29 110 36 08 42 XYX2Y2XY 2948118 110110010 3693618 080640 421648 10353028554 80 . 0 5 35 285 5 10 30 5 3510 54 )()( 222 2 2 2 = = = N Y Y N X X N YX XY r 23 第三节等级相关 24 斯皮尔曼等级相关 英国心理学家Spearman在皮尔逊相关的基础上推导而 来,在定义中把点的坐标换成各自样本的等级。 25 斯皮尔曼等级相关 适用于两列等级性质的变量(既可以是等级变量,也可 以是连续变量赋以等级顺序转换而来)。 对数据整体分布不作要求

7、 适用条件 26 等级相关计算方法 1.给X和Y的值分别排序 2.用积差相关公式计算X和Y的排序,得到斯皮尔曼相关 原始数据 XY 312 410 811 109 133 等级 XY 15 24 33 42 51 27 出现相同等级时的排序方法: 1.将所有的数(包括相同的数)都按顺序排列 2.按顺序为每一个数据排序 3.当两个(或多个)数据相同时,计算这些数据顺序 的平均数,然后将平均数作为最终的顺序分配到每 个数值中 28 29 为了证明所给分数确实可靠,一位英语老师请 一位同事将期末报告进行排名。排名结果和教师 本人所给的成绩如下: 排名成绩 1A 2B 3A 4B 5B 6C 7D 8

8、C 9C 10D 11E 计算这些数据的斯皮尔曼 等级相关。 30 排名成绩等级顺序 最终等级 1A11.5 2B34 3A21.5 4B44 5B54 6C67 7D99.5 8C77 9C87 10D109.5 11E1111 31 斯皮尔曼等级相关特殊公式 当不存在相同等级时,可使用化简公式: ) 1( 6 1 )()( 2 2 2 2 2 2 = = NN D N Y Y N X X N YX XY r - D为二列等级变量的等级差数 32 例:现有10人的视、听两种感觉通道的反应时(单 位:毫秒),数据见下表。问视、听反应时是否具 有一致性? 33 解:已知N=10, D2=48,带

9、入公式,得: 71 . 0 ) 110(10 486 1 ) 1( 6 1 22 2 = = = NN D r 答:这10人的视听反应时的等级相关系数为0.71。 34 肯德尔W(和谐)系数 表示多列等级变量相关程度的一种方法。 适用情况适用情况: K个评价者对N个事物进行等级评定 一个评价者先后K次对N个事物进行等级评定 35 例:有10人对红、橙、黄、绿、青、蓝、紫七种颜色 按照其喜好程度进行等级评价(最喜欢=1,最不喜欢 =7)。这10人对颜色的爱好是否具有一致性? 36 肯德尔W系数计算公式 Ri -每一被评事物K个等级之和, N-被评价事物的数目,即等级数, K-评价者的数目或等级变

10、量的列数。 肯德尔W系数的取值范围:00,11 )( 12 1 )( )( 12 1 32 2 2 32 NNK N R R NNK s W i i = = 37 肯德尔U系数 肯德尔U系数又称一致性系数,适用于对K个评价者的一 致性进行统计分析。它与肯德尔W系数所处理的问题相同, 但所处理的资料的获得方法不同,计算的结果也不一样。 如果有N件事物,由K个评价者对其优劣、大小、高低等 单一维度的属性进行评价,若评价者采用对偶比较的方法对偶比较的方法, (即将N件事物两两配对,然后对每一对中两事物进行比较, 择优选择,优者记1,非优者记0), 则应计算肯德尔U系数。 38 39 肯德尔U系数计算

11、说明 40 第四节其它相关 41 点二列相关(point-biserial correlation ) 点二列相关是考察两列观测值一个为正态连续变 量,一个为“二分”称名变量(男/女;对/错)之间 相关程度的统计方法。 计算公式: 42 点二列相关多用于评价由是非类测验题目组成的测验内部 一致性等问题。 每个题目(二分名义变量)与总分(数值)变量的相关, 称为每个题目的区分度。 相关高说明该题答对答错与总分的一致性高,即区分度高。 点二列相关 43 例:例:有一是非选择测验,共有50题,每题选对得2 分,满分为100分。现有20人的总成绩及对第5题的 选答情况,问第5题区分度如何? 44 解:

12、已知n = 20,第五题答对的10人, 答错的10人, 答对学生的比率: p = 10/20=0.5, 答错学生的比率: q = 10/20=0.5, 答对第五题学生的总分平均成绩: 答错第五题学生的总分平均成绩: 所有学生总成绩的标准差:St= 8.88 代入公式得 : 4 . 88=pX 8 .74=qX 答:第5题与总分相关较高,相关系数为0.766,即第5题的答对答错 与总分有一致性。也可以说该题的区分度较高。 766 . 0 5 . 05 . 0 88 . 8 8 . 74 4 . 88 = = =pq s XX r t qp pb 45 小练习 为了检验一种新的学习方法的效果,心理

13、学家随机地将 一个有8名学生分成两组,每组有4个人。训练后,两组 的测验分数如下: 将数据转化成一个适合点二列相关的形式 计算这些数据的点二列相关 训练未训练 94 77 63 106 46 测验分数 训练情况 91 71 61 101 40 70 30 60 47 解:已知N = 8,训练组4人, 未训练组4人, 训练人数比率:p = 4/8=0.5,未训练人数比率:q = 4/8=0.5, 训练组平均分:未训练组平均分: 所有人分数的标准差:St= 2.179 代入公式得 : 8=pX5=qX 688 . 0 5 . 05 . 0 179 . 2 58 = = =pq s XX r t q

14、p pb 48 二列相关 二列相关适用的资料是两列两列数据均属于正态分布正态分布,其 中一列变量为等距或等比的测量数据,另一列变量为人 为划分为划分的二分变量(例:及格/不及格;高/矮)。 当二分变量为真正的二分变量,或不清楚其分布形态 时,使用点二列相关。 常用于问答题(主观题)的区分度指标。 49 二列相关 计算公式: y pq s XX r t qp b = y:为标准正态分布中p值对应的高度,查正态分布表能得到 50 例例:下表为10名考生一次测验的卷面总分和一道问答题 的得分,试求该问答题的区分度(该问答题满分为10 分, 因此得6分及以上则认为该题通过)。 解:回答题得分被认为划分

15、为通过和不通过两类,应求二列相 关。查正态分布表:当p = 0.60时,y = 0.38667 62 . 0 38667 . 0 40 . 0 60 . 0 12 . 6 25.6133.67 = = = y pq s XX r t qp b 答: 51 系数 当两个变量都是二分变量时,其相关就称为 系数。 适用资料:四格表(计数)资料。 Y1Y2 X1aba+b X2cdc+d a+cb+da+b+c+d )()()(dcdbcaba bcad r + = 52 例:下面是关于吸烟与患癌症之间的一组假设数据。吸 烟状况(X)分为吸烟者与非吸烟者,用0 、1 表示;死亡 原因(Y)分为癌症与其他原因死亡两种,用0 、1表示。 试求它们之间的相关。 X: 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 Y: 0 1 0 0 1 0 0 0 1 1 0 1 1 1 1 0 1 1 1 0 53 解: 将上面的数据整理成下面的四格表: 癌症(0) 其它(1) 吸烟(0)6410 不吸烟(1)3710 91120 从表中可知,a=

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号