心理与教育统计学第5章相关关系

上传人:ji****n 文档编号:58198753 上传时间:2018-10-27 格式:PPT 页数:106 大小:3.22MB
返回 下载 相关 举报
心理与教育统计学第5章相关关系_第1页
第1页 / 共106页
心理与教育统计学第5章相关关系_第2页
第2页 / 共106页
心理与教育统计学第5章相关关系_第3页
第3页 / 共106页
心理与教育统计学第5章相关关系_第4页
第4页 / 共106页
心理与教育统计学第5章相关关系_第5页
第5页 / 共106页
点击查看更多>>
资源描述

《心理与教育统计学第5章相关关系》由会员分享,可在线阅读,更多相关《心理与教育统计学第5章相关关系(106页珍藏版)》请在金锄头文库上搜索。

1、心理与教育统计学,第四章作业,根据所学内容命题: 要求: 题型:选择与计算 提供题目与详细参考答案 重点:方差、标准差及其应用 评分标准:命题数量与质量,涵盖知识点的多少,命题水平。 优秀的命题将会出现在期末考试中,命题组会有额外加分。 交作业时间:4月4日(周五上课),第5章 相关关系,5.1 相关、相关系数与散点图 5.2 积差相关 5.3 等级相关 5.4 质与量相关 5.5 品质相关 5.6 相关系数的选用与解释,有其父必有其子?,皮尔逊测量了1078个父亲及其成年儿子的身高。,相关系数用于描述双变量相互之间的关系。 所谓双变量,是对于一个变量X的每一个观测值X1,X2,Xn,同时有另

2、一个变量Y的相应观测值Y1,Y2,Yn与之对应。 例如,每个人的身高和体重是对应的。,5.1 相关、相关系数与散点图,5.1.1 什么是相关 1. 事物之间的相互关系: (1)因果关系,一种现象是原因,另一种现象是结果。 (2)共变关系,表面有联系的两种事物都与第三种事物有关。 (3)相关关系,两类现象在发展变化的方向与大小方面存在一定的联系,但不是前两种关系。,2. 相关的类别,(1)正相关:两个变量的变化方向相同。例如,你用于学习的时间越多,考试成绩越高。 (2)负相关:两个变量的变化方向相反。例如,你完成考试的时间越少,所犯的错误越多。 (3)零相关:两个变量的变化方向无一定规律。例如,

3、智商与体重的关系。,5.1.2 相关系数,相关系数(coefficient of correlation)用来描述两个变量相关程度的统计指标。 一般样本的相关系数用r表示,总体的相关系数用表示。 (1)相关系数的取值: -1 r +1 (2)相关系数的符号:“”表示正相关,“”表示负相关。 (3)相关系数 r=1表示完全正相关,r=-1表示完全负相关,r=0表示完全独立,零相关或无相关。,(4)相关系数取值的大小表示相关强弱程度。绝对值0r1,绝对值接近1一般为相关程度密切,接近0值端一般为关系不够密切。 注意: 相关分析受样本影响,小样本的相关系数不稳定。 相关系数不是由相等单位度量而来的,

4、因此只能比较大小,不能做任何加、减、乘、除运算。,5.1.3 散点图,在平面直角坐标系中,以X 、Y两列变量(如X变量)为横坐标,以另一列变量为纵坐标,把每对数据Xi、Yi当作同一平面上的N个点(Xi,Yi),一一描绘在XOY坐标系中,产生的图形即为散点图。,正相关,负相关,散点的分布形状为椭圆形,可认为两变量之间具有线性关系。,完全负相关,完全正相关,当所有的点都分布在一条直线上时,两变量之间的关系为完全相关。,零相关,散点的分布没有明显集中在某一方向的趋势,形成圆形区域时,两变量之间的关系为零相关。,散点图告诉了我们什么?,5.2 积差相关,5.2.1 积差相关及其适用条件 积差相关是英国

5、统计学家皮尔逊于20世纪初提出的一种计算相关的方法,因而被称为皮尔逊积差相关,也称为积矩相关(product moment correlation)。,积差相关适用于:,成对的数据; 样本容量要大,不宜少于30对。 两列变量各自总体为正态分布; 一般情况下,正常人群的身高、体重、智力水平、心理与教育测验的结果,都可按总体正态分布对待;如果要求比较高,则需要对数据进行正态性检验。,两列变量均为连续变量; 根据得到数据的方式判断,测量数据。 两列变量之间的关系应是线性关系。 可先绘制两列变量的散点图,根据散点图可判断两个变量之间是否线性关系。,5.2.2 协方差,协方差(covariance)是两

6、个变量离均差乘积的平均数。协方差越大,表示X、Y两列变量的线性关系越强。 用符号COV表示。,x、y两个变量的离均差,为什么协方差表示一致性程度?,哪个图中,XY的一致性程度高?,X,Y,Xmin,Xmax,Ymax,Ymin,X,Y,表示该点与平均数构成的矩形的面积,X,Y,表示将所有点与平均数构成的矩形的面积加起来,+,-,+,-,+,+,-,-,+,+,-,-,X,Y,+,-,+,-,+,+,-,-,+,+,-,-,的值越大,一致性程度越大。,5.2.3 积差相关系数基本公式,协方差的值会随着XY的单位的不同而变化,是一个很不稳定的量。为了克服协方差的缺点,除以两变量的标准差sX.sY,

7、得到了积差相关系数:,(5.2),x、y两个变量的离均差,两个变量的标准差,表5-1 31人的视听反应时(单位:毫秒),先计算变量 X 和 Y 的标准差:,再将数据代入公式计算积差相关系数:,5.2.4 标准分数计算积差相关系数,(5.3),ZX为X变量的标准分; ZY为Y变量的标准分。,5.2.5 原始数据计算积差相关系数,由标准差公式:,(5.4a),所以:,或者:,(5.4b),下面运用该公式计算相关系数:,谢谢!,复习,协方差:,相关系数:,相关系数的合成。,5.3 等级相关,在心理与教育领域研究中,有时搜集到的数据不是等距或等比的测量数据,而是具有等级顺序的测量数据。 搜集到的数据是

8、等距或者等比的数据,但其总体分布不是正态。,5.3.1 斯皮尔曼等级相关,斯皮尔曼等级相关是等级相关的一种。它适用于两列等级变量性质的线性关系的资料,用于称名数据和顺序数据的相关问题。 其相关系数常用rR或rS表示 不要求总体呈正态分布,不要求样本的容量必须大于30。 当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等级相关系数。 缺点:精确度要差于积差相关。,N为等级个数; D指二列成对变量的等级差数; Rx与Ry为两列变量各自排列的等级次数。,1. 等级差数法:,2. 等级序数法:,计算方法,(5.5a),(5.5b),假设有两列变量不服从正态分布,其中第一列变量

9、为:X1、X2、X3Xn,其等级序数为:RX1、RX2、RX3RXn; 第二列变量为:Y1、Y2、Y3Yn,其等级序数为: RX1、RX2、RX3RXn。,等级差数法:,等级序数法:,见P114公式5-3a,10个高三学生学习潜在能力测验(X)与自学能力测验(Y)成绩,3. 有相同等级时计算等级相关的方法,如果有相同等级时,可用它们所占等级位置的平均数作为它们的等级。,随着相同等级数据的增多, 有规律的减少,但与相同等级的位置无关。,假设1、2、3n个等级相等,新的等级:,不同等级:,相同等级:,没有相同等级情况下:,有相同等级情况下:,由于,同理:,P118公式5-4b,下表是10名学生的数

10、学和语文考试成绩,问数学和语文成绩是否相关?,解:,5.3.2 肯德尔等级相关,(一)肯德尔W系数 肯德尔W系数,又称为肯德尔和谐系数,是表示多列等级变量相关程度的一种方法,适用于两列以上的等级变量。 计算肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试(或称为评价者)对N件事物或N种作品进行等级评定,每个评价者都能对N件事物(或作品)的好坏、优劣、喜好、大小、高低等排出一个等级顺序。 常用W表示。,例:有10人对红、橙、黄、绿、青、蓝、紫七种颜色按照其喜好程度进行等级评价。其中,最喜欢的等级为1,最不喜欢的等级为7。问这10人对颜色的爱好是否具有一致性?,W系数是每一评价对

11、象实际得到的等级总和的变异与被评价对象一致性程度最大时等级总和的变异的比值。,一致性程度最高的情况:,求实际等级总和的方差:,P88公式4-9:,求一致性程度最大时等级总和的方差:,W系数:,肯德尔 W系数:,将,代入上式,可得:,(5.6a),(5.6b),例:有10人对红、橙、黄、绿、青、蓝、紫七种颜色按照其喜好程度进行等级评价。其中,最喜欢的等级为1,最不喜欢的等级为7。问这10人对颜色的爱好是否具有一致性?,解:,有相同等级出现时W的计算,(5.6c),五位评分者对七篇作文进行了评价,评价等级为1-5,评价结果如下,试问评分者之间对标准的掌握是否一致?,解:,复习,斯皮尔曼等级相关 两

12、列等级数据,不限总体分布,不限样本数量,基本公式:,有等级相同:,肯德尔W系数 多列等级数据相关,等级评定法,评分者信度,基本公式:,有等级相同:,取值范围:,(二)肯德尔U系数,肯德尔U系数又称一致性系数,适用于对K个评价者的一致性进行统计分析。 它与肯德尔W系数所处理的问题相同,但所处理的资料的获得方法不同,计算结果也不同。 如果有N件事物,由K个评价者,将N件事物两两配对,形成了N(N-1)/2对,然后对每一对中两事物进行比较,优者记1,非优者记0。,10个评价者对7种颜色对偶选择结果,K为奇数,K为偶数,(5.7),取值范围:,10个评价者对7种颜色对偶选择结果,解:已知N=7,K=1

13、0,对角线以下的择优分数分析:,5.4 质与量的相关,实际研究中常会遇到这种情形:需要计算相关的两列变量一列为等比或等距的测量数据,另一列是按性质划分的类别,欲求这样两列变量的直线关系,称为质量相关,5.4.1 点二列相关,适用条件 一个变量为正态、连续变量,另一个变量为真正的二分变量,这两个变量之间的相关,称为点二列相关。 可用于评价由是非类测验题目组成的测验的内部一致性等问题。 有时一个变量并非真正的二分变量,而是双峰分布的变量,也可以用点二列相关来表示。例如,按识字量划分文盲和非文盲,点二列相关公式:,是与二分名义变量的一个值对应的连续变量的平均数; 是与二分名义变量的另一个值对应的连续

14、变量的平均数; p 和q分别是二分名义变量的两个值各自所占的比例,p+q=1; st 是连续变量的标准差.,(5.8),设变量X为连续变量,其样本值为X1、X2、X3XN,N为样本容量;变量Y为二分变量,其取值分别用1与0来表示,取1的比率为p,取0的比率为q,则:,相关系数:,有一是非选择测验,每题选对得2分,共50题,满分100分。下表为20名学生在该测验中的总成绩及第5题的选答情况。请问这道题与测验总分的相关程度如何?,设p为答对第五题的学生的比率; q为答错第五题学生的比率。,5.4.2 二列相关,二列相关的适用资料是两列数据均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变

15、量为人为划分的二分变量。 例如测验成绩,人为划分为及格与不及格。,(5.9a),(5.9b),公式中,y为标准正态分布曲线中与p值对应的纵线高度 其余符号与点二列相关计算公式中含义相同,二列相关公式:,补充知识:已知概率P如何求概率密度Y,P概率,Y概率密度,Z分数,例 下表是10名学生在一次测验中总分和一道问答题的得分。该题回答是否合格与卷面总分的关系如何?(该问答题满分为10分,规定达到6分为合格),10名学生某题得分与卷面总分,计算: sX6.12,p0.6, q0.4,查正态分布表P449,当 p0.60时,Y0.38667,复习,点二列相关 一列变量为正态连续变量,另一列变量为真正的

16、二分变量。,二列相关 两列变量均为正态连续数据,但其中一列变量被人为划分为二分变量。,5.4.3 多列相关,多列相关适合处理两列正态变量资料,其中一列为等距或等比的测量数据,另一列被人为划分为多种类别,称为名义变量。例如,学习成绩被人为划分为优、良、中、差四类。,优,良,中,差,多列相关计算公式:,为每系列的次数比率; 为每一名义变量下限的正态曲线高度 为每一名义变量上限的正态曲线高度,(5.10),例 下表是10名学生在一次测验总分和老师评价等级。该测验与老师评价之间的关系如何?,10名学生某题得分与卷面总分,评价等级: D C B A 合计,比率: 0.2 0.3 0.4 0.1,累加比率: 0.2 0.5 0.9 1,y: 0.348 0.399 0.176 0,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号