相关系数讲解课件

上传人:桔**** 文档编号:574383509 上传时间:2024-08-16 格式:PPT 页数:56 大小:1.09MB
返回 下载 相关 举报
相关系数讲解课件_第1页
第1页 / 共56页
相关系数讲解课件_第2页
第2页 / 共56页
相关系数讲解课件_第3页
第3页 / 共56页
相关系数讲解课件_第4页
第4页 / 共56页
相关系数讲解课件_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《相关系数讲解课件》由会员分享,可在线阅读,更多相关《相关系数讲解课件(56页珍藏版)》请在金锄头文库上搜索。

1、第五章第五章 相关系数相关系数李金德李金德第1页,共56页。n第一节第一节 相关系数与散点图相关系数与散点图n第二节第二节 积差相关积差相关n第三节第三节 等级相关等级相关n第四节第四节 质与量相关质与量相关n第五节第五节 品质相关品质相关n第六节第六节 相关系数的选用与解释相关系数的选用与解释第2页,共56页。第一节第一节 相关系数与散点图相关系数与散点图n一、什么是相关?一、什么是相关?n(一)事物可能存在的关系(一)事物可能存在的关系n1.因果关系因果关系nA是引起是引起B的原因,的原因,B是是A导致的结果。导致的结果。n如:扁桃体发炎导致喉咙十分难受。如:扁桃体发炎导致喉咙十分难受。n

2、又如又如:努力学习让学习成绩得到了提高。努力学习让学习成绩得到了提高。AB第3页,共56页。n2.共变关系共变关系n表面看似有关系的两个事物,实际上是因为两者都与表面看似有关系的两个事物,实际上是因为两者都与第三个事物有关的缘故。第三个事物有关的缘故。n如:医疗设备越好居民患病率越高。如:医疗设备越好居民患病率越高。n又如:研究发现携带火柴的数量与肺癌患病率正相关。又如:研究发现携带火柴的数量与肺癌患病率正相关。ABC第4页,共56页。n3相关关系相关关系nA与与B在发展变化的方向与大小方面存在一定关系。在发展变化的方向与大小方面存在一定关系。n相关关系不同于因果关系,不能确定两者谁是因果;相

3、关关系不同于因果关系,不能确定两者谁是因果;也有理由认为这两者不同时受第三个因素的影响,即也有理由认为这两者不同时受第三个因素的影响,即不存在共变关系。不存在共变关系。n但是,相关关系比较复杂,研究中研究者常常把相关但是,相关关系比较复杂,研究中研究者常常把相关作为因果和共变关系的研究前奏。作为因果和共变关系的研究前奏。第5页,共56页。n(二)相关的类别(二)相关的类别n1.从方向上来判断从方向上来判断n正相关正相关变化方向一致,变化方向一致,“同增共减同增共减” n负相关负相关变化方向相反,变化方向相反,“此增彼减此增彼减”n零相关零相关变化没有趋势趋势变化没有趋势趋势第6页,共56页。n

4、2.从形状上看从形状上看n直线相关直线相关n曲线相关曲线相关第7页,共56页。n3.从相关程度上看从相关程度上看n完全相关:完全相关:A和和B变化完全对应。表现为坐标上的一变化完全对应。表现为坐标上的一条直线。条直线。n强相关:强相关:A变化时变化时,B增大(或减少)的可能性非常大。增大(或减少)的可能性非常大。表现为散点图较为集中在某条直线的周围。表现为散点图较为集中在某条直线的周围。n弱相关:弱相关:A变化时变化时,B增大(或减少)的可能性较少。增大(或减少)的可能性较少。表现为散点图较为分散的集中在某条直线的周围。表现为散点图较为分散的集中在某条直线的周围。n零相关:零相关:A变化时变化

5、时,B或增大或减少,好无规律。或增大或减少,好无规律。第8页,共56页。二、相关系数二、相关系数n概念概念:相关系数是变量之间相关程度的指标。计算相:相关系数是变量之间相关程度的指标。计算相关系数一般需大样本。关系数一般需大样本。n符号符号:样本相关系数:样本相关系数r,总体相关系数,总体相关系数 n取值取值:-11。n性质性质:顺序数据。:顺序数据。第9页,共56页。三、散点图三、散点图XY0完全正相关完全正相关XY0高正相关高正相关XY0零相关零相关第10页,共56页。XY0完全负相关完全负相关XY0高负相关高负相关XY0零相关零相关第11页,共56页。第二节第二节 积差相关积差相关n一、

6、概念及适用范围一、概念及适用范围n积差相关,是计算两个变量线性相关的一种方法,由积差相关,是计算两个变量线性相关的一种方法,由英国统计学家皮尔逊提出,因此也称为皮尔逊英国统计学家皮尔逊提出,因此也称为皮尔逊(Pearson)相关。相关。n 适用范围:适用范围:数据成对数据成对n 两变量总体正态分布或接近正态分布两变量总体正态分布或接近正态分布n 两变量是连续变量两变量是连续变量n 两变量为线性关系两变量为线性关系第12页,共56页。二、计算公式二、计算公式n1.运用标准差与离均差的计算公式运用标准差与离均差的计算公式第13页,共56页。二、计算公式二、计算公式n2.运用标准分数计算积差相关运用

7、标准分数计算积差相关第14页,共56页。二、计算公式二、计算公式n3.运用原始数据计算积差相关运用原始数据计算积差相关第15页,共56页。例题例题5-1 试问身高与体重有无关系试问身高与体重有无关系第 1栏 第2栏 第3栏 第4 栏 第5栏 第 6栏 实测记分 离差记分 积差 标准记分 标准积差 身高 体重 Xd Yd YXdd XZ YZ YXZZ 编号 XXX - YY - ()()YYXX- XXSd YYSd YYXXSdSd 1 170 72 0 3 0 0 1.5 0.00 2 165 69 -5 0 0 -0.41 0 0.00 3 150 66 -20 -3 60 1.63 -

8、1.5 2.44 4 180 70 10 1 10 0.82 0.5 0.41 5 185 68 15 -1 -15 1.22 -0.5 -0.61 850 345 0 0 55 2.24 Y第16页,共56页。n解:采用标准分数计算积差相关解:采用标准分数计算积差相关n(1)先求标准分数)先求标准分数第17页,共56页。n(2)求两变量的积差)求两变量的积差n(3)再求两变量标准分数的成绩)再求两变量标准分数的成绩 ,对其求和:,对其求和:n(4)带入公式:)带入公式:第18页,共56页。课堂练习:用原始数据计算积差相关课堂练习:用原始数据计算积差相关编号身高X体重YX2Y2XY117050

9、28900250085002173452992920257785316047256002209752041554424025193668205173502992925008650求和8312361383831117039275第19页,共56页。三、相关系数的合并三、相关系数的合并n合并的步骤:合并的步骤:n1.rZ,即先将各样本的相关系数,即先将各样本的相关系数r转化为转化为Fisher Z分分数(查附表数(查附表8););n2.求平均的求平均的Z分数:分数: ,其中,其中n为每个样本为每个样本的容量;的容量;n3.Zr,即用附表,即用附表8再将平均的再将平均的Z分数转化为平均的相分数转化为

10、平均的相关系数。关系数。第20页,共56页。第二节第二节 等级相关等级相关n一、等级相关的意义一、等级相关的意义n等级相关是根据等级资料来研究变量之间相互关系的等级相关是根据等级资料来研究变量之间相互关系的方法。方法。n数据来源:一是等级评定的资料,二是等距或比率资数据来源:一是等级评定的资料,二是等距或比率资料转化而成的等级评定资料。料转化而成的等级评定资料。n优点:使用范围较积差相关更广优点:使用范围较积差相关更广n缺点:没有积差相关精确缺点:没有积差相关精确第21页,共56页。二、斯皮尔曼等级相关二、斯皮尔曼等级相关n(一)斯皮尔曼等级相关(一)斯皮尔曼等级相关nSpearmans ra

11、nk correlation。符号:符号:rR ,rS.n斯皮尔曼等级相关是根据两列变量的斯皮尔曼等级相关是根据两列变量的成对等级差数成对等级差数计计算相关系数,又叫算相关系数,又叫“等级差数法等级差数法”。n条件:成对;线性相关;无正态假设;无大样本限定条件:成对;线性相关;无正态假设;无大样本限定n结论:比皮尔逊积差相关应用范围广。结论:比皮尔逊积差相关应用范围广。第22页,共56页。(二)计算公式(二)计算公式n1.无相同等级时无相同等级时n(1)利用等级差值计算)利用等级差值计算第23页,共56页。n(2)直接运用等级计算)直接运用等级计算第24页,共56页。例题例题5-2n现有现有1

12、0人的视、听两种感觉道的反应时(单位:毫秒)人的视、听两种感觉道的反应时(单位:毫秒),数据见下表。问视、听反应时是否具有一致性?,数据见下表。问视、听反应时是否具有一致性?第25页,共56页。听反应时听反应时 视反应时视反应时 被试被试 X X Y Y RX RY RRYXD- -= = D2 RXRY 1 1 172172 179179 7 7 5 5 2 2 4 4 3535 2 2 140140 162162 2 2 2 2 0 0 0 0 4 4 3 3 152152 153153 5 5 1 1 4 4 1616 5 5 4 4 187187 189189 8 8 8 8 0 0

13、0 0 6464 5 5 139139 181181 1 1 6 6 - -5 5 2525 6 6 6 6 195195 220220 9 9 1010 - -1 1 1 1 9090 7 7 212212 210210 1010 9 9 1 1 1 1 9090 8 8 164164 182182 6 6 7 7 - -1 1 1 1 4242 9 9 149149 178178 4 4 4 4 0 0 0 0 1616 1010 146146 170170 3 3 3 3 0 0 0 0 9 9 5555 5555 4848 361361 第26页,共56页。第27页,共56页。n2.有

14、相同等级的计算公式有相同等级的计算公式第28页,共56页。例例5-3:n表表5-9是是10名学生的数学和语文考试成绩,问数学和名学生的数学和语文考试成绩,问数学和语文成绩是否相关?语文成绩是否相关?第29页,共56页。语文语文 数学数学 学生学生 X X Y Y RX RY RRYXD- -= = D2 1 1 5959 4747 4.54.5 6 6 - -1.51.5 2.252.25 2 2 3535 4040 1010 1010 0 0 0 0 3 3 5959 4242 4.54.5 8 8 - -3.53.5 12.2512.25 4 4 5757 5555 6 6 3.53.5

15、2.52.5 6.256.25 5 5 5050 4949 7 7 5 5 2 2 4 4 6 6 7171 6363 1 1 1 1 0 0 0 0 7 7 6262 5555 3 3 3.53.5 - -0.50.5 0.250.25 8 8 4747 4242 8 8 8 8 0 0 0 0 9 9 4343 4242 9 9 8 8 1 1 1 1 1010 6868 5757 2 2 2 2 0 0 0 0 N=10N=10 = = 262D 第30页,共56页。n解:第31页,共56页。三、肯德尔和谐系数三、肯德尔和谐系数n1.肯德尔肯德尔W系数又称和谐系数,是表示多列等级变量系数

16、又称和谐系数,是表示多列等级变量相关程度的一种方法。相关程度的一种方法。n2.适用范围:(适用范围:(1)采用等级评定的方法收集等级数)采用等级评定的方法收集等级数据,即让据,即让K个评委(被试)评定个评委(被试)评定N件事物,或件事物,或1个评委个评委(被试)先后(被试)先后K次评定次评定N件事物。件事物。n (2)每个评价者对)每个评价者对N件事物排出一个等件事物排出一个等级顺序,最小的等级序数为级顺序,最小的等级序数为1 ,最大的为,最大的为N,若并列,若并列等级时,则平分共同应该占据的等级。等级时,则平分共同应该占据的等级。第32页,共56页。n3.计算公式计算公式n无相同等级无相同等

17、级第33页,共56页。例例5-4n有有10人对红、橙、黄、绿、蓝、紫七种颜色按照其喜人对红、橙、黄、绿、蓝、紫七种颜色按照其喜欢程度进行等级评定。其中,最喜欢的等级为欢程度进行等级评定。其中,最喜欢的等级为1,最,最不喜欢的等级为不喜欢的等级为7。结果见表。结果见表5-10。问这。问这10人对颜色人对颜色的爱好是否具有一致性?的爱好是否具有一致性?第34页,共56页。表表5-10第35页,共56页。第36页,共56页。n(2)有相同等级)有相同等级第37页,共56页。例例5-7:n五位评分者对七篇作文进行评价,评价等级为五位评分者对七篇作文进行评价,评价等级为15,评价结果见表评价结果见表5-

18、12,试问评分者之间对标准的掌握是,试问评分者之间对标准的掌握是否一致?否一致?第38页,共56页。表表5-12N=7N=7 评价者评价者 K=5 K=5 被评作文被评作文 1 1 2 2 3 3 4 4 5 5 Ri Ri2 A A 4 4 5 5 3.53.5 5 5 4 4 21.521.5 462.25462.25 B B 1 1 1 1 1.51.5 2 2 1 1 6.56.5 42.2542.25 C C 2.52.5 2 2 1.51.5 2 2 2 2 1010 100100 D D 6 6 5 5 5 5 4 4 5 5 2525 625625 E E 2.52.5 3 3

19、 3 3.5.5 2 2 3 3 1414 196196 F F 5 5 5 5 7 7 6 6 6 6 2929 841841 G G 7 7 7 7 6 6 7 7 7 7 3434 11561156 合计合计 140140 3422.53422.5 第39页,共56页。第40页,共56页。第四节第四节 质与量的相关质与量的相关n一、点二列相关一、点二列相关n(一)定义(一)定义n 研究一列等距或比率变量与一列研究一列等距或比率变量与一列“二分二分”名称变名称变量之间相关的统计方法称做点二列相关。量之间相关的统计方法称做点二列相关。 符号:符号: rpb 。n(二)适用范围(二)适用范围n

20、 1.一列数据一列数据等距或等比,总体服从正态分布;等距或等比,总体服从正态分布;n 2.另一列变量另一列变量按事物的性质划分为两类的变量;按事物的性质划分为两类的变量;n 3.多用于测验中评价题目的区分度。多用于测验中评价题目的区分度。第41页,共56页。n(三)计算公式(三)计算公式np,q是二分变量各所占的比例,是二分变量各所占的比例,nSt是连续变量的标准差,是连续变量的标准差, n 是二分变量对应连续变量相应部分的平均数,是二分变量对应连续变量相应部分的平均数,nXt是连续变量的平均数。是连续变量的平均数。第42页,共56页。例例5-6n有一是非式选择测验题,每题选对得有一是非式选择

21、测验题,每题选对得2分,共有分,共有50题,题,满分满分100分。表分。表5-14是是20名学生在该测验中的总成绩名学生在该测验中的总成绩及第及第5题的选答情况。问这道题与测验总分的相关程题的选答情况。问这道题与测验总分的相关程度如何?度如何?第43页,共56页。表表5-14学生学生 总分总分 第五题第五题 学生学生 总分总分 第五题第五题 1 1 8484 对对 1111 7878 对对 2 2 8282 错错 1212 8080 错错 3 3 7676 错错 1313 9292 对对 4 4 6060 错错 1414 9494 对对 5 5 7272 错错 1515 9696 对对 6 6

22、 7474 错错 1616 8888 对对 7 7 7676 错错 1717 9090 对对 8 8 8484 对对 1818 7878 错错 9 9 8888 对对 1919 7676 错错 1010 9090 对对 2020 7474 错错 第44页,共56页。第45页,共56页。二、二列相关二、二列相关n(一)定义(一)定义n 二列相关系数是研究一列正态的比率或等距变二列相关系数是研究一列正态的比率或等距变量和一列人为量和一列人为“二分二分”名称变量之间相互关系的统计名称变量之间相互关系的统计方法。符号:方法。符号:rb。n(二)适用范围(二)适用范围n 两个变量都是等距或等比数据,服从

23、正态分布,两个变量都是等距或等比数据,服从正态分布,其中一列被人为地划分为两类。其中一列被人为地划分为两类。n 在测量中用于测验效度和试题区分度的分析。在测量中用于测验效度和试题区分度的分析。第46页,共56页。n(三)计算公式(三)计算公式nY为标准正态曲线中为标准正态曲线中p值对应的高度。值对应的高度。第47页,共56页。第五节第五节 品质相关品质相关n一、四分相关一、四分相关n(一)适用条件(一)适用条件n四格表的二因素都是连续的正态变量,只是人为地将其四格表的二因素都是连续的正态变量,只是人为地将其按一定标准划分为两个不同的类别。按一定标准划分为两个不同的类别。n(二)计算公式(二)计

24、算公式第48页,共56页。例例5-8n下表所列的数据是调查下表所列的数据是调查377名学生两科测验成绩所得到的结果,名学生两科测验成绩所得到的结果,假设两科成绩的分布为正态,只是人为地将其按一定标准划分假设两科成绩的分布为正态,只是人为地将其按一定标准划分为及格、不及格两类。为及格、不及格两类。及格不及格及格a(124)b(68)不及格c(85)d(100)地地理理成成绩绩历史成绩历史成绩第49页,共56页。n解:已知解:已知a=124,b=68,c=85,d=100,a+b+c+d=377n将上面的结果代入公式得:将上面的结果代入公式得:第50页,共56页。二、二、相关相关n(一)适用资料(

25、一)适用资料n 相关的适用资料是除四分相关之外的四格表资料,是表示两二相关的适用资料是除四分相关之外的四格表资料,是表示两二分变量相关程度最常用的一种相关系数。分变量相关程度最常用的一种相关系数。n(二)计算公式(二)计算公式第51页,共56页。例例5-9:n有研究者调查了有研究者调查了358名不同性别的学生对某项教育措名不同性别的学生对某项教育措施的评价态度,结果如下表。根据这些结果能否说性施的评价态度,结果如下表。根据这些结果能否说性别与评价态度有关?相关的程度如何?别与评价态度有关?相关的程度如何?拥护反对男66106女28158性性别别评价态度评价态度第52页,共56页。第53页,共5

26、6页。三、列联相关三、列联相关n(一)适用资料(一)适用资料n 属于属于RC列联表的资料,要分析所研究的二因素之间的列联表的资料,要分析所研究的二因素之间的相关程度,就要用列联相关。相关程度,就要用列联相关。n (二)计算公式(二)计算公式第54页,共56页。第六节第六节 相关系数的选用与解释相关系数的选用与解释一、如何选择合适的相关系数一、如何选择合适的相关系数1.考虑每种测量所产生的数据属于什么类型考虑每种测量所产生的数据属于什么类型2.要对第一种测量数据和第二种测量数据的类型依次做要对第一种测量数据和第二种测量数据的类型依次做出判断出判断3.确定采用哪种相关系数确定采用哪种相关系数第55页,共56页。二、相关系数值的解释二、相关系数值的解释 相关系数是一个指标值,它表示两个变量之间的关系相关系数是一个指标值,它表示两个变量之间的关系程度。是顺序型数据。程度。是顺序型数据。 相关系数即使很高,也不能断定两个变量之间有因果相关系数即使很高,也不能断定两个变量之间有因果关。关。三、相关系数的特殊用途三、相关系数的特殊用途 可以用于确定测验的信度系数和效度系数,用于对测可以用于确定测验的信度系数和效度系数,用于对测验的项目区分度进行分析。验的项目区分度进行分析。第56页,共56页。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号