《统计中的相关分析》ppt课件

上传人:tian****1990 文档编号:74419799 上传时间:2019-01-28 格式:PPT 页数:41 大小:792.31KB
返回 下载 相关 举报
《统计中的相关分析》ppt课件_第1页
第1页 / 共41页
《统计中的相关分析》ppt课件_第2页
第2页 / 共41页
《统计中的相关分析》ppt课件_第3页
第3页 / 共41页
《统计中的相关分析》ppt课件_第4页
第4页 / 共41页
《统计中的相关分析》ppt课件_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《《统计中的相关分析》ppt课件》由会员分享,可在线阅读,更多相关《《统计中的相关分析》ppt课件(41页珍藏版)》请在金锄头文库上搜索。

1、第三章 相关分析,理解相关是描述两个变量之间关系的量数; 掌握相关的种类; 掌握各种相关系数的计算、适用条件; 掌握相关在教学实践中的运用; 掌握对相关系数的解释。,3.1 什么是相关?,1、什么是相关? 事物间的关系有三种: (1)因果关系:一种现象是另一种现象的因,而另一种现象则是果。 (2)共变关系:两事物本身之间没有直接的关系,但它们都受第三种现象的影响而发生变化。 (3)相关关系:两类现象在发展变化的方向与大小方面存在一定关系,但不能确定两者中哪个是因,哪个是果。,3.1 什么是相关,相关(统计学意义):指具有相关关系的不同现象之间的关系程度。 相关分分类,按性质: (1)正相关:两

2、列变量变动方向相同。同时增大,同时减少。如身高与体重的关系。 (2)负相关:两列变量变动方向相反。一个增大,另一个却减少;反之亦然。如年龄越大,走路速度越慢。 (3)零相关:两列变量之间无关系。如学习成绩与身高的关系。,3.1 什么是相关,相关的分类,相关分类,按程度: 强相关 若相关 完全相关 相关分分类,按趋势: 线性相关 曲线相关,2、相关系数,相关系数是两列变量相关程度的数字表现形式。样本相关系数用r表示;总体相关系数用表示。 ,r-1.00,1.00 (1)完全相关:-1.00或1.00,说明两个变量之间为确定关系; (2)不完全相关:| ,r |1; (3)不相关:当相关系数在0附

3、近时,说明两个变量之间毫无关系。 正相关时,相关系数为正,取值在01之间;负相关时,相关系数为负,取值在-10之间。,3.1 什么是相关,相关意义的理解,1.相关的意义要看判定系数R2。 2.相关系数0.3以下,为低相关,有理论意义而无实际意义。 3.相关系数0.4- 0.6,为中等相关,既有有理论意义,也有实际意义。 4.相关系数0.7以上,为高相关, 理论意义与 实际意义都很大。,(a)完全正相关,(b)完全负相关,(c)无相关关系,(d)非线性关系,(e)正相关,(f)负相关,散点图的绘制,计算相关系数时应注意的问题:,(1)相关系数易受样本容量n的影响。如果n很小,可能完全没有相关的两

4、事物,却计算出较大的相关系数。样本容量要求。以n=30为宜。 (2)相关系数不能直接进行四则运算。 (3)存在相关关系不一定存在因果关系。 (4)计算相关系数要求成对数据。若干个个体中每个个体要有两种不同的观测值。如每个学生的智力分数和学习成绩。任意两个个体之间的观测值不能求相关。 (5)没有线性相关,不一定没有关系,可能是非线性的。,3.2 积差相关,相关系数的合并,相关系数的合并意义:来自同一总体的多个样本的相关系数的合成。 步骤:P138,例3.2 (1)将各样本的r 转换成费舍Z分数,见附表8。 (2)求每一样本的Z分数之和 (3)求平均Z分数,2、计算积差相关系数的公式:,3.2 积

5、差相关,3.2 积差相关,积差相关,也称积矩相关、皮尔逊相关(Pearson,英国统计学家),是求直线相关的基本方法。 积差相关适用条件: (1)两列数据都是测量的数据(数值型变量),即要求是连续变量; (2)成对数据,且n30。 (3)双变量正态(可对较大样本分别做正态性检验)。要求总体为正态,但对样本不要求一定为正态。 (4)两列变量之间的关系应是线性的,如果是非线性的,则不能计算线性相关。,3.2 积差相关,例3.1 计算身高与体重的相关系数。,3.2 积差相关,3.2 积差相关,3.3 等级相关,顺序量表的数据或等距、等比数据而总体非正态,不能计算积差相关的条件下,可以计算等级相关。

6、优点:对总体没有特别要求,是非参数的相关方法,适用面广。 缺点:与积差相关相比,精度稍差。,3.3. 等级相关,等级相关,请注意: 尽可能不出现相同等级,即不能并列排名,否则误差大,1、定义公式:,(一)斯皮尔曼等级相关 斯皮尔曼等级相关是等级相关的一种,适用于只有两列变量,而且是属于等级变量性质具有线性关系的资料。 其中:N 成对数; D=Rx-Ry 对偶等级之差,一家广告代理商想了解一家公司产品质量等级是否与其商场份额等级有关。小规模的实验研究,获得该行业12家公司的质量等级。,例,3.3. 等级相关,公司的质量形象与其市场份额等级成正相关。,3.3. 等级相关,有相同等级的等级相关系数,

7、3.3. 等级相关,(1)是计算多个等级变量相关程度的一种相关量,既可是k个评分者评(N)个对象,也可以是同一个人先后k次评N个对象。 (2)公式:,Ri为每一被评事物k个等级之和, n为被评价事物的数目,即等级数, k为评价者的数目或等级变量的列数。,肯德尔(Kendall)和谐系数(W),3.3. 等级相关,有10人对七件广告作品进行等级评价,结果如下表,问这10人的评价是否具有一致性?,所以,10人对7个作品的评价具有较高的一致性。排名为(从小到大):4、6、1、5、3、7、2。,例3.3,3.3. 等级相关,肯德尔W系数的性质,若k个评价者的评价完全一致,W=1; 若完全没有相关,W=

8、0; 若k个评价者的评价完全相反,W=-1; 若k个评价者的评价存在一定关系,但又不完全一致,则0 W 1 一般来说,W0,1,没有负值。 原理:和谐系数W =最大可能的方差/实际等级和方差。,肯德尔(Kendall)U系数,肯德尔U系数又称一致性系数。 处理的数据同肯德尔W系数,但数据获得的方法不同。 1、适用的资料: 由K个评价者采用对偶比较方法对其优劣、大小、高低等单一维度的属性进行评价得到的数据。 具体方法为:将N件事物两两配对比较,优者为1,非优为0,难以判定为0.5。,3.3. 等级相关,10个评价者对7种颜色对偶评价,其中一个评价者的评价为:,例如:,3.3. 等级相关,整理得到

9、10个评价者对7种颜色对偶评价的结果为:,3.3. 等级相关,肯德尔U系数的计算公式,N被评价事物的数目,即等级数 K评价者数目 rij对偶比较记录中ij(ij)格子中择优分数,3.3. 等级相关,质与量相关,质与量相关指一列变量为数值型数据,另一列变量为类别变量,求两列变量的直线相关,称为质与量相关。 包括: 点二列相关 二列相关 多系列相关。,1、点二列相关,(1)适用资料 两列变量中一列为等距或等比的测量数据而且总体分布为正态,另一列变量为类别(名义)变量,分为两类。 点二列相关多用于编制是非测验题评价测验内部一致性等问题。每个题目(二分名义变量)与总分(数值)变量的相关,称为每个题目的

10、区分度。,(2)计算公式,3.4 质与量相关,例: 有一是非选择测验,共有50题,每题选对得2分,满分为100分。现有20人的总成绩及对第5题的选答情况,问第5题与总分的相关程度如何?,1、点二列相关,3.4 质与量相关,例3.4,3.4 质与量相关,n=20,Xt=81.6, St=8.66, 答对人数10,答错人数10,p=答对学生的比率=10/20=0.5, q=1-p=0.5, Xp=88.4, Xq=74.8,第5题与总分相关较高,相关系数为0.785,即第5题的答对答错与总分有一致性。也可以说该题的区分度较高。,3.4 质与量相关,(1)适用资料 适用于两列变量都为正态等距变量,但

11、其中一列变量被人为地划分成两类。 二列相关与点二列相关的主要区别在于二分变量是否正态。 (2)计算公式,2、二列相关,3.4 质与量相关,(3)下表为10名考生一次测验的卷面总分和一道回答题的得分,试求该问答题的区分度(该回答题满分为10分,因此得6分以上则认为该题通过)。,例3.5,3.4 质与量相关,解:回答题得分被认为划分为通过和不通过两类,应求二列相关。查正态分布表:当p=0.60时y=0.3866,,3.4 质与量相关,偏相关(Partial Correlation),多要素系统中,一个要素的变化要影响到其它要素的变化,因此它们之间存在着不同的相关关系。 消除其它要素影响后两个要素之

12、间的相关,称为偏相关。 偏相关系数是度量偏相关程度和方向的指标,它可以通过相关系数法来计算。 设有三个要素或变量x1,x2,x3,其简单相关系数矩阵如图。,3.6 偏相关(Partial Correlation),三个变量间的偏相关系数有三个,即r123,r132,r231 下标圆点后面的数字,代表保持不变的变量,如r123 表示X3保持不变,称为一级偏相关系数。 若有四个要素或变量相关,则有六个偏相关系数,即r1234,r1324,r1423,r2314,r2413,r3412,称为二级偏相关系数。 要素或变量多于四个时,可以类推。,偏相关的计算公式,rij有是变量xi,xj,的简单相关系数

13、,例如:假定测量了某个班级学生的三个变量数学成绩x1、外语成绩x2和语文成绩x3。计算这三个测量值之间线性相关系分别为:r12=0.58,r13=0.70,r23=0.80。,3.6 偏相关,3.7 多重相关,表示一个变量与一组变量的“综合”效应之间的相关 一般以为高中平时成绩和高考成绩可以对大学一年级学业成绩有预测作用。 如何考虑大学一年级学业成绩与高中平时成绩和高考成绩“总和”的相关?,六、相关系数的选用与解释,如何选择合适的相关系数 1、选择计算相关系数的方法主要取决于要处理的数据的性质以及某一相关系数需要满足的假设条件 2、总的来说,为了选择一个合适的相关系数进行相关分析,要分下面几个

14、步骤考虑 考虑每种测量所产生的数据类型。 要对第一种测量数据和第二种测量数据的类型依次做出判断 确定采用哪一种相关系数。至于两个测量数据哪个为第一哪个标为第二,没有差别。,1、相关系数是一个指标值,它表示两个变量之间的相关程度。 2、相关系数不是等距的测量值,因此在比较相关程度时,不能用倍数关系说明,只能说绝对值大者比绝对值小者相关更密切一些。 3、相关系数值的大小表明了两列测量数据相互间的相关程度,并可以预测。 4、当两个变量之间的关系受到其他变量的影响时,两者之间的高强度相关很可能是一种假象:虚假相关或伪相关。 5、在纯理论研究中,即使是很小的相关,如果在统计上有显著性,也能够说明心理规律

15、,但这并不表明有显著性就有高相关。 6、特别注意:证实两个变量之间存在相关关系,并不一定说明一个变量的变化会引起另外一个变量发生变化,即“相关关系不是因果关系”,相关系数的解释,小结,相关的含义 积差相关的计算公式和条件 等级相关 斯皮尔曼等级相关 肯德尔和谐系数 肯德尔U系数 质与量的相关 点二列相关 二列相关,作业,1、下表是平时两次考试的成绩分数,假设其分布为正态,分别用积差相关与等级相关方法计算相关系数,并回答,就这份资料用哪种相关法更恰当? 4、假设两变量为线性关系,对下列各种情况各应使用何种方法计算相关系数? (1)两列变量是等距或等比变量,且均为正态分布。 (2)两列变量是等距或等比变量,但不为正态分布。 (3)一列变量为正态连续变量,另一列变量为正态连续变量但被人为分为两类。 (4)一列为正态连续变量,另一列变量为二分称名变量。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号