资料分析(一)相关分析

上传人:tian****1990 文档编号:74709777 上传时间:2019-01-29 格式:PPT 页数:38 大小:494.50KB
返回 下载 相关 举报
资料分析(一)相关分析_第1页
第1页 / 共38页
资料分析(一)相关分析_第2页
第2页 / 共38页
资料分析(一)相关分析_第3页
第3页 / 共38页
资料分析(一)相关分析_第4页
第4页 / 共38页
资料分析(一)相关分析_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《资料分析(一)相关分析》由会员分享,可在线阅读,更多相关《资料分析(一)相关分析(38页珍藏版)》请在金锄头文库上搜索。

1、第7讲 资料分析(一) 相关分析P391-400,相关分析的基本概念 二元定类变量的相关分析 二元定距变量的相关分析 二元定序变量的相关分析 偏相关分析,一、 相关分析的基本概念,任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。变量之间的关系归纳起来可以分为两种类型,即函数关系和统计关系。,1、函数关系与相关关系,当一个变量x取一定值时,另一变量y可以按照确定的函数公式取一个确定的值,记为y = f(x),则称y是x的函数,也就时说y与x两变量之间存在函数关系。又如,某种商品在其价格不变的情况下,销售额和销售量之间的关系就是一种函数关系:销

2、售额=价格销售量。,函数关系是一一对应的确定性关系,比较容易分析和测度,可是在现实中,变量之间的关系往往并不那么简单。关系也不能简单的以函数形式来表达。,2、相关分析的方法,1)相关表 相关表的分类:简单相关表和分组相关表。 单变量分组相关表:自变量分组并计算次数,而对应的因变量不分组,只计算其平均值;双变量分组相关表:自变量和因变量都进行分组而制成的相关表。 2)相关图 相关图被形象地称为相关散点图。 3)相关系数,相关系数,相关系数的取值范围在1和+1之间,即1r+1。其中: 若0r1,表明变量之间存在正相关关系,即两个变量的相随变动方向相同; 若1r0,表明变量之间存在负相关关系,即两个

3、变量的相随变动方向相反; 若=0,说明变量间不存在线性关系,但不排除变量间存在其它非线性关系,样本相关系数与总体相关系数,为了判断r对的代表性大小,需要对相关系数进行假设检验。 (1)首先假设总体相关性为零,即H0为两总体无显著的线性相关关系。 (2)其次,计算相应的统计量,并得到对应的相伴概率值。如果相伴概率值小于或等于指定的显著性水平(通常为0.05),则拒绝H0,认为两总体存在显著的线性相关关系;如果相伴概率值大于指定的显著性水平,则不能拒绝H0,认为两总体不存在显著的线性相关关系。,3、相关分析的种类,1)按相关的程度分为完全相关、不完全相关和不相关,2)按相关的方向分为正相关和负相关

4、,3)按相关的形式分为线性相关和非线性相关,4)按影响因素的多少分为单相关和复相关,二元定距变量的相关分析 二元定距变量的相关分析、 二元定序变量的相关分析、 偏相关分析。,二、 二元分类变量的相关分析,例 :考察老人的性别与火葬态度之间的关系,SPSS的实现,分析结果,当n40,且所有的T 5时,用普通的Chi-Square 检验, 若p,改用Fishers Exact Test ; 当n40,但有的1T 5时,用Continuity Correction(a) 检验; 当n 40,或有T 1时,不能用Chi-Square 检验, 应用Fishers Exact Test,定义:二元定距变量

5、的相关分析是指通过计算定距变量间两两相关的相关系数,对两个或两个以上定距变量之间两两相关的程度进行分析。 定距变量又称为间隔(interval)变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。例如,“年龄”变量、“收入”变量、“成绩”变量等都是典型的定距变量。,三、 二元定距变量的相关分析,计算公式如下。 Pearson简单相关系数计算公式为,Pearson简单相关系数用来衡量定距变量间的线性关系。如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。,对Pearson简单相关系数的统计检验是计算t统计量,公式为 t统计量服从n2个自由度的t分布。,

6、学生的数学和化学成绩, 研究问题 某班级学生数学和化学的期末考试成绩如表所示,现要研究该班学生的数学和化学成绩之间是否具有相关性。, 实现步骤,图6-3 “Bivariate Correlations:Options”对话框,结果和讨论,四、 二元定序变量的相关分析,定义:定序变量又称为有序(ordinal)变量、顺序变量,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。例如,“最高学历”变量的取值是:1小学及以下、2初中、3高中、中专、技校、4大学专科、5大学本科、6研究生以上。由小到大的取值能够代表学历由低到高。,Spearman和Kendall

7、s tua-b等级相关系数用以衡量定序变量间的线性相关关系,它们利用的是非参数检验的方法。 计算公式如下。 Spearman等级相关系数为,对Spearman等级相关系数的统计检验,一般如果个案数n30,将直接利用Spearman等级相关统计量表,SPSS将自动根据该表给出对应的相伴概率值。,Kendall等级相关系数(Kendall tau rank correlation coefficient,肯德尔等级相关系数,对Kendalls tua-b等级相关系数的统计检验,一般如果个案数n30,将直接利用Kendalls tua-b等级相关统计量表,SPSS将自动根据该表给出对应的相伴概率值。

8、, 研究问题 某语文老师先后两次对其班级学生同一篇作文加以评分,两次成绩分别记为变量“作文1”和“作文2”,数据如表6-2所示。问两次评分的等级相关有多大,是否达到显著水平?,学生作文两次的得分情况, 实现步骤,结果和讨论,五、 偏相关分析,二元变量的相关分析在一些情况下无法较为真实准确地反映事物之间的相关关系。例如,在研究某农场春季早稻产量与平均降雨量、平均温度之间的关系时,产量和平均降雨量之间的关系中实际还包含了平均温度对产量的影响。同时平均降雨量对平均温度也会产生影响。在这种情况下,单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。偏相关分析正是用来解决这个问题的。,早稻产量与降雨量和温度之间的关系, 研究问题 某农场通过试验取得某农作物产量与春季降雨量和平均温度的数据,如表6-3所示。现求降雨量对产量的偏相关。, 实现步骤,结果和讨论,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号