[计算机软件及应用]数据相关分析

上传人:tia****nde 文档编号:70799288 上传时间:2019-01-18 格式:PPT 页数:36 大小:524.81KB
返回 下载 相关 举报
[计算机软件及应用]数据相关分析_第1页
第1页 / 共36页
[计算机软件及应用]数据相关分析_第2页
第2页 / 共36页
[计算机软件及应用]数据相关分析_第3页
第3页 / 共36页
[计算机软件及应用]数据相关分析_第4页
第4页 / 共36页
[计算机软件及应用]数据相关分析_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《[计算机软件及应用]数据相关分析》由会员分享,可在线阅读,更多相关《[计算机软件及应用]数据相关分析(36页珍藏版)》请在金锄头文库上搜索。

1、数据相关分析,Correlations,1 相关分析的概念与相关分析过程,返回,一、函数关系与相关关系,反映现象之间存在着严格的依存关系,即当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,这种关系为确定性的函数关系。 例如,圆周长L与圆半径r之间存在严格的确定性关系,因而两者为函数关系,即 。,当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。 变量间的这种相互关系,称为具有不确定性的相关关系。 它反映现象之间客观存在的、不严格、不确定的相互依存关系。这种关系不能通过个别现象体现其关系的规律性,必须在大量现象中才能体现出

2、来。 例如,身高与体重的关系。,二、相关分析与回归分析,是研究现象之间相关关系的两种基本方法。 相关分析是用一个指标来表明现象间相互依存关系的密切程度。 回归分析是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。,相关分析和回归分析有着密切的联系 相关分析需要依靠回归分析来表明现象数量相关的具体形式。 回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。,但两者在研究目的和方法上有明显区别 相关分析研究变量之间相关方向和相关程度;回归分析则研究变量之间相互关系的具体形式。 相关分析不必

3、确定自变量与因变量,其所涉及的变量可以都是随机变量;而回归分析则必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量。 在应用这两项方法对客观现象进行研究时,一定要始终注意把定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。,三、相关分析的基本方法之一绘制散点图 Graphs scatterplot,在SPSS中提供了四种散点图,分别是:简单散点图(Simple)、重叠散点图(Overlay)、矩阵散点图(Matrix)和三维散点图(3-D) Data08-01、08-03,四、相关分析的基本方法之二计算相关系数 analyze correlate bivariate,二元

4、变量相关分析主对话框,返回,options输出选择项对话框,返回,1. Pearson简单相关系数 用来度量正态分布的定距变量间的线性相关关系。 2. Spearman相关系数 是非参测度,即根据数据的秩而不是根据实际值计算的,即,先对原始变量的数据排秩,根据各秩使用Spearman相关系数公式进行计算。适用于有序数据或不满足正态分布假设的定距变量。 3. Kendalls tua-b等级相关系数 也是非参测度,即对两个有序变量或两个秩变量间的关系程度的测度。,有关公式:,Pearson积矩相关,Spearman相关系数,式中Ri是第i个x值的秩,Si是第i个y值的秩。,分别是Ri和Si的平均

5、值。,返回,有关公式:,Kendalls tau-b :,其中,ti(或ui)是x(或y)的第i 组结点x(或y)值的数目, n为观测量数。,返回,有关公式:关于相关系数统计意义的检验,式中r是相关系数,n是样本观测量数,n2是自由度。当tt0.05(n-2)时,p0.05拒绝原假设;,Pearson和Spearman 相关系数假设检验t值计算公式:,返回,零假设:总体中两个变量间的相关系数为0,两变量间相关分析实例data08-01,安徽省国民收入与城乡居民存款余额的相关分析,(使用默认参数),返回,秩相关实例data02-01 salary salbegin with jobcat edu

6、c,各雇员的职务等级(jobcat)、受教育程度(Educ)与当前工资、起始工资间的关系。Educ数值数小于24(options对话框中定义的),因此标为Ordinal属于有序分类变量。,非参相关矩阵,返回,秩相关实例 data08-02,为某次全国武术女子前10名运动员长拳和长兵器两项得分数据,要求分析这两项得分是否存在线性关系。,Kendalls tau-b与Spearman相关系数,返回,2 偏 相 关 分 析,返回,简单相关分析计算两个变量间的相关系数,分析两个变量间线性关系的程度,往往因为第三个变量的作用,使相关系数不能真正反映两个变量间的线性程度。例如:在研究商品的需求量和价格、消

7、费者收入之间的关系时会发现,需求量和价格之间的相关关系实际还包含了消费者收入对商品需求量的影响,同时,收入对价格也产生了影响,并通过价格变动传递到对商品需求量的影响中。 偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。,偏相关的有关公式:,控制了z的条件下,x、y之间的偏相关系数 :,控制了两个变量z1、z2,变量x、y之间的偏相关系数:,返回,Pearson偏相关系数假设检验的t统计量:,其中,r是相应的偏相关系数,n是观测量数,k是控制变量的数目,n-k-2是自由度。当tt0.05(n-k-2)时,p0.05拒绝原假设,零假设:总体中两个变量间的偏相关系数

8、为0,偏相关分析的主对话框 analyze correlate partial,返回,偏相关的选择项对话框,返回,零阶相关矩阵,即pearsom相关矩阵,偏相关应用实例输出data08-03,四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度这四个气候因素哪个因素有关。,各变量的描述统计量,生长量与各变量间Pearson相关分析结果,返回,偏相关分析输出2:,返回,偏相关分析结论,中山柏生长量与四个气候因素的偏相关综合结果,返回,3 距 离 分 析,返回,距离分析是对观测量之间或变量之间相似或不相似程度的一种测度,是计算一对变量之间或一对观测量之间的

9、广义的距离。相似性(Similarity)反映了研究对象之间的亲疏程度。这些相似性或距离测度可以用于因子分析、聚类分析等分析过程。,距离分析的主对话框图 analyze correlate distance,返回,标识变量要求是字符型变量,不相似性距离测度选择项对话框,返回,相似性测度选择项对话框,返回,距离分析实例 data08-03,观测量间的欧氏距离,返回,行列之间数值越大的不相似性越强,变量间不相似性分析例题输出,变量间的不相似性测度 标准化后的欧氏距离,返回,变量间的相似性测度例题,相关系数矩阵,返回,相似性越强,相关系数越大,不相似性距离越小,注意使用辅助方法,GraphScatter,返回,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号