《spss相关分析》ppt课件

资源描述

《《spss相关分析》ppt课件》由会员分享，可在线阅读，更多相关《《spss相关分析》ppt课件（59页珍藏版）》请在金锄头文库上搜索。

1、第七章,相关分析,主要内容,7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析,7.1相关分析简介,(1) 函数关系与相关关系变量之间的关系可以分为两种：一种是函数关系，另一种是相关关系。函数关系是一一对应的确定性关系，比较容易分析和测度。可是在现实世界中，变量间的关系往往并不是简单的确定性关系，也就是说，变量之间有着密切的关系，但又不能由一个或几个变量的值确定另一个变量的值，即当自变量x取某一值时，因变量y的值可能会有多个。这种变量之间的非一一对应的、不确定性的关系，称之为相关关系。 (2) 相关分析基本概念衡量事物之间，或称变量之间线性相关程度的强弱并用

2、适当的统计指标表示出来，这个过程就是相关分析。相关系数是衡量变量之间相关程度的一个指标，总体的相关系数用表示，样本的相关系数用r表示。,主要内容,7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析,7.1二元变量相关分析,(1) 基本概念二元变量的相关分析是指通过计算变量间两两相关的相关系数，对两个或两个以上变量之间两两相关的程度进行分析。根据所研究的变量类型不同，又可以分为二元定距变量的相关分析和二元定序变量的相关分析。 (2) 统计原理二元定距变量的相关分析：定距变量又称为间隔（interval）变量（即连续属性变量），变量值之间可以比较大小，可以用加

3、减法计算出差异的大小。 Pearson简单相关系数及t统计量,7.1二元变量相关分析,定序变量的相关性分析：定序变量又称为有序（ordinal）变量、顺序变量、等级变量，它取值的大小能够表示观测对象的某种顺序关系（等级、方位或大小等）。定序变量的相关系数用斯皮尔曼（Spearman）相关系数和肯德尔（Kendalls ）相关系数来衡量。 Spearman相关系数及Z统计量,Kendalls等级相关系数及Z统计量,7.2 二元变量相关分析,(3) 分析步骤第1步计算相关系数r：利用样本数据计算样本相关系数，样本相关系数反映了两变量间线性相关程度的强弱。相关系数的取值范围界于-1与1之间，

4、即-1r1 当0r 1，表明变量之间存在正相关关系；当-1 r0，表明变量之间存在负相关关系；当|r|=1时，表示其中一个变量的取值完全取决于另一个变量，二者即为函数关系；当r=0时，说明变量之间不存在线性相关关系，但这并不排除变量之间存在其它非线性相关的可能。,根据经验可将其相关程度分为几种：当|r|0.8时视为高度相关；当0.5|r|0.8时视为中度相关；当0.3 |r|0.5时视为低度相关；当|r|0.3时说明变量之间的相关性很弱。,第2步对样本来自的两总体是否存在显著的线性关系进行推断：由于存在抽样的随机性和样本数量较少等原因，通常样本相关系数不能直接用来说明样本来自的两总体是

5、否具有显著的线性相关性，需要通过假设检验的方式对样本的总体进行统计推断。提出零假设H0：即两总体无显著的线性关系；构造检验统计量：由于不同的相关系数采用不同的检验统计量，因此在相关分析时，不同的过程需要构造不同的检验统计量；计算检验统计量的观测值及对应的概率p值；对两总体的相关性进行推断：如果检验统计量的概率p值小于给定的显著性水平，应拒绝零假设，即认为两总体之间存在显著性线性关系；反之，应接受零假设。,7.2二元变量相关分析,(4) SPSS实现举例【例7-1】为了分析父亲与儿子身高之间的相关性，现抽样了12对父子的身高，数据如下表。请对其进行相关性分析（显著性水平取0.05）。,

6、7.2二元变量相关分析,第1步分析：身高是定距变量，考虑用Pearson相关系数来衡量。第2步数据的组织：分成两列，一列是父亲的身高，另一列是儿子的身高。,7.2二元变量相关分析,第3步选择菜单“分析相关双变量”，打开如图7-1所示的对话框，将“father”和“son”两变量移入“变量”框中；“相关系数”选择Pearson；在“显著性检验”中选择“双侧检验”；,7.2二元变量相关分析,第4步主要结果及分析。,其中包括了叉积离差矩阵、协方差矩阵、Pearson相关系数及相伴概率p值。从表中可看出，相关系数为0.7030，说明呈正相关，而相伴概率值Sig.=0.0050.05，因此应拒

7、绝零假设（H0:两变量之间不具相关性），即说明儿子身高是受父亲身高显著性正影响的。,主要内容,7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析,(1) 基本概念偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量，这种相关系数称为偏相关系数。偏相关系数的数值和简单相关系数的数值常常是不同的，在计算简单相关系数时，所有其他自变量不予考虑。 (2) 统计原理控制一个变量和控制两个变量的偏相关系数分别为：,7.3 偏相关分析,检验的统计量为：,(3)统计分析步骤第1步根据公式计算偏相关系数；第2步对样本来自的两总体是否存在显著

8、性相关进行推断。提出零假设H0：即两总体的偏相关系数与零无显著性差异；选择检验统计量：偏相关分析选择的是t统计量；计算t值及对应的概率p值；决策：如果相伴概率p值小于给定的显著性水平，则应拒绝零假设，认为两总体的偏相关系数与零有显著性差异；否则，接受原假设。,7.3 偏相关分析,(4) SPSS实现举例【例7-3】下表是四川绵阳地区3年生中山柏的数据，分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度4个气候因素中哪些因素有关。,7.3 偏相关分析,16,7.3 偏相关分析,第1步分析：这4个气候因素彼此均有影响，分析时应对生长量与4个气候因素分别求偏相关，如在求生长

9、量与气候因素的相关时控制其他因素的影响。所以需进行偏相关分析；第2步数据组织：如上表定义4个变量，输入数据即可；第3步进行偏相关分析：选择菜单“分析相关双变量”，指定分析变量和控制变量，分析变量“hgrow”和“temp”的偏相关系数，并将“rain”、“hsun”、“humi”设为控制变量。如下图所示设置。,第4步主要结果及分析。,7.3 偏相关分析,从中可以看出，月降雨量、月平均日照时数和月平均湿度为控制变量，生长量与月平均气温关系密切，偏相关系数为0.977，双尾检测的相伴概率为0.000（表示趋近于0的正数），明显小于显著性水平0.05。故应拒绝原假设，说明中山柏的生长量与气

10、温间存在显著的相关性。,主要内容,7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析,(1) 基本概念距离分析是对观测量之间相似或不相似程度的一种测度，是计算一对观测量之间的广义距离。这些相似性或距离测度可以用于其他分析过程，例如因子分析、聚类分析或多维定标分析，有助于分析复杂的数据集。 (2) 统计原理不相似性测度对定距数据的不相似性（距离）测度可以使用的统计量有：欧几里得距离、平方欧氏距离、切比雪夫距离、Block距离、明可斯基距离等。对定序数据，主要使用卡方不相似测度和斐方测度。对二值（只有两种取值）数据变量之间的距离描述，使用欧氏距离、平方欧氏

11、距离、尺寸差异、模式差异、方差、形或兰斯和威廉斯等距离统计量。,7.4 距离分析,相似性测度对于定距数据主要使用皮尔逊相关系数和夹角余弦距离; 对于二值数据的相似性测度主要包括简单匹配系数、Jaccard相似性指数、Hamann相似性测度等20余种。,7.4 距离分析,其中的距离又分为个案（观测记录）之间的距离和变量之间的距离两种。,(3) 分析步骤距离分析中不存在假设检验问题，主要是通过SPSS自动计算变量或个案之间的相似性或不相似性距离，根据其计算距离值的大小来确定变量或个案之间的相似性或不相似性的强弱。,(4) SPSS实现举例【例7-4】已知我国四城市2004年各月的日照时数如

12、下表所示，请分析各城市日照数是否近似。,7.4 距离分析,第1步分析：这是考查4个城市的日照时数是否相似的问题，可用距离分析实现。既可以计算其相似性测度，亦可计算其不相似性测度；第2步数据组织：分别定义的变量：month”(月份)（用字符型变量）、“Beijing”(北京)、“Tianjin”(天津)、“ShiJZ”（石家庄）、“Dalian”（大连）。,7.4 距离分析,7.4 距离分析,第3步进行距离分析：选择菜单“分析相关距离”，弹出下图所示的“距离”对话框，将4个变量（“北京”、“天津”、“石家庄”、“大连”）移入“变量”框中进行相似性度量计算；在“计算距离”组中选中“个案间”

13、单选框，进行变量间的距离分析；在“度量标准”单选框组中选中不相似性，求解其不相似性度量。,第4步主要结果及分析。,7.4 距离分析,表格的第一行（Euclidean 距离）说明采用的是欧氏距离。这是一个对称矩阵，当两变量的欧氏距离越大，说明其差别越大，反之越小。从表中可看出“北京”和“大连”的日照数最接近，而“北京”和“天津”的日照数相差最大。,The End,第八章,回归分析,主要内容,8.1 回归分析概述 8.2 线性回归分析 8.3 曲线估计 8.4 二元Logistic回归分析,8.1 回归分析概述,（1）确定性关系与非确定性关系变量与变量之间的关系分为确定性关系和非确定性关系，函

14、数表达确定性关系。研究变量间的非确定性关系，构造变量间经验公式的数理统计方法称为回归分析。（2）回归分析基本概念回归分析是指通过提供变量之间的数学表达式来定量描述变量间相关关系的数学过程，这一数学表达式通常称为经验公式。我们不仅可以利用概率统计知识，对这个经验公式的有效性进行判定，同时还可以利用这个经验公式，根据自变量的取值预测因变量的取值。如果是多个因素作为自变量的时候，还可以通过因素分析，找出哪些自变量对因变量的影响是显著的，哪些是不显著的。,（3）回归分析的一般步骤第1步确定回归方程中的因变量和自变量。第2步确定回归模型。第3步建立回归方程。第4步对回归方程进行各种检

15、验。拟合优度检验回归方程的显著性检验回归系数的显著性检验第5步利用回归方程进行预测。,8.1 回归分析概述,主要内容,8.1 回归分析概述 8.2 线性回归分析 8.3 曲线估计 8.4 二元Logistic回归分析,8.2线性回归分析,8.2.1 基本概念及统计原理 1.基本概念线性回归假设因变量与自变量之间为线性关系，用一定的线性回归模型来拟合因变量和自变量的数据，并通过确定模型参数来得到回归方程。根据自变量的多少，线性回归可有不同的划分。当自变量只有一个时，称为一元线性回归，当自变量有多个时，称为多元线性回归。,8.2线性回归分析,(2) 统计原理一元回归方程和多元回归方程

16、,一元线性和多元线性回归分析的核心任务就是估计其中的参数。,8.2线性回归分析,8.2.2 SPSS实例分析【例8-1】现有1992年-2006年国家财政收入和国内生产总值的数据如下表所示，请研究国家财政收入和国内生产总值之间的线性关系。,8.2 线性回归分析,第1步分析：这是一个因变量和一个自变量之间的问题，故应该考虑用一元线性回归解决。第2步数据组织：定义三个变量，分别为“year”（年份）、“x”（国内生产总值）、“y”（财政收入）。第3步作散点图，观察两个变量的相关性：依次选择菜单“图形旧对话框散点/点状简单分布”，并将“国内生产总值”作为x轴，“财政收入”作为y轴，得到如下所示图形。,可以看出两变量具有较强的线性关系，可以用一元线性回归来拟合两变量。,8.2 线性回归分析,第4步一元线性回归分析设置：选择菜单“分析回归线性”，打开“线性回归”对话框，将变量“财政收入”作为因变量，“国内生产总值”作为

展开阅读全文

《spss相关分析》ppt课件

最新文档