第9章-聚类和判别分析课件

上传人:m**** 文档编号:569521568 上传时间:2024-07-30 格式:PPT 页数:47 大小:923KB
返回 下载 相关 举报
第9章-聚类和判别分析课件_第1页
第1页 / 共47页
第9章-聚类和判别分析课件_第2页
第2页 / 共47页
第9章-聚类和判别分析课件_第3页
第3页 / 共47页
第9章-聚类和判别分析课件_第4页
第4页 / 共47页
第9章-聚类和判别分析课件_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《第9章-聚类和判别分析课件》由会员分享,可在线阅读,更多相关《第9章-聚类和判别分析课件(47页珍藏版)》请在金锄头文库上搜索。

1、SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社1第九章聚类和判别分析SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社2主要内容主要内容9.1 聚类和判别分析简介聚类和判别分析简介9.2 二阶聚类二阶聚类9.3 K-均值聚类均值聚类9.4 系统系统聚类聚类9.5 判别分析判别分析SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社39.1 聚类和判别分析简介聚类和判别分析简介9.1.1 基本概念基本概念(1) (1) 聚聚类分析分析 聚类分析的基本思想是找出一些能够度量样本或指标之间相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度

2、较大的样本(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样本又聚合为一类。根据分类对象的不同,聚类分析可分为对样本的聚类和对变量的聚类两种。 (2) (2) 判判别分析分析 判别分析是判别样本所属类型的一种统计方法。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社49.1 聚类和判别分析简介聚类和判别分析简介9.1.1 基本概念基本概念(3) (3) 二者区二者区别 不同之处在于,判别分析是在已知研究对象分为若干类型(或组别)并已取得各种类型的一批已知样本的观测量数据的基础上,根据某些准则建立判别式,然后对未知类型的样本进行差别分析。 SPSS 23(中文版)统计分析

3、实用教程(第2版) 电子工业出版社59.1.2 样本本间亲疏关系的度量疏关系的度量(1)连续变量的量的样本本间距离常用度量距离常用度量 主要方法有欧氏距离(Euclidean Distance)、欧氏平方距离(Squared Euclidean Distance)、切比雪夫距离(Chebychev Distance)、明可斯基距离(Minkowski Distance)、用户自定义距离(Customize Distance)、Pearson相关系数、夹角余弦(Cosine)等。(公式见教材表7.9)(2)顺序序变量的量的样本本间距离常用度量距离常用度量 常用的有 统计量(Chi-square

4、measure)和 统计量(Phi-square measure)。具体计算公式参见7.4节表7.10。9.1 聚类和判别分析简介聚类和判别分析简介SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社6主要内容主要内容9.1 聚类和判别分析简介聚类和判别分析简介9.2 二阶聚类二阶聚类9.3 K-均值聚类均值聚类9.4 系统系统聚类聚类9.5 判别分析判别分析SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社79.2 二阶聚类二阶聚类9.2.1 基本概念及基本概念及统计原理原理(1)基本概念)基本概念 二阶聚类(TwoStep Cluster)(也称为两步聚类)是

5、一个探索性的分析工具(),为揭示自然的分类或分组而设计,是数据集内部的而不是外观上的分类。它是一种新型的分层聚类算法(Hierarchical Algorithms),目前主要应用到数据挖掘(Data Mining)和多元数据统计的交叉领域模式分类中。该过程主要有以下几个特点:分类变量和连续变量均可以参与二阶聚类分析;该过程可以自动确定分类数;可以高效率地分析大数据集;用户可以自己定制用于运算的内存容量。 SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社89.2 二阶聚类二阶聚类9.2.1 基本概念及基本概念及统计原理原理(2) 统计原理 两步法的功能非常强大,而原理又较为复

6、杂。他在聚类过程中除了使用传统的欧氏距离外,为了处理分类变量和连续变量,它用似然距离测度,它要求模型中的变量是独立的,分类变量是多项式分布,连续变量是正态分布的。分类变量和连续变量均可以参与两步聚类分析。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社99.2 二阶聚类二阶聚类9.2.1 基本概念及基本概念及统计原理原理(3)分析步)分析步骤第第1步步 构建聚构建聚类特征特征树:对每个观测变量考察一遍,确定类中心。根据相近者为同一类的原则,计算距离并把与类中心距离最小的观测量分到相应的各类中去。这个过程称为构建一个分类的特征树(CF)。 第第2步步对聚聚类特征特征树的的节点点

7、进行分行分组:为确定最好的类数,对每一个聚类结果使用Akaik判据(AIC)或贝叶斯判据(BIC)作为标准进行比较,得出最后的聚类结果。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社109.2 二阶聚类二阶聚类9.2.2 SPSS实例分析例分析 【例9-1】 某机构为了调查学生性别和所学专业与毕业后初始工资的情况,调查抽取了60个学生的数据,如表9.1所示(其中“性别”1代表男性,0代表女性;“学科”1代表农学,2代表建筑,3代表地质,4代表商务,5代表林学,6代表教育,7代表工程,8代表艺术),试根据样本指标进行聚类分析。(数据参见教材P202)第第1步步 分析:分析:由

8、于自变量中不仅有连续属性,也有分类变量,故采用二阶聚类进行分析。 第第2步步 数据组织:数据组织:按表所示定义变量,输入数据并保存。 SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社119.2 二阶聚类二阶聚类第第3步步 二阶聚类设置:二阶聚类设置:按“分析分类两步聚类”顺序打开“二阶聚类分析”对话框,并按下图进行设置。 SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社129.2 二阶聚类二阶聚类第第4步步 主要结果及分析:主要结果及分析:二阶聚类的模型概要和聚类质量情况从中可以看出,此算法采用的是两步(二阶)聚类,共输入3个变量,将所有个案聚成3类。聚类的

9、平均轮廓值为0.6(其范围值为-1.01.0,值越大越好),说明聚类质量较好。 聚类个案情况图可以看出各类所占的比例情况SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社139.2 二阶聚类二阶聚类第第4步步 主要结果及分析:主要结果及分析:各个案所属的分类号情况SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社14主要内容主要内容9.1 聚类和判别分析简介聚类和判别分析简介9.2 二阶聚类二阶聚类9.3 K-均值聚类均值聚类9.4 系统系统聚类聚类9.5 判别分析判别分析SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社159.3 K-均值聚类

10、均值聚类9.3.1 基本概念及基本概念及统计原理原理(1)基本概念)基本概念 K-均值聚(也称快速聚类)是由用户指定类别数的大样本资料的逐步聚类分析。它先对数据进行初始分类,然后逐步调整,得到最终分类数。分类变量和连续变量均可以参与两步聚类分析。(2)统计原理原理 如果选择了n个数值型变量参与聚类分析,最后要求聚类数为k。由系统首先选择k个观测量(也可以是用户指定)作为聚类的目标,n个变量组成n维空间。每个观测量在n维空间中是一个点。K个事先选定的观测量就是k个聚类中心,也称为初始类中心。按照距这几个类中心的距离最小的原则把观测量分派到各类中心所在的类中去;形成第一次迭代形成的k类。 SPSS

11、 23(中文版)统计分析实用教程(第2版) 电子工业出版社169.3 K-均值聚类均值聚类根据组成每一类的观测量计算每个变量的均值,每一类中的n个均值在n维空间中又形成k个点,这就是第二次迭代的类中心。按照这种方法迭代下去,直到达到指定 的迭代次数或达到中止迭代的判据要求时,迭代就停止了,聚类过程也就结束了。(3)分析步)分析步骤第1步 指定聚类数目k;第2步 确定k个初始类中心;第3步 根据距离最近原则进行分类;第4步 重新确定k个类中心;第5步 迭代计算。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社179.3 K-均值聚类均值聚类9.3.2 SPSS实例分析例分析【例

12、9-2】测量12名大学生对高等数学的心理状况和学习效果,主要包括四个因素:学习动机、学习态度、自我感觉、学习效果,具体数据如下表所示。试将该12名学生分成3类以分析不同心理状况下学生的学习效果。编号学习动机学习态度自我感觉学习效果1408054442377356463437075584507785775478789636677084697773757100880377382983407696108743759111605770851270506990SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社189.3 K-均值聚类均值聚类第第1 1步步 分析:分析:由于已知分成3类,故

13、可采用K-均值聚类法。第第2 2步步 数据数据组织:按如上表的表头所示建立变量,将“编号”变量的数据类型设为字符型(作为标识变量)。第第3 3步步 快速聚快速聚类设置,置,按“分析分类K-均值聚类”顺序打开“K-均值聚类分析”对话框,将“学习动机”、“学习态度”、“自我感觉”、“学习效果”四个变量选入“变量”列表框。将“编号”变量移入“个案标记依据”框中;将“聚类数”设为3。其余“迭代”、“保存”和“选项”设置参见教材。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社199.3 K-均值聚类均值聚类第第4 4步步 主要主要结果及分析:果及分析:初始聚类中心表 Cluster1

14、23学习动机406777学习态度807037自我感觉548457学习效果4469100由于没有指定初始聚类中心,列出了由系统指定的类中心。与原数据比较,发现它们分别是第1、第6和第7号个案。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社209.3 K-均值聚类均值聚类第第4 4步步 主要主要结果及分析:果及分析:迭代历史表 由表可知,第一次迭代后,3个类的中心点分别变化了8.193,9.889和13.472。一共进行了10次迭代,达到聚类结果的要求(达到最大迭代次数),聚类分析结束。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社219.3 K-均值聚类均

15、值聚类最终聚类中心表聚类123学习动机395276学习态度777644自我感觉558370学习效果456791如第1类的学习动机值为39,学习态度值为77,自我感觉值为55,学习效果值为45。样本数情况聚类12.00024.00036.000有效12.000缺失.000可看出第1,2,3类中分别含有2,4,6个样本SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社229.3 K-均值聚类均值聚类分类保存情况查看数据文件,可看到多出两个变量,分别表示每个个案的具体分类归属和与类中心的距离。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社23主要内容主要内容9.1

16、 聚类和判别分析简介聚类和判别分析简介9.2 二阶聚类二阶聚类9.3 K-均值聚类均值聚类9.4 系统系统聚类聚类9.5 判别分析判别分析SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社249.4 系统系统聚类聚类9.4.1 基本概念与基本概念与统计原理原理(1)基本概念)基本概念 系统聚类是效果最好且经常使用的方法之一,国内外对它进行了深入的研究,系统聚类在聚类过程中是按一定层次进行的。具体分成两种,分别是Q型聚类和R型聚类,Q型聚类是对样本(个案)进行的分类,它将具有共同特点的个案聚集在一起,以便对不同类的样本进行分析;R型聚类是对变量进行的聚类,它使具有共同特征的变量聚

17、在一起,以便对不同类的变量进行分析。 SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社259.4 系统系统聚类聚类9.4.1 基本概念与基本概念与统计原理原理(2) 统计原理 系统聚类是根据个案或变量之间的亲疏程度,将最相似的对象聚集在一起。根据系统聚类过程的不同,又分为凝聚法和分解法两种。凝聚法的原理是将参与聚类的每个个案(或变量)视为一类,根据两类之间的距离或相似性,逐步合并直到合并为一个大类为止;分解法的原理是将所有个案(或变量)都视为一类,然后根据距离和相似性逐层分解,直到参与聚类的每个个案(或变量)自成一类为止。 在层次聚类中,度量数据之间的亲疏程度是极为关键的。在

18、衡量样本与样本之间的距离时,一般使用的距离有Eulcidean Distance、Squared Euclidean Distance、切比雪夫距离、Block距离、明可斯基距离(Minkowshi)、夹角余弦(Cosine)等。 SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社269.4 系统系统聚类聚类9.4.1 基本概念与基本概念与统计原理原理(2) 统计原理 衡量样本数据与小类、小类与小类之间亲疏程度的度量方法主要有以下7种:最短距离法(Nearest Neighbor) ;最长距离法(Furthest Neighbor) ;类间平均链锁法(Between-group

19、s Linkage); 类内平均链锁法(Within-groups Linkage) ;重心法(Centriod Clustering) ;中间距离法(Median Clustering); 离差平方和(Wards Method)。 SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社279.4 系统系统聚类聚类9.4.2 SPSS实现举例例【例9-3】已知29例儿童的血中血红蛋白、钙、镁、铁、锰、铜的含量如下表,试对数据进行变量聚类分析。ordercamgfemncuhemogl ordercamgfemncuhemogl154.8930.86448.70.0121.0113.

20、51672.2840.12430.801.210.75272.4942.61467.30.0081.64131755.1333.02445.80.0120.91810.5353.8152.86 425.61 0.0041.2213.751870.0836.81409.80.0121.1910.25464.7439.18469.80.0051.22141963.0535.07384.100.85310558.837.67 456.55 0.0121.0114.252048.7530.53342.90.0180.9249.75643.6726.18 395.78 0.0010.59412.7521

21、52.2827.14 326.29 0.0040.8179.5754.8930.86448.70.0121.0112.52252.2136.18 388.54 0.0241.029.25886.1243.79 440.13 0.0171.7712.252349.7125.43331.10.0120.8979960.3538.2394.40.0011.14122461.0229.27 258.94 0.0161.198.751054.0434.23405.60.0081.311.752553.6828.79292.80.0481.328.51161.2337.354460.0221.3811.5

22、2650.2229.17292.60.0061.048.251260.1733.67383.20.0010.91411.252765.3429.99312.80.0061.0381369.6940.01416.70.0121.35112856.3929.292830.0161.357.81473.8932.94312.50.0641.157.252966.1231.93344.200.6897.51547.3128.55294.70.0050.8387SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社289.4 系统系统聚类聚类第第1步步 分析:分析:根据题目要求,需进行变量聚

23、类分析(即R型聚类),故采用系统聚类分析中的R型聚类进行处理。第第2步步 数据组织:数据组织:如上表定义七个变量:“order”(编号)、“ca”(钙)、“mg”(镁)、“fe”(铁)、“mn”(锰)、“cu”(铜)和“hemogl”(血红蛋白),其中“order”为字符串型,其余变量为数值型。第第3步步 进行按变量聚类的设置:进行按变量聚类的设置:按“分析分类系统聚类”打开“系统聚类分析”对话框,将“ca”(钙)、“mg”(镁)、“fe”(铁)、“mn”(锰)、“cu”(铜)和“hemogl”(血红蛋白)几个变量选入“变量”列表框。设置按“变量”分类,并选择输出“统计量”和“图”,以激活“统

24、计量(S)”和“绘制(T)“两个按钮。 具体如下面图所示。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社299.4 系统系统聚类聚类SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社309.4 系统系统聚类聚类第第4步步 主要结果及分析:主要结果及分析:凝聚顺序表 阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 21456.02800224654.938104312144.078004414235.5303255131966.192400第1步是第4个变量和第5个变量进行聚类,变量间的距离系数为6.028,这个结果将在第2步中用到;第2步是经

25、过第1步聚类后的变量4和变量5与变量6进行聚类,变量间的距离系数为54.938,这个结果将在第4步中用到。以此类推,这6个变量经过5步聚类最终聚成一个大类。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社319.4 系统系统聚类聚类第第4步步 主要结果及分析:主要结果及分析:系统聚类的冰柱图图的纵坐标表示聚类的数目,我们从图的最下方看起,从5类,逐渐到4类、3类、2类,最后聚成一个大类。首先是“铜”和“锰”聚成一类,其余每个变量各为一类。第2步再将“血红蛋白”聚到“铜”和“锰”一类中,原先的6个变量就变成了4类。以此类推,经过5步聚类,最后将所有变量聚成了一个大类。SPSS

26、23(中文版)统计分析实用教程(第2版) 电子工业出版社329.4 系统系统聚类聚类第第4步步 主要结果及分析:主要结果及分析:系统聚类的树状图第1步将“cu(铜)”和“mn(锰)”聚成一类,第2步将“hemogl(血红蛋白)”聚到“cu(铜)”和“mn(锰)”类中,第3步将“ca(钙)”和“mg(镁)”聚成一类。以此类推,最后聚成一个大类。这与聚类顺序表和聚类冰柱图的分析结果是一致的。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社33主要内容主要内容9.1 聚类和判别分析简介聚类和判别分析简介9.2 二阶聚类二阶聚类9.3 K-均值聚类均值聚类9.4 系统系统聚类聚类9.

27、5 判别分析判别分析SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社349.5 判别分析判别分析9.5.1 基本概念与基本概念与统计原理原理(1)基本概念基本概念 判别分析(Discriminant Analysis)是多元统计分析中用于判别样本所属类型的一种统计方法。它要解决的问题是在一些已知研究对象用某种方法已分成若干类的情况下,确定新的观察数据属于已知类别中的哪一类。判别分析是应用很强的一种多元统计分析方法。 (2) 统计原理原理 判别分析按判别组数来分,有两组判别分析和多组判别分析,按区分不同总体所用的数学模型来分,有线性差别和非线性判别。判别分析可以从不同的角度提出

28、问题,因此有不同的判别准则,如费歇尔(Fisher)准则和贝叶斯(Bayes)准则。 判别函数的一般形式是 SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社359.5 判别分析判别分析分析步分析步骤第第1 1步步 计算特征算特征值:计算需要用到的一些反映样本的特征值,比如均值、协方差矩阵等。第第2 2步步 建立判建立判别函数:函数:判别函数的一般形式如式10.1建立判别函数就是要确定这些系数。第第3 3步步 确定判确定判别准准则:如费歇尔(Fisher)准则和贝叶斯(Bayes)准则。第第4 4步步 检验判判别效果:效果:验证判别函数用来进行判别时的准确度。第第5 5步步 分

29、分类:根据所建立的判别函数对待判样本进行分类。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社369.5 判别分析判别分析9.5.2 SPSS实例分析例分析【例9-4】 下表是健康人(c = 1)、硬化症患者(c = 2)和冠心病患者(c = 3)三种人群的心电图的5个指标(x1x5)数据,其中有19个样本是确定的分类,另又测出4个人的相关指标,试根据确定分类的样本对这未确定的样本进行分类。 orderx1x2x3x4x5c orderx1x2x3x4x5c18.11261.0113.235.467.361133.71316.1217.126.048.17229.36185.

30、399.025.665.991145.37274.5716.754.989.67239.85249.5815.616.066.111159.89409.4219.475.1910.49242.55137.139.216.114.351165.22330.3418.194.969.61356.01231.3414.275.218.791174.71352.520.795.0711369.64231.3813.034.868.531183.36347.3117.94.6511.19374.11260.2514.725.3610.021198.27189.5912.745.466.94388.925

31、9.5114.164.919.791207.71273.8416.015.158.79待定98.06231.0314.415.726.151217.51303.5919.145.78.53待定106.8308.915.115.528.492228.1476.697.385.3211.32待定118.68258.6914.024.797.162234.71331.4721.264.313.72待定125.67355.5415.134.979.432 SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社379.5 判别分析判别分析第第1步步 分析:分析:由于部分样本已经有分类标记,还

32、有几个待分类样本。这显然属于根据已知分类样本的信息对未分类样本进行分类的情况,用判别分析进行处理。第第2步步 数据数据组织:建立7个变量。分别是“序号”、“x1”、“x2”、“x3”、“x4”、“x5”和“c”,均为数值型变量。输入数据,对第20条23条的类别“c”变量,不填数据,作为缺失值处理,存盘并保存。第第3步步 判判别分析分析设置:置: 按如下图示进行设置SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社389.5 判别分析判别分析SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社399.5 判别分析判别分析第第4步步 主要结果及分析:主要结果及分析:分

33、析案例处理摘要表未加权案例N百分比有效1982.6排除的缺失或越界组代码417.4至少一个缺失判别变量0.0缺失或越界组代码还有至少一个缺失判别变量0.0合计417.4合计23100.0表明共23条记录,已分好类的19条,有4条需进行分类。 汇聚的变量之间相关矩阵表x1x2x3x4x5Correlationx11.000.059-.008-.203-.090x2.0591.000.835-.328.762x3-.008.8351.000-.187.688x4-.203-.328-.1871.000-.659x5-.090.762.688-.6591.000给出了这五个自变量之间的相关系数,如变

34、量“x1”与变量“x2”之间的相关系数为0.059。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社409.5 判别分析判别分析特征值表函数特征值方差的 %累积 %正则相关性11.386a77.377.3.7622.408a22.7100.0.538a. 分析中使用了前 2 个典型判别式函数。判别函数的显著性检验结果表函数检验Wilks 的 Lambda卡方dfSig.1 到 2.29816.96210.0752.7104.7874.310由于本例中预测变量为5个,类别数为3,因此判别函数的个数为2(即min(3-1,5)=2)。判别函数的特征值越大,表明该函数越具有区别力。

35、第一个判别函数的特征值为1.386,第二个为0.408。其中“1到2”表示两个判别函数的平均数在3个级别间的差异情况。“2”表示在排除第一个判别函数后,第二个函数在3个级别间的差异情况。从最后的显著性概率Sig.来看,其两个判别函数的效果并不十分显著SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社419.5 判别分析判别分析判别系数表函数12x1.626.234x2-.9881.808x3-.664-1.398x4.974.416x51.434-.336SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社429.5 判别分析判别分析分类结果概述表已处理的23已排

36、除的缺失或越界组代码0至少一个缺失判别变量0用于输出中23从表中可以看出,有23条个案被成功分类。 SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社439.5 判别分析判别分析 分类函数系数表 c健康硬化病冠心病x17.3606.8916.681x2-.222-.160-.211x3-5.354-5.209-4.227x4104.590100.62698.616x530.92029.07329.230(常量)-369.692-349.655-340.370Fisher 的线性判别式函数SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社449.5 判别分析判别分

37、析各类区域图及分类标记情况图这是以根据每个个案计算出的判别分数为坐标,以典则判别函数1为横轴,以典则判别函数2为纵轴,所绘出的散点图。可以看出,在图中分出了1,2,3三个区域,在图中也标出了各类的中心(其中心用“*”表示)。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社459.5 判别分析判别分析分类结果矩阵 c预测组成员合计健康 硬化病 冠心病初始计数健康9009硬化病0516冠心病1034未分组的案例1124%健康100.0.0.0100.0硬化病.083.316.7100.0冠心病25.0.075.0100.0未分组的案例25.025.050.0100.0a. 已对初始分组案例中的 89.5% 个进行了正确分类。对角线显示的为准确预测的个数,其余为错误预测的个数。从该表可以看出,已经分的19个个案正确分类17个,错误分类2个。正确率还是比较高的。根据这19个个案为先验数据,将待分类的4个个案分别分入1,2,3类的分别有1,1,2个。SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社469.5 判别分析判别分析分类保存结果图 SPSS 23(中文版)统计分析实用教程(第2版) 电子工业出版社47The End

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号