SPSS11聚类与判别课件

上传人:我*** 文档编号:142134654 上传时间:2020-08-17 格式:PPT 页数:93 大小:1.10MB
返回 下载 相关 举报
SPSS11聚类与判别课件_第1页
第1页 / 共93页
SPSS11聚类与判别课件_第2页
第2页 / 共93页
SPSS11聚类与判别课件_第3页
第3页 / 共93页
SPSS11聚类与判别课件_第4页
第4页 / 共93页
SPSS11聚类与判别课件_第5页
第5页 / 共93页
点击查看更多>>
资源描述

《SPSS11聚类与判别课件》由会员分享,可在线阅读,更多相关《SPSS11聚类与判别课件(93页珍藏版)》请在金锄头文库上搜索。

1、第11章 聚类分析与判别分析,Klassify,返回,目 录,聚类分析 两步聚类 操作 实例 快速聚类 操作 实例 分层聚类 有关公式 操作 观测量聚类实例 变量聚类实例,判别分析 判别分析 操作 实例 逐步判别分析与实例 习题及参考答案,结束,返回,各种聚类分析过程的位置,返回,两 步 聚 类,Two Step Cluster,返回,两步聚类分析主对话框,返回,两步聚类Options选择项对话框,返回,高级选择项对话框,返回,两步聚类的Plot对话框,返回,两步聚类Output对话框,返回,两步聚类实例输出1,聚类结果各类频数,返回,两步聚类实例输出2,各类的类中心,返回,两步聚类实例输出3

2、,不同类型车辆的聚类结果频数表,返回,两步聚类实例输出4,第三类中各连续变量重要性,分类变量在第一类中的重要性,返回,快 速 样 本 聚 类,K-Means Cluster QUICK CLUSTER过程,返回,K-Means Cluster Analysis主对话框,返回,两各二级对话框,选择保存新变量对话框,指定迭代参数对话框,返回,输出和缺失值选择对话框,返回,快速聚类实例输出1,初始类中心,各次迭代后类中心的变化,返回,快速聚类实例输出2,和聚类总结,最终的四类的类中心,返回,分 层 聚 类,Hierarchical Cluster,返回,尺度变量距离计算方法举例,Euclidean

3、distance(欧氏距离),Squared Euclidean distance(欧氏距离平方),返回,Pearson correlation(皮尔逊相关),计数变量对的不相似性测度的方法举例,Chi-square measure(2测度),Phi-square measure(两组频数间的2测度),返回,二值变量的距离或不相似性测度的约定,首先应该明确,对二值变量,系统默认用1表示某特性的出现(或发生、存在等), 用0表示某特性不出现(或不发生、不存在)。 (2) 对二值变量的相似性或不相似性测度都基于一个四格表。,返回,例题数据中的两个观测量及对应的四格表,返回,二值变量的距离或不相似性

4、测度方法举例,Euclidean distance,二值欧氏距离,根据四格表计算SQRT(b+c),Squared Euclidean distance,二值欧氏距离平方,Size difference,不对称指数,其值范围在01之间,Pattern difference,根据四格表计算bc/n2,Variance,方差不相似性测度,根据四格表计算(b+c)/4n,Dispersion,是一个相似性指数,返回,分层聚类分析主对话框,返回,分层聚类分析的方法选择对话框,返回,聚类方法选择”下拉菜单,返回,测度连续变量距离的方法,返回,测度二值变量距离和相似性的方法,返回,对数值进行标准化的方法选

5、择菜单,返回,选择输出统计量的对话框,返回,选择统计图表的对话框,返回,新变量选择对话框,返回,观测量聚类的实例输出1,数据信息,返回,欧氏不相似性系数平方矩阵,观测量聚类的实例输出2,返回,观测量聚类的实例输出3,共分为四类的聚类结果,返回,观测量聚类的实例输出4,冰柱图,返回,观测量聚类的实例输出5,聚类树形图 (重新标定到0-25),返回,观测量聚类的实例输出6,加入了新变量的工作数据文件,返回,观测量聚类的实例输出7,第3、5、7、9步聚类的纵向冰柱图,返回,观测量聚类的实例输出8,工作数据文件中增加了五个分类结果变量,返回,变 量 聚 类,返回,冰柱图,变量聚类的实例1输出1,变量的

6、相关矩阵,返回,变量聚类的实例1输出2,变量聚类的树形图,返回,变量聚类的实例2输出1,10个测验项目,分别用变量x1x10表示,50名学生参加测试,变量聚类的相关系数矩阵,聚为两类的类成员表,返回,变量聚类全过程的冰柱图,变量聚类的实例2输出2,返回,变量聚类的实例2输出3,0.23927 ; 0.32449 ; 0.27885 ; 0.18260 ;,选择代表变量,返回,判 别 分 析,Discriminate,返回,判别分析的主对话框,返回,指定分类变量范围的对话框,返回,判别分析方法选择对话框,返回,选择输出统计量的对话框,返回,选择分类参数与分类结果的对话框,返回,建立新变量对话框,

7、返回,判别分析实例 输出1,a,b,c,d,e,典则判别函数特征值表(包括5个表),返回,判别分析实例 输出2,原始数据的描述统计量,返回,判别分析实例 输出3,单变量方差分析结果,返回,判别分析实例 输出4,a,b,c,d,有关典则判别函数的输出,返回,判别分析实例 输出5,a,b,用判别函数对观测量分类的结果,返回,判别分析实例 输出6,预测分类结果小结,返回,判别分析实例 输出7,各类区域图及其标记说明,返回,判别分析实例 输出8,以典则判别函数为坐标的散点图之一,返回,判别分析实例 输出9,以典则判别函数为坐标的散点图,返回,判别分析实例 输出10,包含有由SAVE子命令建立的新变量数

8、据文件,返回,逐步判别分析实例 输出1,相关阵,返回,逐步判别分析实例 输出2,逐步进入模型的变量方差分析结果,返回,逐步判别分析实例 输出3,各步模型外的变量方差分析结果,返回,逐步判别分析实例 输出4,标准化的典则判别函数系数表,返回,逐步判别分析实例 输出5,各类中心的未标准化的判别函数值表,系数表,未标准化的典则判别函数,返回,逐步判别分析实例 输出6,使用逐步判别选择的变量进行线性判别分析结果,返回,逐步判别分析实例 输出7,逐步判别回代小结,返回,习题11,1. SPSS提供几种聚类分析过程?各适合什么情况的聚类? 2. 聚类分析与判别分析对数据要求有什么不同? 3. 聚类分析之前

9、一定要对变量进行标准化吗/为什么? 4. 变量聚类后如何根据聚类结果确定各类的代表变量? 5. 1976年74个国家人口出生率和死亡率数据在data11-06.xls中。将数据转换成SPSS数据文件,以相同的主名保存成.sav文件,根据出生率、死亡率聚类。绘制散点图。 6. 数据data11-07.xls中sheet1中是28名一级,25名健将级标枪运动员测验的6项影响标枪成绩的项目成绩。据此求出判别运动员等级的判别函数。回代,给出错判率。 7. 上述6个与标枪成绩有关的项目彼此是否相关?能否进行变量聚类,并找出各类中有代表性的项目(变量)? 8. 用逐步判别法再求判别函数,与用全部变量求出的

10、判别函数比较错判率。 数据data11-07.xls Sheet2中是14名未知级别的运动员。运用判别函数对他们分类。,返回,第5题参考答案,Quick Cluster,读入Excel文件,整理数据。三个变量:country、birth、death。初步想法分 4种:出生率、死亡率两个率都高、都低、出生率高、死亡率低;出生率低、死亡率高; 观测量排序不同,初始类中心不同。选择移动、不移动均值中心,聚类结果也不同。 因此这里的结果仅供参考。 也可以考虑分3种。可以多试几种情况。分类后,按类排序。比较结果,取一种比较合适的分类结果。,返回,第5题参考答案,多做几次,按类排序,根据实际情况取其一,分

11、3类的结果,返回,第5题参考答案,参考的分类结果见data11-06jg.sav,分4类的结果,返回,第6题参考答案,1.读取Excel文件,整理成SPSS数据文件。如DATA11-07.SAV 2. 操作步骤:,返回,第6题参考答案,从描述统计量表可以看出,两个级别运动员6项成绩的均值区别。从方差分析表可以看出:两级别运动员的30m跑成绩均值间差异不显著外,其他均有显著差异。根据后5项可以很好判别出运动员的等级。 其他输出表格略,返回,第6题参考答案,标准化与未标准化的典则判别函数系数表,Fisher的线性判别函数,几种类型的判别函数系数表,返回,第6题参考答案,错判率为0。判别函数可以很好

12、地判别运动员级别。,判别结果评价,返回,第7题参考答案-相关分析,五级跳和挺举重量相关系数最大,其次是前抛铅球合拍实心球。聚类过程反映了这个相关矩阵中的数据。,返回,第7题参考答案,操作简述变量聚类,返回,第7题参考答案,操作简述,返回,第7题参考答案,不同方式反映的聚类过程。 可以计算代表变量,也可以使用逐步判别解决问题。本参考答案采用后者。,变量聚类结果,返回,第8题参考答案,逐步判别操作简述,返回,第8题参考答案,单变量组均值相等的假设检验结果,说明5个变量对区分两级运动员都是有意义的。,返回,第8题参考答案,返回,第8题参考答案,标准化与未标准化的典则判别函数系数表,Fisher的线性

13、判别函数,返回,第8题参考答案,只用三个变量,判别回代结果说明只有一个健将被判为一级。错判率为4%,Dis_1是用判别函数计算的结果,蓝地单元格是错判的。 Dis1_1和Dis1_2是计算的属于第1、2类的概率,属于哪一类的概率高就判别为属于哪一类。与Dis_1的结果一致。第40观测量被错判。,判别结果评价,返回,第8题参考答案,从data11-07.xls的sheet2中复制数据,粘贴到data11-07.sav后面。 建立新变量type,已经有级别的运动员值为1,待判运动员type值为0。见图,对待判运动员的判别,返回,判别函数的应用参考答案,在主对话框中将变量type送入selection variable栏中,点击Value按钮,在相应对话框中输入1,表明用type=1的观测量进行判别分析,得出判别函数。,在classification对话框中,display栏选择: Casewise result,Limit cases to first 中输入67表示对前67个观测进行判别。(25+28+14),其他选择项同前。,返回,判别函数的应用参考答案,判别结果见编号为101114。 Dis_1值。,返回,并非客观存在的类别,是为研究目的划分的,类类类类类类,返回,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号