SPSS11 聚类与判别 SPSS for Windows统计分析

上传人:飞*** 文档编号:51434514 上传时间:2018-08-14 格式:PPT 页数:93 大小:1.58MB
返回 下载 相关 举报
SPSS11 聚类与判别  SPSS for Windows统计分析_第1页
第1页 / 共93页
SPSS11 聚类与判别  SPSS for Windows统计分析_第2页
第2页 / 共93页
SPSS11 聚类与判别  SPSS for Windows统计分析_第3页
第3页 / 共93页
SPSS11 聚类与判别  SPSS for Windows统计分析_第4页
第4页 / 共93页
SPSS11 聚类与判别  SPSS for Windows统计分析_第5页
第5页 / 共93页
点击查看更多>>
资源描述

《SPSS11 聚类与判别 SPSS for Windows统计分析》由会员分享,可在线阅读,更多相关《SPSS11 聚类与判别 SPSS for Windows统计分析(93页珍藏版)》请在金锄头文库上搜索。

1、第11章 聚类分析与判别分析 Klassify返回目 录聚类分析 v两步聚类 q 操作 q 实例 v快速聚类 q 操作 q 实例 v分层聚类 q有关公式q操作q观测量聚类实例 q变量聚类实例判别分析v 判别分析操作实例 逐步判别分析与实例v 习题及参考答案v结束返回各种聚类分析过程的位置 返回两 步 聚 类Two Step Cluster返回两步聚类分析主对话框 返回两步聚类Options选择项对话框 返回高级选择项对话框 返回两步聚类的Plot对话框 返回两步聚类Output对话框 返回两步聚类实例输出1聚类结果各类频数返回两步聚类实例输出2各类的类中心 返回两步聚类实例输出3不同类型车辆的

2、聚类结果频数表返回两步聚类实例输出4第三类中各连续变量重要性分类变量在第一类中的重要性返回快 速 样 本 聚 类 K-Means Cluster QUICK CLUSTER过程 返回K-Means Cluster Analysis主对话框 返回两各二级对话框选择保存新变量对话框指定迭代参数对话框返回输出和缺失值选择对话框 返回快速聚类实例输出1 初始类中心 各次迭代后类中心的变化 返回快速聚类实例输出2和聚类总结最终的四类的类中心返回分 层 聚 类 Hierarchical Cluster 返回尺度变量距离计算方法举例Euclidean distance(欧氏距离) Squared Eucli

3、dean distance(欧氏距离平方) 返回Pearson correlation(皮尔逊相关) 计数变量对的不相似性测度的方法举例 Chi-square measure(2测度) Phi-square measure(两组频数间的2测度) 返回二值变量的距离或不相似性测度的约定 (1)首先应该明确,对二值变量,系统默认用1表示某特性的出现(或发生、存在等), 用0表示某特性不出现(或不发生、不存在)。 (2) 对二值变量的相似性或不相似性测度都基于一个四格表。第二特性第一特性发生不发生 发生ab不发生cd返回例题数据中的两个观测量及对应的四格表 分析变量 观测量号 VWXYZ101101

4、201100第二特性发生不发生第 一 特 性发生a=2b=1不发生c=0d=2返回二值变量的距离或不相似性测度方法举例 Euclidean distance,二值欧氏距离 根据四格表计算SQRT(b+c) Squared Euclidean distance,二值欧氏距离平方 Size difference,不对称指数,其值范围在01之间 Pattern difference 根据四格表计算bc/n2 Variance,方差不相似性测度 根据四格表计算(b+c)/4n Dispersion,是一个相似性指数 返回分层聚类分析主对话框 返回分层聚类分析的方法选择对话框 返回聚类方法选择”下拉菜单

5、返回测度连续变量距离的方法 返回测度二值变量距离和相似性的方法 返回对数值进行标准化的方法选择菜单返回选择输出统计量的对话框 返回选择统计图表的对话框 返回新变量选择对话框 返回观测量聚类的实例输出1 数据信息 返回欧氏不相似性系数平方矩阵观测量聚类的实例输出2返回观测量聚类的实例输出3共分为四类的聚类结果返回观测量聚类的实例输出4冰柱图返回观测量聚类的实例输出5聚类树形图(重新标定到0-25)返回观测量聚类的实例输出6加入了新变量的工作数据文件返回观测量聚类的实例输出7第3、5、7、9步聚类的纵向冰柱图返回观测量聚类的实例输出8工作数据文件中增加了五个分类结果变量返回变 量 聚 类 返回冰柱

6、图变量聚类的实例1输出1变量的相关矩阵返回变量聚类的实例1输出2变量聚类的树形图返回变量聚类的实例2输出110个测验项目,分别用变量x1x10表示,50名学生参加测试 变量聚类的相关系数矩阵 聚为两类的类成员表 返回变量聚类全过程的冰柱图变量聚类的实例2输出2返回变量聚类的实例2输出30.23927 ;0.32449 ;0.27885 ;0.18260 ; 选择代表变量返回判 别 分 析Discriminate 返回判别分析的主对话框 返回指定分类变量范围的对话框 返回判别分析方法选择对话框 返回选择输出统计量的对话框 返回选择分类参数与分类结果的对话框 返回建立新变量对话框 返回判别分析实例

7、 输出1abcde 典则判别函数特征值表(包括5个表)返回判别分析实例 输出2原始数据的描述统计量 返回判别分析实例 输出3单变量方差分析结果返回判别分析实例 输出4abcd有关典则判别函数的输出 返回判别分析实例 输出5ab用判别函数对观测量分类的结果返回判别分析实例 输出6预测分类结果小结返回判别分析实例 输出7各类区域图及其标记说明返回判别分析实例 输出8以典则判别函数为坐标的散点图之一 返回判别分析实例 输出9以典则判别函数为坐标的散点图返回判别分析实例 输出10包含有由SAVE子命令建立的新变量数据文件返回逐步判别分析实例 输出1相关阵返回逐步判别分析实例 输出2逐步进入模型的变量方

8、差分析结果返回逐步判别分析实例 输出3各步模型外的变量方差分析结果返回逐步判别分析实例 输出4标准化的典则判别函数系数表返回逐步判别分析实例 输出5各类中心的未标准化的判别函数值表 系数表未标准化的典则判别函数返回逐步判别分析实例 输出6使用逐步判别选择的变量进行线性判别分析结果返回逐步判别分析实例 输出7逐步判别回代小结返回习题111. SPSS提供几种聚类分析过程?各适合什么情况的聚类? 2. 聚类分析与判别分析对数据要求有什么不同? 3. 聚类分析之前一定要对变量进行标准化吗/为什么? 4. 变量聚类后如何根据聚类结果确定各类的代表变量? 5. 1976年74个国家人口出生率和死亡率数据

9、在data11-06.xls中。将数据转换 成SPSS数据文件,以相同的主名保存成.sav文件,根据出生率、死亡率聚类 。绘制散点图。 6. 数据data11-07.xls中sheet1中是28名一级,25名健将级标枪运动员测验的6 项影响标枪成绩的项目成绩。据此求出判别运动员等级的判别函数。回代, 给出错判率。 7. 上述6个与标枪成绩有关的项目彼此是否相关?能否进行变量聚类,并找 出各类中有代表性的项目(变量)? 8. 用逐步判别法再求判别函数,与用全部变量求出的判别函数比较错判率。数据data11-07.xls Sheet2中是14名未知级别的运动员。运用判别函数对他们 分类。返回第5题

10、参考答案Quick Cluster读入Excel文件,整理数据。三个变量:country、birth、death。初步想法分 4种:出生率 、死亡率两个率都高、都低、出生率高、死亡率低;出生率低、死亡率高;观测量排序不同,初始类中心不同。选择移动、不移动均值中心,聚类结果也不同。因此这里的结果仅供参考。也可以考虑分3种。可以多试几种情况。分类后,按类排序。比较结果,取一种比较合适 的分类结果。返回第5题参考答案多做几次,按类排序,根据实际情况取其一分3类的结果返回第5题参考答案参考的分类结果见data11-06jg.sav分4类的结果返回第6题参考答案1.读取Excel文件,整理成SPSS数据

11、文件。如DATA11-07.SAV2. 操作步骤:返回第6题参考答案从描述统计量表可以看出,两个级别运动员6项成绩的均值区别。从方差 分析表可以看出:两级别运动员的30m跑成绩均值间差异不显著外,其他 均有显著差异。根据后5项可以很好判别出运动员的等级。其他输出表格略返回第6题参考答案标准化与未标准化的典则判别函数系数表Fisher的线性判别函数几种类型的判别函数系数表 返回第6题参考答案错判率为0。判别函数可以很好地判别运动员级别。判别结果评价返回第7题参考答案-相关分析五级跳和挺举重量相关系数最大,其次是前抛铅球合拍实心球。聚类过程反映 了这个相关矩阵中的数据。返回第7题参考答案操作简述变

12、量聚类返回第7题参考答案操作简述返回第7题参考答案不同方式反映的聚类 过程。可以计算代表变量, 也可以使用逐步判别 解决问题。本参考答 案采用后者。变量聚类结果返回第8题参考答案逐步判别操作简述返回第8题参考答案单变量组均值相等的假设检验结果,说 明5个变量对区分两级运动员都是有意 义的。返回第8题参考答案返回第8题参考答案标准化与未标准化的典则判别函数系数表Fisher的线性判别函数返回第8题参考答案只用三个变量,判别回代结果说明只 有一个健将被判为一级。错判率为4%Dis_1是用判别函数计算的结果,蓝地单元格是 错判的。Dis1_1和Dis1_2是计算的属于第1、2类的概率, 属于哪一类的

13、概率高就判别为属于哪一类。与 Dis_1的结果一致。第40观测量被错判。判别结果评价返回第8题参考答案从data11-07.xls的sheet2中复制数据,粘贴到data11 -07.sav后面。建立新变量type,已经有级别的运动员值为1,待 判运动员type值为0。见图对待判运动员的判别返回判别函数的应用参考答案在主对话框中将变量type送入selection variable 栏中,点击Value按钮,在相应对话框中输入1 ,表明用type=1的观测量进行判别分析,得出 判别函数。在classification对话框中,display栏选择:Casewise result,Limit cases to first 中输入67表 示对前67个观测进行判别。(25+28+14) 其他选择项同前。返回判别函数的应用参考答案判别结果见编号为101114。 Dis_1值。返回并非客观存在的类别是为研究目的划分的类类类类类类返回

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号