聚类分析的SPSS实现

上传人:壹****1 文档编号:561996930 上传时间:2022-11-30 格式:DOCX 页数:16 大小:273.13KB
返回 下载 相关 举报
聚类分析的SPSS实现_第1页
第1页 / 共16页
聚类分析的SPSS实现_第2页
第2页 / 共16页
聚类分析的SPSS实现_第3页
第3页 / 共16页
聚类分析的SPSS实现_第4页
第4页 / 共16页
聚类分析的SPSS实现_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《聚类分析的SPSS实现》由会员分享,可在线阅读,更多相关《聚类分析的SPSS实现(16页珍藏版)》请在金锄头文库上搜索。

1、7.5 聚类分析的 SPSS 实现一、系统聚类法的SPSS实现例 7.5.1 利用全国 30 个省市自治区经济发展基本情况的八项指标数 据(见数据集wyzb6_5.),用系统聚类法对这30个省市自治区作一初 步的分类,并说明各类地区经济发展的特点。操作分析(Analyze)=分类(Classify)=系统聚类(Hierarchical Cluster) 打开系统聚类分析(Hierarchical Cluster Analysis)对话框1. 变量(Variable(s)列表框设置分析变量。2. 标志个案(Label Cases by)框 设置分析对象的标志变量。3. 分群(Cluster)单选

2、择框设置聚类分析的类型。4. 输出(Display)复选择框 设置聚类分析的输出结果,统计量和 图都是默认选项。5.统计量(Statistics)按钮 设置输出的统计量。合并进程表(Agglomeration schedule)默认选项,输出聚类分析的 凝聚状态表;相似性矩阵(Proximitymatrix)为复选项,输出各样品的距离矩阵。 聚类成员(Cluster Menbership )选择框:无(None)选项:不显示类的样品构成;单一方案(Single solution)选项:选择此项,并输入一个确 定的分类数n,并输出聚成n个类时各个类的样品构成 情况。方案范围(Range of s

3、olutions):选择此项,并输入两个数n1, n2,将显示指定聚成n1类到n2类时各个类的样品构成 情况。6Plots 按钮 设置输出图形:树状图 冰状图S:系统聚类分析:所有聚类(巴聚类的楷定全距开姐聚类:停止聚类(巴:楼序栋准(或:|i |Q|w-右向垂现)7.Method按钮设置聚类分析的具体方法。幣助聚类方法:组间连接:类间平均法 组内连接:类内平均法最近临元素:最短距离法 最远临元素:最长距离法质心聚类法:重心法 中位数聚类法:中位数法Ward法:离差平方和法度量方法选择框:选择计算样品距离的方法转换值选择框:选择原始数据标准化的方法Z 得分,最常用的方法8Save 按钮 设置需

4、要保存的分析结果。 输出结果的统计分析凝聚状态表聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集21414.33800522026.702008328291.0860014427301.5420085452.1481020617182.7990012723243.5180017820274.3802417910155.3220022103166.278001811787.35400131217228.94660231371210.5441102014252812.33603241522114.261002116111316.234001917202318.377872418192

5、02122232425262728293621.70111125.0884730.3191238.329101946.58831755.690202564.9223478.7471999.284110130.814320166.86113232.00010001651319159018121714232021026222524272823212526272528282729290第 1 列:步骤号,一共进行了29 聚类第 2 和 3 列:表示某步聚类时的哪两个样品或类进行了合并,合 并后的类号为第2 列的样品或类号第 4 列:聚类时的两个样品或类间的距离第 5 和 6 列:表示某步聚类时是样品

6、还是类参与合并第 7 列:表示本步所聚成的类,再下面的第几步聚类时用到。 成员表群集成员案例8群集7群集6群集5群集4群集1:北京111112:天津111113:河北222224:山西333225:内蒙333226:辽宁222227:吉林333228:黑龙江333229:上海4443110:江苏5554311:浙江1111112:安徽3332213:福建1111114:江西3332215:山东16:河南17:湖北18:湖南19:广东20:广西21:海南22:四川23:贵州24:云南25:西藏26:陕西27:甘肃28:青海29庁夏30:新疆 水平冰柱图辽冏期四山1|:内古创去广愿廿新虫云西由宁

7、6:7:e2:4:4-5:7-老2-0|3-7.0:3:4:5:百宜 115* 1 k122-2J22222树状图52665716778778875222561266766776522256126666666642224512555555553222341244444444鬲10Dendrogram using Ward MethodRescaled Distance Cluster Combine啜H+1111111+11111111 +1+11111 +1+1111111Z THZ00THZco9 TH9006ZLOco oq寸 oqO9ZOCOO tHLO6 TH2TV/、/、a2 TV

8、 同”、反hh底HIffllg ruw 療氐S+lt00t z 桂丽 + +1 g 脈&+I+I 寸 itsw+1 寸tsm+ EnN IQqcd骨 ON % 01结果分析:123456784类北京 天津 上海 浙江 福建 海南河北 山西 内蒙 辽宁 吉林 黑龙江 安徽 江西 河南 湖北 湖南 四川江苏 山东 广东广西 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆5类北京 天津 浙江 福建 海南河北 山西 内蒙 辽宁 吉林 黑龙江 安徽 江西 河南 湖北 湖南四川上海江苏 山东 广东广西 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆6类北京 天津 浙江 福建 海南辽宁 河南 湖北 湖南 四

9、川江西 吉林 黑龙江 安徽 山西 内蒙上海江苏山东广东广西 贵州 云南 西藏 陕西 甘肃 青海 宁夏新疆7类北京 天津 浙江 福建海南辽宁 河南 湖北 湖南四川江西 吉林 黑龙江 安徽 山西内蒙上海江苏山东广东广西 贵州 云南 陕西 甘肃 新疆西藏青海宁夏8类北京辽宁江西上海江苏湖北广西西藏天津 浙江 福建海南河南吉林 黑龙江 安徽 山西内蒙山东广东湖南四川贵州 云南 陕西 甘肃 新疆青海宁夏二、动态聚类法的 SPSS 实现在 SPSS 中,凝聚点的指定不是必须的,系统会自动根据分类数目 结合样品情况来选取凝聚点。形成初始分类的方法通常有两种,一是直接将每个样品按与其距离最 近的凝聚点并类,二

10、是先让每个凝聚点自成一类,将样品依此并入与 其距离最近的凝聚点的一类,并计算该类的重心,以这个重心代替原 来的凝聚点,再考虑下一个样品的并类,直至所有样品都归类为止。操作:分析(Analyze)= 分类(Classify) = k-均值聚类(K-Means Cluster)打开k-均值聚类分析(K-Means Cluster Analysis)对话框变量列表框 :聚类数(N umber of Clusters)输入框输入指定的聚类数目。1.迭代(Iterate)按钮设置快速聚类的迭代终止条件。2.保存(Save)按钮 设置需要保存的分析结果。3.选项(Options)按钮 选择快速聚类的输出结果,并指定对缺失 数据的处理方法。输出结果的统计分析凝聚点表InitiaLClusterCentersCluster123456GDP5381.7255.982849.525002.34630.072462.57居民消费水平26991110125815279425343固定资产投资1639.8317.87704.871229.55150.84996.48职工平均工资825073824839514544759279货物周转量656.504.20203

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号