聚类分析的SPSS实现－金锄头文库

资源描述

《聚类分析的SPSS实现》由会员分享，可在线阅读，更多相关《聚类分析的SPSS实现（16页珍藏版）》请在金锄头文库上搜索。

1、7.5 聚类分析的 SPSS 实现一、系统聚类法的SPSS实现例 7.5.1 利用全国 30 个省市自治区经济发展基本情况的八项指标数据(见数据集wyzb6_5.),用系统聚类法对这30个省市自治区作一初步的分类，并说明各类地区经济发展的特点。操作分析(Analyze)=分类(Classify)=系统聚类(Hierarchical Cluster) 打开系统聚类分析(Hierarchical Cluster Analysis)对话框1. 变量(Variable(s)列表框设置分析变量。2. 标志个案(Label Cases by)框设置分析对象的标志变量。3. 分群(Cluster)单选

2、择框设置聚类分析的类型。4. 输出(Display)复选择框设置聚类分析的输出结果，统计量和图都是默认选项。5.统计量(Statistics)按钮设置输出的统计量。合并进程表(Agglomeration schedule)默认选项，输出聚类分析的凝聚状态表；相似性矩阵(Proximitymatrix)为复选项，输出各样品的距离矩阵。聚类成员(Cluster Menbership )选择框：无(None)选项：不显示类的样品构成；单一方案(Single solution)选项：选择此项，并输入一个确定的分类数n,并输出聚成n个类时各个类的样品构成情况。方案范围(Range of s

3、olutions)：选择此项，并输入两个数n1, n2,将显示指定聚成n1类到n2类时各个类的样品构成情况。6Plots 按钮设置输出图形：树状图冰状图S：系统聚类分析:所有聚类（巴聚类的楷定全距开姐聚类:停止聚类（巴：楼序栋准（或：|i |Q|w-右向垂现）7.Method按钮设置聚类分析的具体方法。幣助聚类方法：组间连接：类间平均法组内连接：类内平均法最近临元素：最短距离法最远临元素：最长距离法质心聚类法：重心法中位数聚类法：中位数法Ward法：离差平方和法度量方法选择框：选择计算样品距离的方法转换值选择框：选择原始数据标准化的方法Z 得分，最常用的方法8Save 按钮设置需

4、要保存的分析结果。输出结果的统计分析凝聚状态表聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集21414.33800522026.702008328291.0860014427301.5420085452.1481020617182.7990012723243.5180017820274.3802417910155.3220022103166.278001811787.35400131217228.94660231371210.5441102014252812.33603241522114.261002116111316.234001917202318.377872418192

5、02122232425262728293621.70111125.0884730.3191238.329101946.58831755.690202564.9223478.7471999.284110130.814320166.86113232.00010001651319159018121714232021026222524272823212526272528282729290第 1 列：步骤号，一共进行了29 聚类第 2 和 3 列：表示某步聚类时的哪两个样品或类进行了合并，合并后的类号为第2 列的样品或类号第 4 列：聚类时的两个样品或类间的距离第 5 和 6 列：表示某步聚类时是样品

6、还是类参与合并第 7 列：表示本步所聚成的类，再下面的第几步聚类时用到。成员表群集成员案例8群集7群集6群集5群集4群集1：北京111112：天津111113：河北222224:山西333225：内蒙333226：辽宁222227：吉林333228：黑龙江333229：上海4443110：江苏5554311：浙江1111112:安徽3332213:福建1111114:江西3332215:山东16:河南17:湖北18:湖南19:广东20:广西21：海南22:四川23:贵州24:云南25:西藏26:陕西27:甘肃28:青海29庁夏30:新疆水平冰柱图辽冏期四山1|:内古创去广愿廿新虫云西由宁

7、6:7:e2:4:4-5:7-老2-0|3-7.0:3:4:5:百宜 115* 1 k122-2J22222树状图52665716778778875222561266766776522256126666666642224512555555553222341244444444鬲10Dendrogram using Ward MethodRescaled Distance Cluster Combine啜H+1111111+11111111 +1+11111 +1+1111111Z THZ00THZco9 TH9006ZLOco oq寸 oqO9ZOCOO tHLO6 TH2TV/、/、a2 TV

8、同”、反hh底HIffllg ruw 療氐S+lt00t z 桂丽 + +1 g 脈&+I+I 寸 itsw+1 寸tsm+ EnN IQqcd骨 ON % 01结果分析：123456784类北京天津上海浙江福建海南河北山西内蒙辽宁吉林黑龙江安徽江西河南湖北湖南四川江苏山东广东广西贵州云南西藏陕西甘肃青海宁夏新疆5类北京天津浙江福建海南河北山西内蒙辽宁吉林黑龙江安徽江西河南湖北湖南四川上海江苏山东广东广西贵州云南西藏陕西甘肃青海宁夏新疆6类北京天津浙江福建海南辽宁河南湖北湖南四

9、川江西吉林黑龙江安徽山西内蒙上海江苏山东广东广西贵州云南西藏陕西甘肃青海宁夏新疆7类北京天津浙江福建海南辽宁河南湖北湖南四川江西吉林黑龙江安徽山西内蒙上海江苏山东广东广西贵州云南陕西甘肃新疆西藏青海宁夏8类北京辽宁江西上海江苏湖北广西西藏天津浙江福建海南河南吉林黑龙江安徽山西内蒙山东广东湖南四川贵州云南陕西甘肃新疆青海宁夏二、动态聚类法的 SPSS 实现在 SPSS 中，凝聚点的指定不是必须的，系统会自动根据分类数目结合样品情况来选取凝聚点。形成初始分类的方法通常有两种，一是直接将每个样品按与其距离最近的凝聚点并类，二

10、是先让每个凝聚点自成一类，将样品依此并入与其距离最近的凝聚点的一类，并计算该类的重心，以这个重心代替原来的凝聚点，再考虑下一个样品的并类，直至所有样品都归类为止。操作：分析(Analyze)= 分类(Classify) = k-均值聚类(K-Means Cluster)打开k-均值聚类分析(K-Means Cluster Analysis)对话框变量列表框：聚类数(N umber of Clusters)输入框输入指定的聚类数目。1.迭代(Iterate)按钮设置快速聚类的迭代终止条件。2.保存（Save）按钮设置需要保存的分析结果。3.选项（Options）按钮选择快速聚类的输出结果，并指定对缺失数据的处理方法。输出结果的统计分析凝聚点表InitiaLClusterCentersCluster123456GDP5381.7255.982849.525002.34630.072462.57居民消费水平26991110125815279425343固定资产投资1639.8317.87704.871229.55150.84996.48职工平均工资825073824839514544759279货物周转量656.504.20203

展开阅读全文

聚类分析的SPSS实现

最新文档