聚类分析实验

上传人:公**** 文档编号:473110238 上传时间:2022-11-02 格式:DOCX 页数:9 大小:32.42KB
返回 下载 相关 举报
聚类分析实验_第1页
第1页 / 共9页
聚类分析实验_第2页
第2页 / 共9页
聚类分析实验_第3页
第3页 / 共9页
聚类分析实验_第4页
第4页 / 共9页
聚类分析实验_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《聚类分析实验》由会员分享,可在线阅读,更多相关《聚类分析实验(9页珍藏版)》请在金锄头文库上搜索。

1、用数据文件World95.sav做实例分析。例1:系统聚类法为了研究亚洲国家或地区的经济发展和文化教育水平,以便对亚洲国家和地区进行分类研究,进行聚类分析。第一步:首先要选出亚洲国家或地区,使用数据一选择个案 选择如果条件满足一输入region=3,之后确定就可以了,这样我们将亚洲国家或区域选择了出来。接下类就正式进行聚类分析。第二步:选择在菜单选项中选择分析一分类一选择系统聚类分析第三步:在系统聚类法中,我们看到在 分群下有两个选项,个案(样品聚类或 Q型分类) 和变量(变量聚类或R型聚类)这里选择样品聚类(个案)。在输出下有统计量与图,这里都进行选择。第四步:在数据文件中,选择的变量有 U

2、rban,Lifeexpf,Lifeexpm,Literacy,Gdp-cap ;在标注个案中选择Country来标识本例中的17个亚洲国家或地区,并以其他5个变量进行 Q型聚类分析,即对国家或地区进行聚类。第五步:在系统聚类中有四个按钮。首先在方法中的聚类方法中选择组内联结法,在度量标准中选择平方欧氏距离,在转换值 的标准化中选择Z得分。点击继续接下来选择统计量,选择合并进程表与相似性矩阵,继续。之后在绘制中选择树状图,继续即可。最后点击确定。第六步:输出分析表1表示接近度矩阵,是反映样品之间相似性或者相异性的矩阵。 本例中由于计算使用的是平方欧氏距离,所以样品间距越大,样品越相异,从矩阵中

3、可以看出,孟加拉国(Bangladesh)与柬埔寨(Cambodia的距离最小,那么他俩先聚为一类。表1案例Afghanis tan4:China5:Hong Kong6:India7:Indone a2:Banglade sh3:CambodiaAfghanis tan.0001.586.96915.50038.7435.03210/2:Banglade sh1.586.000.1467.77728.0221.2115.(3:Cambodia.969.146.0009.39431.0801.9516/4:China15.5007.7779.394.00012.6752.975.(5:Hong

4、 Kong38.74328.02231.08012.675.00019.38914.46:India5.0321.2111.9512.97519.389.0001,7:Indonesi a10.8755.0546.159.62314.5781.424.(8:Japan46.57234.83837.82715.9671.85425.08818.;9:Malaysia17.1619.27611.024.6178.2223.8751/10:N. Korea23.36814.80616.8232.2598.1377.6362.11:Pakista n3.843.7361.4385.29820.958.

5、5223,12:Philippines15.7688.89310.343.80611.3573.655.(13:S. Korea26.24717.44019.6534.3173.7349.8835.(14:Singapo re39.89829.57132.51313.585.29920.56315.(15:Taiwan30.02819.86222.4474.8892.56411.6666J16:Thailand18.41910.35711.824.55412.7814.8021/17:Vietnam14.6167.6668.893.42115.2603.102这是一个不相似矩阵表2反映每一阶段

6、聚类的结果,比如第一阶段时第二个样品(孟加拉国)与第三个样品(柬 埔寨)聚为一类,注意这时有16类,因此某阶段的分类数等于总的样品数减去这个阶段的 序号。接下来的分析可根据表4自行思考。聚类表群集组合系数首次出现阶群集下一阶群集1群集2群集1群集2123.146001021617.2940053514.299001241315.39000115416.4230276611.5220013747.5735098912.595009949.72378141012.90101131110131.039041412581.262301513161.74410616144102.141911151545

7、5.694141216161410.00013150表3是聚合系数随分类数变化的曲线,由图可以看出,当分类数为 3或4时,曲线变得比较平 缓,这个分类也符合我们的目的。表3表4是树状聚类图,从图中可以有分类个数得到分类情况,如果我们选择分类数为3,就从距离为10的地方往下切,得到分类如下:1类2, 3, 1, 6, 11, 2类5, 14, 8, 3类16 , 17, 4, 7, 9, 12, 13, 15, 10我们可以从经济发展水平和文化教育水平来理解所做的分 类,第2类所代表的国家应该是亚洲经济发达程度最高的国家或地区,第1类的经济水平和文化水平都比较低,第三类国家或地区的经济水平和文化

8、水平居中。表4表5也是反映样品聚类情况的图,如果按照设定的分类,在那类的行上从左到右就可以找 到各类所包含的样品。表5例2:快速聚类还是用World95.sav的数据,从中筛选出亚洲国家或地区试图将亚洲国家或地区按经济和文化水平分为三类,使用快速聚类法。第一步:与例1相同。第二部:选择在菜单选项中选择分析一分类一选择K-均值聚类分析。第三步:在数据文件中,选择的变量有Urban,Lifeexpf,Lifeexpm,Literacy,Gdp-cap ;在标注个案中选择Country来标识本例中的17个亚洲国家或地区,并以其他5个变量进行Q型聚类分析,即对国家或地区进行聚类。将分类数指定为3,在选

9、项中选择统计量中的:初始聚类中心,ANOV聚,每个个案的聚类信息。输出分析:表6表小最初各类的重心,也就是种子点,初始聚类中心聚类123People living in cities (%)187771Average female life expectancy448278Average male life expectancy457672People who read (%)299991Gross domestic product / capita205198607055表7时样品的分类情况,我们看到快速聚类发将亚洲国家或地区分为三类,1 类1 , 8, 19, 24, 50, 51, 66

10、, 69, 76, 80, 98, 1082类47, 57, 893类86, 96, 我们可以对分类结果进行分析,第一类国家或地区经济和文教卫生水平较低,第二类国家 或地区时亚洲国家或地区的佼佼者,其经济和文教卫生水平都有很高,第三类国家或地区 处于两者之间。我们可以结合表8来分析,可以看到,第二类的人均 GDP匕另外两组高。聚类成员案例号country聚类距离1Afghanist1571.615an8Banglades1573.924h19Cambodia1516.22924 dChina1398.151i47Hong Kong21856.03m6e50 nIndia1500.047s51

11、iIndonesia194.543057Japan23363.04n5066Malaysia12220.27469N. Korea1230.06976Pakistan1370.16580Philippin196.542es86S. Korea3214.03489Singapore21507.03396Taiwan3214.03498Thailand11025.608108Vietnam1545.396表8最终聚类中心聚类123People living in cities (%)299072Average female life expectancy638076Average male lif

12、e expectancy607570People who read (%)668894Gross domestic product / capita775164976841表9是方差分析表,通过方差分析可看出有4个变量对分类贡献显着ANOVA聚类误差FSig.dfdfPeople living in cities (%)5336.4882169.5771431.469.000Average female life expectancy454.600270.494146.449.010Average male life expectancy321.326241.113147.816.005People who read (%)1073.0962570.625141.881.189Gross domestic product / capita3.042E821780295.69014170.846.000F检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差 别。观测到的显着性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这 一假设的检验。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 营销创新

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号