聚类分析最新版本ppt课件

上传人:资****亨 文档编号:141242862 上传时间:2020-08-05 格式:PPT 页数:34 大小:561KB
返回 下载 相关 举报
聚类分析最新版本ppt课件_第1页
第1页 / 共34页
聚类分析最新版本ppt课件_第2页
第2页 / 共34页
聚类分析最新版本ppt课件_第3页
第3页 / 共34页
聚类分析最新版本ppt课件_第4页
第4页 / 共34页
聚类分析最新版本ppt课件_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《聚类分析最新版本ppt课件》由会员分享,可在线阅读,更多相关《聚类分析最新版本ppt课件(34页珍藏版)》请在金锄头文库上搜索。

1、.,聚类和聚类分析,指导老师:任俊玲 成员:宋小舟 金铭 胡锐豪 程亚兵,.,目录,1.聚类的概念 2.聚类分析的原理 3.聚类分析的分类 4.距离和相似系数 5.系统聚类分析 6.快速聚类 7.致谢,.,什么是聚类,早在孩提时代,人就通过不断改进下意识中的聚类模式来学会如何区分猫和狗,动物和植物,.,什么是聚类,聚类(Clustering)就是将数据分组成为多个类(Cluster)。在同一个类内对象之间具有较高的相似度,不同类之间的对象差别较大。,.,聚类分析的原理,聚类分析的基本原理:我们分析的样本或指标之间存在着程度不同的相似性(亲疏关系)。,.,聚类分析法的分类,Q型聚类分析是对样本进

2、行分类处理的 R 型聚类分析是对变量(指标)进行分类处理的。,R型聚类分析的特点,(1) R型聚类分析不但可以了解个别变量之间的亲疏程度,而且可以了解各个变量组合之间的亲疏程度。 (2)根据变量的分类结果以及它们之间的关系,可以选择主要变量进行回归分析。,.,Q型聚类分析的特点,(1)可以综合利用多个变量的信息对样本进行分类。 (2)分类结果是直观的,聚类谱系图非常清楚地表现其数值分类结果。 (3)聚类分析所得到的结果比传统的分类方法更细致,全面,合理。,.,聚类分析的分类,.,距离和相似系数,为了将样品(或指标)进行分类,就需要研究样品之间关系。 目前用得最多的方法有两个: 一种方法:相似系

3、数; 另一种方法:距离 ;,.,距离的定义方式,绝对值距离 欧氏(Euclidean)距离 切比雪夫(Chebychev)距离 明氏(Minkowski)距离,.,相似系数,夹角余弦 Pearson相关系数 指数相似系数,.,系统聚类分析的原理,于是根据一批样本的多个观测指标,具体找出一些能够度量样本或指标之间相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样本(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样本(或指标)又聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到所有的样本(或指标)都聚合完毕,.,把不同的类型一一划分出来

4、,形成一个由小到大的分类系统,最后在把所有的样品(或指标)间的亲疏关系表示出来,这种方法称为系统聚类分析法,把,.,系统聚类的基本步骤,构造n个类,每个类包含且只包含一个样品。 计算n个样品两两间的距离,构成距离矩阵,记作D0。 合并距离最近的两类为一新类。 计算新类与当前各类的距离。若类的个数等于1,转到步骤(5),否则回到步骤(3)。 画聚类图。 决定类的个数,及各类包含的样品数,并对类作出解释。,.,系统聚类(Hierarchical clustering),最短距离法(single linkage) 最长距离法(complete linkage) 中间距离法(median method

5、) 可变距离法(flexible median) 重心法(centroid) 类平均法(average) 可变类平均法(flexible average) Ward最小方差法(Wards minimum variance),.,类间距离,S1,S3,S2,S4,S5,最短距离(single linkage),.,最长距离(complete linkage),类间距离,S1,S3,S4,S5,.,类间距离,S1,S3,S2,S4,S5,重心间距离(centroid),.,类间距离,S1,S3,S2,S4,S5,平均距离(average),.,类间距离,S1,S3,S2,S4,S5,最短距离,.,

6、例 6个不同民族的标化死亡率与出生时的期望寿命,.,各民族之间的欧氏距离(标准化资料)D0,.,D1,.,D2,.,D3,.,D4,.,例 资料的谱系聚类图(最短距离法),藏族 哈萨克族 维吾尔族 朝鲜族 蒙古族 满族,Dendrograms (cluster trees),0.311,0.406,0.532,1.202,1.448,.,例 资料的谱系聚类图(最长距离法),藏族 哈萨克族 维吾尔族 朝鲜族 蒙古族 满族,Dendrograms (cluster trees),0.311,0.422,0.526,1.732,3.570,.,8种系统聚类法所得聚类图,.,快速聚类,.,计算每个点的密度(半径=d),.,确定初始凝聚点,初始分类,.,调整重心,修改分类,.,谢谢,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号