模糊C均值聚类算法及实现

上传人:hs****ma 文档编号:477175378 上传时间:2022-12-05 格式:DOC 页数:8 大小:186.50KB
返回 下载 相关 举报
模糊C均值聚类算法及实现_第1页
第1页 / 共8页
模糊C均值聚类算法及实现_第2页
第2页 / 共8页
模糊C均值聚类算法及实现_第3页
第3页 / 共8页
模糊C均值聚类算法及实现_第4页
第4页 / 共8页
模糊C均值聚类算法及实现_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《模糊C均值聚类算法及实现》由会员分享,可在线阅读,更多相关《模糊C均值聚类算法及实现(8页珍藏版)》请在金锄头文库上搜索。

1、模糊C均值聚类算法及实现摘要:模糊聚类是一种重要数据分析和建模的无监督措施。本文对模糊聚类进行了概述,从理论和实验方面研究了模糊c均值聚类算法,并对该算法的长处及存在的问题进行了分析。该算法设计简朴,应用范畴广,但仍存在容易陷入局部极值点等问题,还需要进一步研究。核心词:模糊c均值算法;模糊聚类;聚类分析Fuzzy c-MeansClustri Algorith nd IplementatinAbtrat:Fuzy custerig is a powerfu unupervi mthd for tanalysis of dta ncotrction omode.Thisaprprsna eew

2、 o fuzzy custriga do soe tudy offuc-mans clsten lgrithmi ems of theor nd exprimethis agrimis siple nesi,an e idely d,buteere ll som problem in,and tereore,i is nessary to betdie frhr.eywords: fu cMen aloritm;fzclusring;cluerin analysi 引言2世纪9年代以来,随着信息技术和数据库技术的迅猛发展,人们可以非常以便地获取和存储大量的数据。但是,面对大规模的数据,老式的数

3、据分析工具只能进行某些表层的解决,例如查询、记录等,而不能获得数据之间的内在关系和隐含的信息。为了挣脱“数据丰富,知识贫乏”的困境,人们迫切需要一种可以智能地、自动地把数据转换成有用信息和知识的技术和工具,这种对强有力数据分析工具的迫切需求使得数据挖掘技术应运而生。将物理或抽象对象的集合分构成由类似的对象构成的多种类的过程称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一种簇中的对象彼此相似,与其他簇中的对象相异。聚类是一种重要的数据分析技术,搜索并且辨认一种有限的种类集合或簇集合,进而描述数据。聚类分析作为记录学的一种分支,己经被广泛研究了许近年。并且,聚类分析也已经广泛地应用到

4、诸多领域中,涉及数据分析、模式辨认、图像解决以及市场研究1。通过聚类,人们可以辨认密集的和稀疏的区域,因而发现全局的分布模式,以及数据属性之间的有趣的互相关系。在商务上,聚类能协助市场分析人员从客户基本信息库中发现不同的客户群,并且用购买模式来刻画不同的客户群的特性。在生物学上,聚类能用于推导植物和动物的分类,对基因进行分类,获得对种群中固有构造的结识。聚类在地球观测数据库中相似地区的拟定,汽车保险单持有者的分组,及根据房屋的类型、价值和地理位置对一种都市中房屋的分组上也可以发挥作用。聚类也能用于对Web上的文档进行分类,以发现信息。基于层次的聚类算法文献中最早浮现的ingeLinkag层次聚

5、类算法是195年在loyd的文章中最早浮现的,之后MacQuen独立提出了典型的模糊C均值聚类算法,FC算法中模糊划分的概念最早来源于Rspini的文章中,但有关CM的算法的具体的分析与改善则是由Dun和Bezdk完毕的。聚类分析是多元记录分析的一种,也是非监督模式辨认的一种重要分支,在模式分类、图像解决和模糊规则解决等众多领域中获得最广泛的应用。它把一种没有类别标记的样本集按某种准则划分为若干个子集(类) ,使相似的样本尽量的归为一类,而将不相似的样本尽量划分到不同的类中。硬聚类把每个待辨识的对象严格地划分到某类中,具有非此即彼的性质,模糊聚类由于可以描述样本类属的中介性,可以客观地反映现实

6、世界,已逐渐成为聚类分析的主流 2- 。在众多的模糊聚类算法中,模糊c均值聚类算法(FCM)应用最为广泛。它按照某种鉴别准则,将数据的聚类转化为一种非线性优化问题,并通过迭代来进行求解,目前已成为非监督模式辨认的一种重要分支。数据挖掘中的聚类分析重要集中在针对海量数据的有一效和实用的聚类措施研究,聚类措施的可伸缩性,高维聚类分析,分类属性数据聚类和具有混合属性数据的聚类,非距离模糊聚类等。因此,数据挖掘对聚类分析有其特殊的规定;可伸缩性,可以解决不同类型属性,强抗噪性,高维性,对输入顺序不敏感性,可解释性和可用性等。本文正是在此背景下对数据挖掘中的聚类分析进行论述,并着重研究了FM算法。2 模

7、糊聚类算法2.1 模糊聚类算法概述模糊聚类算法是一种基于函数最优措施的聚类算法,使用微积分计算技术求最优代价函数。在基于概率算法的聚类措施中将使用概率密度函数,为此要假定合适的模型,模糊聚类算法的向量可以同步属于多种聚类,从而挣脱上述问题。在模糊聚类算法中,定义了向量与聚类之间的近邻函数,并且聚类中向量的从属度由从属函数集合提供。对模糊措施而言,在不同聚类中的向量从属函数值是互相关联的。硬聚类可以当作是模糊聚类措施的一种特例。22 模糊聚类算法的分类模糊聚类分析算法大体可分为三类4: 1)分类数不定,根据不同规定对事物进行动态聚类,此类措施是基于模糊等价矩阵聚类的,称为模糊等价矩阵动态聚类分析

8、法。 )分类数给定,寻找出对事物的最佳分析方案,此类措施是基于目的函数聚类的,称为模c均值聚类。3)在摄动故意义的状况下,根据模糊相似矩阵聚类,此类措施称为基于摄动的模糊聚类分析法。3模糊均值(FCM)聚类算法.1算法描述模糊c均值聚类算法的环节还是比较简朴的,模糊c均值聚类(FCM),即众所周知的模糊SDATA,是用从属度拟定每个数据点属于某个聚类的限度的一种聚类算法。19年,Bezdk提出了该算法,作为初期硬均值聚类(H)措施的一种改善。FCM把n个向量xi(=,,,n)分为个模糊组,并求每组的聚类中心,使得非相似性指标的价值函数达到最小。FCM与HCM的重要区别在于FCM用模糊划分,使得

9、每个给定数据点用值在0,1间的从属度来拟定其属于各个组的限度。与引入模糊划分相适应,从属矩阵U容许有取值在0,1间的元素。但是,加上归一化规定,一种数据集的从属度的和总等于: (3.1)那么,FM的价值函数(或目的函数)就是:, (.2)这里ij介于0,1间;i为模糊组I的聚类中心,dij|ci-j|为第个聚类中心与第j个数据点间的欧几里德距离;且是一种加权指数。构造如下新的目的函数,可求得使(3)式达到最小值的必要条件: (3.3)这里l,j=1到,是(31)式的n个约束式的拉格朗日乘子。对所有输入参量求导,使式(3.)达到最小的必要条件为: (3.)和 (3.5)由上述两个必要条件,模糊c

10、均值聚类算法是一种简朴的迭代过程。在批解决方式运营时,FCM用下列环节拟定聚类中心i和从属矩阵U1:环节1:用值在,1间的随机数初始化从属矩阵,使其满足式(31)中的约束条件环节2:用式(3.4)计算c个聚类中心c,i1,,c。环节3:根据式(3.2)计算价值函数。如果它不不小于某个拟定的阀值,或它相对上次价值函数值的变化量不不小于某个阀值,则算法停止。环节4:用(.)计算新的U矩阵。返回环节2。上述算法也可以先初始化聚类中心,然后再执行迭代过程。由于不能保证FCM收敛于一种最优解。算法的性能依赖于初始聚类中心。因此,我们要么用此外的迅速算法拟定初始聚类中心,要么每次用不同的初始聚类中心启动该

11、算法,多次运营FC。设被分类的对象的集合为:= x, 2 ,,N,其中每一种对象xk有n 个特性指标,设为k = ( x1k,xk , , xn) , 如果要把X 提成c类,则它的每一种分类成果都相应一种cN 阶的ooan矩阵U= uik cN,相应的模糊c划分空间为:Mc = | uik ,1, ,k ; = 1 ,k;0,and,1 with Unti . 实验采用出名的iis数据集对算法进行测试实现,其中样本总数m=5,样本属性数n=4,设定的划分内别k=3。运算次数为10次的输出成果:能对数组实现分类,但是分类对的率不是很抱负。.3F算法优缺陷通过实验和算法的研究学习,不难发现FC算法

12、的优缺陷5-:一方面,模糊均值泛函Jm 仍是老式的硬c均值泛函J1 的自然推广。J1 是一种应用很广泛的聚类准则,对其在理论上的研究已经相称的完善,这就为J 的研究提供了良好的条件。另一方面,从数学上看,J与R的希尔伯特空间构造(正交投影和均方逼近理论)有密切的关联,因此 比其她泛函有更深厚的数学基本。最后,C聚类算法不仅在许多邻域获得了非常成功的应用,并且以该算法为基本,又提出基于其她原型的模糊聚类算法,形成了一大批FCM类型的算法,例如模糊c线( FL),模糊c面(FP) ,模糊c壳(FS) 等聚类算法,分别实现了对呈线状、超平面状和“薄壳”状构造模式子集(或聚类) 的检测。4结语模糊c均

13、值算法因设计简朴,解决问题范畴广,易于应用计算机实现等特点受到了越来越多人的关注,并应用于各个领域。但是,自身仍存在的诸多问题,例如强烈依赖初始化数据的好坏和容易陷入局部鞍点等,仍然需要进一步的研究。参照文献:1 AK Jin,M N Mury,P J lyn. Datlrg:A Reew,ACM Computin Surveys,199,31(3):64-23 Sprags J. Larnig without a techer J .IEE aatin of Iomtin Thory , ,23 (6) :223 20.3 Babuk R FUZZYADERAL CONTROLM. Netherlads:elft Uniersiy fTeogy,.4 heodoridis S.Patter Recongntin M.eond ditn.USA:Eseir Sinec,.5 高新波FCM聚类算法中模糊加权指数m的优选措施J模糊系统与数学,,1():143186朱剑英,应用模糊数学措施的若干核心问题及解决措施.模糊系统与数学,11(2):5637 高新波.模糊聚类分析及其应用.西安:西安电子科学出版社,8 刘蕊洁,张金波,刘锐.模糊均值聚类算

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 活动策划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号