基于高斯核的ksofm聚类算法研究

上传人:E**** 文档编号:118470999 上传时间:2019-12-15 格式:PDF 页数:70 大小:2.32MB
返回 下载 相关 举报
基于高斯核的ksofm聚类算法研究_第1页
第1页 / 共70页
基于高斯核的ksofm聚类算法研究_第2页
第2页 / 共70页
基于高斯核的ksofm聚类算法研究_第3页
第3页 / 共70页
基于高斯核的ksofm聚类算法研究_第4页
第4页 / 共70页
基于高斯核的ksofm聚类算法研究_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《基于高斯核的ksofm聚类算法研究》由会员分享,可在线阅读,更多相关《基于高斯核的ksofm聚类算法研究(70页珍藏版)》请在金锄头文库上搜索。

1、分类号:密级: 编号:至Q Q ! 鱼 桂林理工大学 硕士研究生学位论文 基于高斯核的K S O F M 聚类算法研究 专业: 研究方向: 研究生: 指导教师: 计算机应用技术 数据挖掘 周峰 陈基漓副教授 论文起止E l 期:2 0 10 年6 月至2 0 11 年4 月 AR e s e a r c ho fK S O F Mc l u s t e ra l g o r i t h mb a s e do nG a u s s i a n k e r n e lf u n c t i o na n d i 长a p p l i c a t i o n M a jo r :C o m p u

2、 t e rA p p l i c a t i o n D i r e c t i o no f S t u d y :D a t aM i n i n g G r a d u a t eS t u d e n t - Z h o u f e n g S u p e r v i s o r : C h e n J i l i C o l l e g eo f I n f o r m a t i o nS c i e n c ea n dE n g i n e e r i n g G u i l i nU n i v e r s i t yo fT e c h n o l o g y J u n

3、 e ,2 0 1 0t oA p r i l ,2 0 11 研究生学位论文独创性声明和版权使用授权书 独创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含他人已 经发表或撰写过的研究成果,也不包含为获得其它教育机构的学位或证书而使用 过的材料。对论文的完成提供过帮助的有关人员已在论文中作了明确的说明并表 示谢意。 学位论文作者( 签字) :围盛 签字日期:旌! f :丘:至! 学位论文版权使用授权书 本学位论文作者完全了解( 学校) 有关保留、使用学位论文的规定,有权保留 并向国家有关部门或机构送交

4、论文的印刷本和电子版本,允许论文被查阅和借 阅。本人授权( 学校) 可以将学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国 科学技术信息研究所将本学位论文收录到中国学位论文全文数据库,并通过 网络向社会公众提供信息服务。( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:阖许 签字日期:弦,阵多月f 日 J7 力 漏拍魂悔伤少 氧堋 裕旧耀字 聚类分析作为数 所应用,而聚类分析 约,在遇到数据之间 非线性数据提出一种基于核方法的神经网络聚类算法。论文完成了以下工作:描 述数据挖掘起源以及数据挖掘组成部分,分析了经典数据

5、挖掘步骤,并介绍了相 关内容。还对数据挖掘中的聚类算法进行了关键性研究,对比了数种经典聚类算 法,并得出神经网络聚类中的S O F M 算法相比较其他算法而言有着较高的可靠性, 如信息处理的并行性、信息单元的互连性,非线性,能够很好的处理普遍存在的 非线性问题,具有较强的自学习、自组织与自适应性等等。并详细研究了核方法, 并对常用的核方法进行了介绍。对核函数性质以及选择核函数原则进行了细致的 分析,通过对三类重要的核函数进行比较,选择了其中的平移不变核函数,因为 高斯核函数的特征空间是无限维的,所以任意样本在映射到特征空间后必将是线 性可分的,故而将高斯核函数作为算法改进中所使用的核函数。 在

6、对核方法进行了较为详细的了解与学习后对引入核方法之后的K S O F M 算法 做出了详尽的说明,并设计出了一种新型的基于高斯核函数的神经网络聚类算法 K S O F M 算法。通过前期对聚类算法以及核方法的研究,在理论上说明了,将输入 空间中的数据映射到高维特征空间中,然后在高维特征空间中进行聚类,与一般 的映射后再聚类法相比,K S O F M 算法精炼许多,在时间复杂度上也较低,因为 K S O F M 不需要求出映射空间,实际处理的数据集还是原始数据集,只是将相似性 度量函数映射到高斯核空间来满足核聚类的要求,所以相比传统的维度变换聚类 得到的效果较好。为了说明设计的新算法的实效性,在

7、M A T L A B 环境下对S O F M 算法和改进后的K S O F M 算法进行了实验仿真,其结果证明了改进后的K S O F M 算法 具有可行性且具有实际效果。为了能够清楚地显示聚类效果,给定数据集已经经 过人工分析得出需要的聚类结果,随着高斯核函数中径向选择宽度常量。的变 化,结果也发生着明显的变化,并在某个特殊值时获得十分良好的可容误判率。 ( 6 ) 总结本文的研究内容,以及展望未来核方法在数据挖掘领域的深入研 究与广泛应用。 关键词:类分析,数据挖掘,神经网络,核函数 A b s t r a c t C l u s t e ra n a l y s i si sv e r

8、 yi m p o r t a n ti nd a t am i n i n g C l u s t e r i n gA sa ni n t e g r a lp a r t h a sb e e na p p l i e di nm a n yb u s i n e s s e sa n de n t e r p r i s e s ,b u tc l u s t e ra n a l y s i st oac e r t a i n e x t e n t ,b yt h ed a t at ob ea n a l y z e di nt h el i n e a ra n dn o n

9、 l i n e a rc o n s t r a i n t s ,I nt h ec a g eo f t h en o n l i n e a rr e l a t i o n s h i pb e t w e e nt h ed a t a i ti Sd i 伍c u l tt oo b t a i nm o r ea c c u r a t e r e s u l t s D a t af o rt h i sP a p e rp r e s e n t san o n l i n e a rm e t h o do fn e u r a ln e t w o r kb a s e

10、 do n k e m e lc l u s t e r i n ga l g o r i t h m T h i sP a p e rh a sc o m p l e t e dt h ef o l l o w i n gw o r k :D e s c r i b e d t h eo r i g i n so fd a t am i n i n ga n dd a t am i n i n gc o m p o n e n t A n a l y z e dt h ec l a s s i c a ld a t a m i n i n gs t e p s ,a n dd e s c r

11、 i b e d t h er e l e v a n tc o n t e n t A n dm a d eae r i t i c a ls t u d yo n C l u s t e r i n go f d a t am i n i n ga l g o r i t h m s C o m p a r e ds e v e r a lc l a s s i c a lc l u s t e r i n ga l g o r i t h m , a n do b t a i n e dt h eS O F Mn e u r a ln e t w o r kc l u s t e r i

12、 n ga l g o r i t h mi nc o m p a r i s o nw i t ho t h e r a l g o r i t h m si nt e r m so fh i g hr e l i a b i l i t y ,s u c ha si n f o r m a t i o np r o c e s s i n gp a r a l l e l i s m , c o n n e c t i v i t yo fi n f o r m a t i o nu n i t s i th a st h ea b i l i t yo nd e a l i n gw i

13、 t hw i d e s p r e a d n o n 1 i n e a rp r o b l e m s A l o sw es t u d i e dk e r n e lm e t h o d si nd e t a i l a n di n t r o d u c e dt h e c o m m o n l yu s e dk e r n e lm e t h o d s A n a l y z e dt h en a t u r eo ft h ek e m e lf u n c t i o na n d k e m e lf u n c t i o nc h o s e n

14、i nd e t a i l B e c a u s et h eG a u s s i a nk e r n e lf u n c t i o nh a s i n f i n i t e - d i m e n s i o n a lf e a t u r es p a c e 。S Oa n ys a m p l e sm a p p e dt ot h e f e a t u r es p a c ei S l i n e a rs e p a r a b l e W es e l e c t e dG a u s s i a nk e m e lf u n c t i o nf o

15、ro u ra l g o r i t h mi m p r o v e m e n t b a s e do nt h r e ei m p o r t a n tk e r n e lf u n c t i o nc o m p a r i s o n B a s e do nd e t a i l e du n d e r s t a n d i n ga n dl e a r n i n go nk e r n e lf u n c t i o nW em a d eal o t o fd e s c r i p t i o no nK S O F Ma p p e n d e dk

16、e m e lm e t h o d s ,a n dd e s i g n e dan e wt y p eo f n e u r a ln e t w o r ka l g o r i t h mK S O F Mb a s e do nG a u s s i a nk e r n e l W ep r o v e dt h a tt h e i n p u ts p a c em a p p e dt oh i g hd i m e n s i o n a lf e a t u r es p a c e ,a n dc l u s t e r i n gi n h i 曲d i m e n s i o n a l f e a t u r es p a c eC a l l p r e s e n t sb e t t e rc l u s t e r i n gR e s u l t st h a nt h e t r a d i t i o n a lw a Y T h eK S O

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号