网络工程毕业设计(论文)PAM聚类算法的分析与实现

上传人:新** 文档编号:430994440 上传时间:2023-03-28 格式:DOC 页数:21 大小:100KB
返回 下载 相关 举报
网络工程毕业设计(论文)PAM聚类算法的分析与实现_第1页
第1页 / 共21页
网络工程毕业设计(论文)PAM聚类算法的分析与实现_第2页
第2页 / 共21页
网络工程毕业设计(论文)PAM聚类算法的分析与实现_第3页
第3页 / 共21页
网络工程毕业设计(论文)PAM聚类算法的分析与实现_第4页
第4页 / 共21页
网络工程毕业设计(论文)PAM聚类算法的分析与实现_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《网络工程毕业设计(论文)PAM聚类算法的分析与实现》由会员分享,可在线阅读,更多相关《网络工程毕业设计(论文)PAM聚类算法的分析与实现(21页珍藏版)》请在金锄头文库上搜索。

1、 毕 业 论 文(设计)论文(设计)题目:PAM聚类算法的分析与实现系 别: 专 业: 学 号: 姓 名: 指导教师: 时 间: 毕 业 论 文(设 计) 开 题 报 告系别:计算机与信息科学系 专业:网络工程学 号 姓 名论文(设计)题目PAM聚类算法的分析与实现命题来源教师命题 学生自主命题 教师课题选题意义(不少于300字):随着计算机技术、网络技术的迅猛发展与广泛应用,人们面临着日益增多的业务数据,这些数据中往往隐含了大量的不易被人们察觉的宝贵信息,为了得到这些信息,人们想尽了一切办法。数据挖掘技术就是在这种状况下应运而生了。而聚类知识发现是数据挖掘中的一项重要的内容。在日常生活、生产

2、和科研工作中,经常要对被研究的对象经行分类。而聚类分析就是研究和处理给定对象的分类常用的数学方法。聚类就是将数据对象分组成多个簇,同一个簇中的对象之间具有较高的相似性,而不同簇中的对象具有较大的差异性。在目前的许多聚类算法中,PAM算法的优势在于:PAM算法比较健壮,对“噪声”和孤立点数据不敏感;由它发现的族与测试数据的输入顺序无关;能够处理不同类型的数据点。研究综述(前人的研究现状及进展情况,不少于600字):PAM(Partitioning Around Medoid,围绕中心点的划分)算法是是划分算法中一种很重要的算法,有时也称为k-中心点算法,是指用中心点来代表一个簇。PAM算法最早由

3、Kaufman和Rousseevw提出,Medoid的意思就是位于中心位置的对象。PAM算法的目的是对n个数据对象给出k个划分。PAM算法的基本思想:PAM算法的目的是对成员集合D中的N个数据对象给出k个划分,形成k个簇,在每个簇中随机选取1个成员设置为中心点,然后在每一步中,对输入数据集中目前还不是中心点的成员根据其与中心点的相异度或者距离进行逐个比较,看是否可能成为中心点。用簇中的非中心点到簇的中心点的所有距离之和来度量聚类效果,其中成员总是被分配到离自身最近的簇中,以此来提高聚类的质量。由于PAM算法对小数据集非常有效,但对大的数据集合没有良好的可伸缩性,就出现了结合PAM的CLARA(

4、Cluster LARger Application)算法。CLARA是基于k-中心点类型的算法,能处理更大的数据集合。CLARA先抽取数据集合的多个样本,然后用PAM方法在抽取的样本中寻找最佳的k个中心点,返回最好的聚类结果作为输出。后来又出现了CLARNS(Cluster Larger Application based upon RANdomized search,也称随机搜索聚类算法),CLARNS是另外一种k-中心点方法,它将采样技术和PAM结合起来,对CLARA的聚类质量和可伸缩性进行了改进。不像CLARA那样每个阶段选取一个固定样本,CLARANS在搜索的每一步都带一定随机性地选

5、取一个样本。研究的目标和主要内容(不少于400字) 对PAM聚类算法的基本思想、PAM聚类算法的替换代价和PAM聚类算法的性能等进行分析,根据PAM算法描述,使用matlab软件编写PAM聚类算法代码,实现PAM聚类算法。使用编写好的代码运用到一个实例中,使同一个簇中的对象越近越好,而不同簇中的对象越远越好,对实例中的数据进行聚类后,把聚类后的结果作为进一步进行分析的基础。本选题研究的主要内容如下:(1)PAM聚类算法的分析,分析PAM聚类算法的主要内容如下:1) PAM聚类算法的基本思想:了解PAM聚类算法的基础,能够让人简单的了解PAM聚类算法的整个过程,对于最后的算法实现有很重要的意义。

6、2) PAM聚类算法的替换代价:分四种情况计算替换代价,通过最后的总代价,来分析是否要进行替换的根据。3) PAM聚类算法的算法描述:使用matlab软件编写PAM聚类算法的代码的根据。4) PAM聚类算法的性能:包含了PAM聚类算法的优点和缺点。(2) PAM聚类算法的实现,实现PAM聚类算法的主要内容如下:1) 算法实现:根据PAM聚类算法描述,使用matlab软件编写PAM聚类算法代码。2) 把编写好PAM聚类算法的代码运用到一个实例中。拟采用的研究方法在指导老师的指导下,查找并阅读相关资料,利用相关资料对PAM算法进行详细分析,从而根据分析实现PAM算法。使用matlab软件来编写代码

7、。研究工作的进度安排2010年11月20号11月29号,与指导老师沟通交流,完成毕业论文选题;2010年11月29号12月31号,收集整理资料,完成文献综述和开题报告;l 2011年01月2011年03月,继续整理资料;2011年03月2011年04月,完成初稿;l2011年04月2011年05月,对初稿进行检查和修改;l2011年05月2011年06月,完成(论文)撰写、装订,参加答辩参考文献目录(作者、书名或论文题目、出版社或刊号、出版年月日或出版期号)1毛国君,等.数据挖掘原理与算法(第二版)M.北京:清华大学出版社,2007.122 Jiawei Han,Micheline Kambe

8、r.数据挖掘:概念与技术M.北京:机械工业出版社,2001.3 陈京民,等.数据仓库与数据挖掘技术M.北京:电子工业出版社,2002.4 刘同明,等.数据挖掘技术及其应用M.北京:国防工业出版社,2001.5 David Hand,等.数据挖掘原理M.张银奎,等译.北京: 机械工业出版社,中信出版社,2004.指导教师意见 签名: 年 月 日教研室主任意见 签名: 年 月 日目 录摘要1关键词1Abstract 1Key words1引言11 PAM聚类算法分析2 1.1 数据挖掘相关知识2 1.1.1 数据挖掘简介2 1.1.2 聚类 2 1.1.3 聚类分析概述3 1.2 PAM算法分析5

9、 1.2.1 PAM算法详细论述5 1.2.2 PAM算法描述7 1.2.3 PAM算法性能分析72 PAM聚类算法的实现7 2.1简要说明7 2.2 matlab简介8 2.2.1 matlab基本功能8 2.3 算法实现8 2.4 PAM聚类算法在学生成绩中的应用133 小结14致谢14参考文献 14 PAM聚类算法分析与实现网络工程 专业 指导教师: 摘要“物以类聚,人以群分”。当有一个分类指标时,分类比较容易。但是当有多个指标,要进行分类就不是很容易了。对于多指标分类,由于不同的指标项对重要程度或依赖关系是相互不同的,所以也不能用平均的方法,因为这样会忽视相对重要程度的问题。所以需要进

10、行多元分类,即聚类分析。本文主要介绍一种聚类分析算法,它就是PAM聚类算法。首先是数据挖掘简介包括数据挖掘的基本概念,说明聚类是数据挖掘的一个很重要的功能。同时进一步解释什么是聚类分析。然后详细分析PAM聚类算法,最后给出了一个实现PAM聚类算法的例子。关键词:PAM聚类算法 ;中心点 ;聚类分析;代价PAM Clustering Algorithm Analysis and ImplementationMajor:Network engineering Gao Huarong Supervisor:Wu QimingAbstract Birds of a feather flock toge

11、ther.When there is a classification index,classification is easier.But when more than one index, want to undertake classification is not very easy.For multi-index classification, due to the different index study of important degree or dependent relationship is mutual different, so also cannot use av

12、erage method, because that will ignore the relative importance.So the need of multiple classification, namely clustering analysis.This paper mainly introduces a kind of the cluster analysis algorithm, it is PAM clustering algorithm.First introduces the basic concept of data mining that clustering is an important data mining the function.And further explained what clustering analysis is. Then detailed analysis of PAM clustering algorithm, and finally presents a realizing examples of PAM clustering algorithm.Key words PAM clustering algorithm;center;Cluste

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号