数据挖掘中的异常点分析和聚类分析

上传人:E**** 文档编号:118143183 上传时间:2019-12-11 格式:PDF 页数:41 大小:1.20MB
返回 下载 相关 举报
数据挖掘中的异常点分析和聚类分析_第1页
第1页 / 共41页
数据挖掘中的异常点分析和聚类分析_第2页
第2页 / 共41页
数据挖掘中的异常点分析和聚类分析_第3页
第3页 / 共41页
数据挖掘中的异常点分析和聚类分析_第4页
第4页 / 共41页
数据挖掘中的异常点分析和聚类分析_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《数据挖掘中的异常点分析和聚类分析》由会员分享,可在线阅读,更多相关《数据挖掘中的异常点分析和聚类分析(41页珍藏版)》请在金锄头文库上搜索。

1、 学号:学号: A200602036A200602036 密级密级: 数据挖掘中的异常点分析和聚类分析数据挖掘中的异常点分析和聚类分析 Outlier analysis and cluster analysisOutlier analysis and cluster analysis inin Data MiningData Mining 姓姓 名名 王元明王元明 学科专业学科专业 应用数学应用数学 研究方向研究方向 计算机应用计算机应用 指导教师指导教师 胡茂林胡茂林 完成时间完成时间 20092009 年年 4 4 月月 I 摘摘 要要 随着数据采集手段的提高,很多行业都存在大量的数据,

2、人们迫切地需要将这些数 据转换成有用的信息和知识;作为实现这个转换的重要途径, 数据挖掘引起了社会各界 的极大关注。据国外专家预测,在今后的 510 年内,随着数据量的日益积累以及计算 机的广泛应用,数据挖掘将在世界范围内形成一个巨大的产业。 数据挖掘中一个重要的应用就是异常点挖掘,异常点可能是“脏数据” ,也可能是 与实际对应的有意义的事件。 从知识发现的角度看,在某些应用里那些很少发生的事件 往往比经常发生的事件更有趣、也更有研究价值。因此,异常数据的检测和分析是一项 重要且有意义的研究工作。 本文主要的工作可以概括为以下四个方面: 第一、 主要综述了异常点数据挖掘的各种算法,并对它们的性

3、能进行了比较,从 中可以得到一些在实际应用中非常有用的结论,为开发实际的算法奠定基础; 第二、 分析了数据挖掘中常用的聚类算法,通过一些样本数据集对一些算法进行 了实际效果的评价; 第三、 在小波分析的基础上对数据集的聚类以及异常点进行了分析。 第四、基于小波分析的聚类算法和异常点分析 关键词:关键词:聚类,异常点,小波分析,数据挖掘 II ABSTRACT The major reason that data mining has attracted a great deal of attention in the information industry in recent years i

4、s duo to the wide availability of huge amounts of data and imminent need for turning such data into useful information and knowledge。 Data mining is one of the important approaches to achieve the transition。 According to foreign experts predict that in the next 5-10 years, with the increasing amount

5、 of data accumulated, as well as a wide range of computer applications, data mining will be the formation of an industry in China。 Data Mining is an important application Outlier Mining。The problem of outlier mining has been variously called outlier analysis, Outlier maybe dirty data, but it also ca

6、n means meaningful event corresponding to the reality。 From the point of knowledge discovery, rare events are often more interesting and valuable than others in many domains, where the rare events importance is quite high compared to other events, making their detection and analysis extremely import

7、ant。 The thesis has four chapter: In chapter1,I discuss the background of data mining, the definition and the process of data mining, and the techniques commonly used induction, Introduced the classification of soft computing。 At the same time, the main application of data mining made a brief introd

8、uction In chapter2 , I summarize the outlier data mining algorithms; compare their performance, and some useful conclusions In chapter3, I analyze some Clustering Algorithms, and verify some of algorithms In chapter4, at the basis of wavelet analysis, I analyze Clustering Algorithm and outlier data

9、mining Keywords: Cluster Analysis, outlier data mining, Wavelet Analysis, Data Mining 安徽大学数学科学学院研究生学位论文 III 目目 录录 第一章 绪论 . 1 1.1 引言 . 1 1.2 数据挖掘常用技术. 2 1.3 数据挖掘的几个主要应用方面 . 6 1.4 本文的研究工作及意义. 7 第二章 异常点挖掘综述 . 8 2.1 异常点简介 . 8 2.2 异常点挖掘算法. 9 2.3 空间异常点数据挖掘. 14 2.4 本章小结 . 15 第三章 聚类分析挖掘综述 . 17 3.1 引言 . 17 3.2 数据挖掘对聚类技术的要求 . 17 3.3 聚类算法的分类 . 18 3.4 几种主要类型的聚类算法 . 18 3.5 本章小结 .

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号