数据挖掘的六大主要功能

上传人:宝路 文档编号:18009664 上传时间:2017-11-13 格式:DOC 页数:3 大小:25.49KB
返回 下载 相关 举报
数据挖掘的六大主要功能_第1页
第1页 / 共3页
数据挖掘的六大主要功能_第2页
第2页 / 共3页
数据挖掘的六大主要功能_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据挖掘的六大主要功能》由会员分享,可在线阅读,更多相关《数据挖掘的六大主要功能(3页珍藏版)》请在金锄头文库上搜索。

1、第 1 页 共 3 页数据挖掘的六大主要功能2012-09-29 10:36:49 来源:CIO 时代网摘要: 数据挖掘的历史虽然较短,但从 20 世纪 90 年代以来,它的发展速度很快,加之它是多学科综合的产物,目前还没有一个完整的定义,人们提出了多种数据挖掘的定义。 关键词: 数据挖掘数据挖掘的历史虽然较短,但从 20 世纪 90 年代以来,它的发展速度很快,加之它是多学科综合的产物,目前还没有一个完整的定义,人们提出了多种数据挖掘的定义,例如:SAS 研究所(1997):“在大量相关数据基础之上进行数据探索和建立相关模型的先进方法”。Hand et al(2000):“数据挖掘就是在大型

2、数据库中寻找有意义、有价值信息的过程”确切地 说, 数据挖掘(Data Mining ),又称数据库中的知识发现(Knowledge Discovery in Database,KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式,它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、 统计学等多个领域的理论和技术。数据挖掘的主要功能数据挖掘综合了各个学科技术,有很多的功能,当前的主要功能如下:1、数据总结:继承于数据分析中的统计分析。数据总结目的是对数据进行浓缩,给出它的紧凑描述。传统统计方法如求和值、平均值、第 2 页 共

3、3 页方差值等都是有效方法。另外还可以用直方图、饼状图等图形方式表示这些值。广义上讲,多维分析也可以归入这一类。2、分类:目的是构造一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成,每个元组是一个由有关字段(又称属性或特征)值组成的特征向量,此外,训练样本还有一个类别标记。一个具体样本的形式可表示为:(v1,v2, vn;c),其中 vi 表示字段值,c 表示类别。例如:银行部门根据以前的数据将客户分成了不同的类别,现在就可以根据这些来区分新申请贷款的客户,以采取相应

4、的贷款方案。3、聚类:是把整个数据库分成不同的群组。它的目的是使群与群之间差别很明显,而同一个群之间的数据尽量相似。这种方法通常用于客户细分。在开始细分之前不知道要把用户分成几类,因此通过聚类分析可以找出客户特性相似的群体,如客户消费特性相似或年龄特性相似等。在此基础上可以制定一些针对不同客户群体的营销方案。例如:将申请人分为高度风险申请者,中度风险申请者,低度风险申请者。4、关联分析:是寻找数据库中值的相关性。两种常用的技术是关联规则和序列模式。关联规则是寻找在同一个事件中出现的不同项的相关性;序列模式与此类似,寻找的是事件之间时间上的相关性,例如:今天银行利率的调整,明天股市的变化。第 3 页 共 3 页5、预测:把握分析对象发展的规律,对未来的趋势做出预见。例如:对未来经济发展的判断。6、偏差的检测:对分析对象的少数的、极端的特例的描述,揭示内在的原因。例如:在银行的 100 万笔交易中有 500 例的欺诈行为,银行为了稳健经营,就要发现这 500 例的内在因素,减小以后经营的风险。以上数据挖掘的各项功能不是独立存在的,它们在数据挖掘中互相联系,发挥作用。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号