数据挖掘-基于关联的分类方法

上传人:小** 文档编号:56463350 上传时间:2018-10-12 格式:PPT 页数:23 大小:2.03MB
返回 下载 相关 举报
数据挖掘-基于关联的分类方法_第1页
第1页 / 共23页
数据挖掘-基于关联的分类方法_第2页
第2页 / 共23页
数据挖掘-基于关联的分类方法_第3页
第3页 / 共23页
数据挖掘-基于关联的分类方法_第4页
第4页 / 共23页
数据挖掘-基于关联的分类方法_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《数据挖掘-基于关联的分类方法》由会员分享,可在线阅读,更多相关《数据挖掘-基于关联的分类方法(23页珍藏版)》请在金锄头文库上搜索。

1、7.6基于源于关联规则挖掘概念的分类 7.7其它分类方法-7.7.1 k-最临近分类-7.7.2基于案例的推理-7.7.3遗传算法-7.7.4粗糙集方法 -7.7.5模糊集方法制作者:张华 杜玉锋2012.04.16,7.6基于源于关联规则挖掘概念的分类 7.7其它分类方法-7.7.1 k-最临近分类-7.7.2基于案例的推理-7.7.3遗传算法-7.7.4粗糙集方法 -7.7.5模糊集方法,7.6 基于源于关联规则挖掘概念的分类,基于关联规则分类:(1)关联规则聚类系统(ARCS): 量化关联规 则挖掘和关联规则聚类 (2)关联分类:它挖掘形如“cond_set=y”具有高支持度和高置信度的

2、规则,这里y是一个类标号 挖掘关联规则使用的支持度概念分类: (3)通过聚集显露模式分类( CAEP ) 基于最小支持度和增长率挖掘显露模式(Eps),7.6 基于源于关联规则挖掘概念的分类,1.基于聚类挖掘关联规则(ARCS)(1)ARCS挖掘形如Aquant1Aquant2=Acat的关联规则(2)用ARCS产生的聚类关联规则用于分类,7.6 基于源于关联规则挖掘概念的分类,1.基于聚类挖掘关联规则 特点: 限制条件:ARCS的准确性与离散化程度有关 可扩展性:可 时间:相比之下,C4.5具有指数运行时间 空间:相比之下,C4.5要求整个数据库(乘以某个因子)全部装入内存,7.6 基于源于

3、关联规则挖掘概念的分类,2.关联分类 概念:挖掘形如condset=y的规则;其中,condset 是项(或属性值对)的集合,而y是类标号满足最小支持度的规则是频繁的满足最小置信度的规则是精确的如果一个规则项集具有相同的condset,则选择具有最高置信度的规则作为可能规则(PR),代表该集合,7.6 基于源于关联规则挖掘概念的分类,2.关联分类挖掘高支持度和高置信度的规则 (1)找出所有频繁的,精确地可能规则(PR)集合。算法使用迭代方法,类似于6.2.1小节介绍的Apriori使用的方法,先验知识用于裁减规则搜索。 (2)使用一种启发式方法构造分类。这里,发现的规则根据支持度和置信度按递减

4、的优先次序组织。(3)对一个新的样本进行分类时,满足该样本的第一个规则用于对它分类。分类法也包含省缺规则,它具有最低的优先次序,用来为不被分类法中其它规则满足的新样本指定一个省缺的类。,例如: Coundset=a1,a2,a3,a4y=C,7.6 基于源于关联规则挖掘概念的分类,3.CAEP(通过聚集显露模式分类) 使用项集支持度挖掘显露模式(EP)构造分类。显露模式(EP):是一个项集(项的集合),其支持度由一个类到另一个类显著增加。两个支持度的比称作EP的增长率。 例如,假定我们有顾客数据集,包含类buys_computer=“yes”或C1和buys_computer=“no”或C2。

5、 项集age=“=2)(income=50K)THEN credit=“approved”(7.21)根据规则(7.21),一个至少工作两年的顾客将得到信用卡,如果他的收入是$50K;但是,如果他的收入是$49K,他将得不到。这种苛刻的阈值看来可能不公平。替换地,可以将模糊逻辑引入系 统,允许定义“模糊”阈值或边界。,7.7.5 模糊集方法,模糊逻辑使用0.0和1.0之间的真值表示一个特定的值是一个给定类成员的程度,而不是用类或集合的精确截断。因而,使用模糊逻辑,我们可以断言:在某种程度上,$49K的收入是高的,尽管没有$50K的收入高。,7.7.5 模糊集方法,将属性值转换成模糊值。图7.14展示如何将连续属性income的值映射到离散分类low,mediu,high上,以及如何计算模糊成员关系或真值。通常,模糊逻辑系统在这一步提供图形工具,支持用户。 对于给定的新样本,可以使用多个模糊规则。每个可用规则为分类的成员关系贡献一票。通常对每个预测分类的真值进行求和。组合上面得到的和,得到一个系统返回的值。这一过程可以这样做:用每个分类的真值和加权并乘以每个分类的平均真值。所涉及的计算可能更复杂,这取决于模糊成员关系图的复杂性。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号