数据仓库与数据挖掘

上传人:hs****ma 文档编号:561696712 上传时间:2023-02-20 格式:DOCX 页数:9 大小:13.58KB
返回 下载 相关 举报
数据仓库与数据挖掘_第1页
第1页 / 共9页
数据仓库与数据挖掘_第2页
第2页 / 共9页
数据仓库与数据挖掘_第3页
第3页 / 共9页
数据仓库与数据挖掘_第4页
第4页 / 共9页
数据仓库与数据挖掘_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《数据仓库与数据挖掘》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘(9页珍藏版)》请在金锄头文库上搜索。

1、关联规则在企业客户关系管理中的应用学号:2010970034姓名:程万班级:10信管1班摘要:关联规则挖掘是在数据挖掘研究中最为活跃的一种挖掘方法之一。利用关 联规则的Apriori算法对软件企业的客户与商品之间的关系进行挖掘,发现商品 间的潜在关系,指导决策者对不同的客户实施不同的营销策略,从而达到高质量 的客户关系管理。关键词:关联规则Apriori算法 客户关系管理 CRMAbstract: the mining of association rules in data mining is one of the most a mining method of active researc

2、h in. Mining the relationship between customer and commodity Apriori algorithm uses the association rules for software enterprises, to discover the potential relationship between goods,to guide decision makers to implement different marketing strategies for different customers, so as to achieve high

3、 quality of customer relationshipmanagement.Keywords: Apriori algorithm of association rules CRM customer relationship management引言:国内企业实施CRM.既会受到国外相关管理理念的影响,也会受 到客观竞争环境的推动。从1999年年中开始,客户关系管理(CRM) 得到了各方面的诸多关注。国内外很多软件商推出了以客户关系管理 命名的软件系统.有一些企业开始实施以客户关系管理命名的信息系 统。从理论上讲,CRM适合于所有企业,但在实施应用中,应结合企 业具体实际情况来进行

4、。就国内企业而言,在2001年的各企业CRM 项日实施的成功率与CRM供应商所宣传的全能的解决方案之间的反 差.是很难评定的。但是在之后的一年中.CRM还是向前迈了一大步, 解决了点解决方案,如销售自动化、客户服务中心等,目前正处在整 合这些服务的阶段。但是很多本质上的问题并没有解决,关联规则进 行数据挖掘的实际应用使一些企业中客户关系管理上的问题得到很 好的缓解,实践证明挖掘结果具有一定的可信度,可以有效支持企业 做出决策。自上世纪80年代以来,伴随着我国市场经济的逐渐成熟,客户 对产品的需求平稳增长,市场竞争愈加激烈,这使得企业认识到识别、 挑选、获得、发展和维护客户的重要性,进而在经营理

5、念层面上越来 越关注客户价值、客户满意和客户忠诚,力图通过在正确的时间使用 正确的方式为正确的客户提供正确的服务,来创造和传递客户价值, 提升客户满意水平,从而实现客户忠诚进而维持正确客户,获得这些 客户的生涯价值(LTV)。本文设计了一个关联规则数据挖掘模型,结 合实例使用Apriori挖掘技术分析并检验了该方法的有效性。1关联规则挖掘数据挖掘(Datamining)是从大量数据中获取有效的、新颖的、 潜在有用的、最终可理解的模式的过程。简单地说,数据挖掘就是从 大量数据中提取或“挖掘”知识,又被称为数据库中的知识发现 (knowledge discovery in database, KD

6、D)。关联规则挖掘是数据挖掘中最为常见的一种挖掘方法之一,最初 由R.Agrawal等人提出,主要目的在于通过超市购物篮发现超市交易 中不同商品之间存在的潜在关系。关联规则可以用一个蕴含式R: X?Y来表示,其中:X?I, Y?I, I为关联规则挖掘涉及到的项目的集合,称为项集,并且X?Y=0 。 它表示如果项集X在某一项目中出现,则会导致项集Y按照某一概率 也会出现在同一项目中。X为规则的条件,Y为规则的结果。关联规则挖掘过程主要包含两个阶段:第一阶段必须先从资料集 合中找出所有的高频项目组(Frequent Itemsets),第二阶段再由这些 高频项目组中产生关联规则(Associati

7、on Rules)。关联规则挖掘的第一阶段必须从原始资料集合中,找出所有高频 项目组(Large Itemsets)。高频的意思是指某一项目组出现的频率相 对于所有记录而言,必须达到某一水平。一项目组出现的频率称为支 持度(Support),以一个包含A与B两个项目的2-itemset为例,我们 可以经由公式(1)求得包含A,B 项目组的支持度,若支持度大于等于 所设定的最小支持度(Minimum Support )门槛值时,则A,B 称为高频 项目组。一个满足最小支持度的k-itemset,则称为高频k-项目组 (Frequent k-itemset),一般表示为 Large k 或 Fre

8、quent k。算法并从 Large k的项目组中再产生Large k+1,直到无法再找到更长的高频 项目组为止。关联规则挖掘的第二阶段是要产生关联规则(Association Rules)。 从高频项目组产生关联规则,是利用前一步骤的高频k-项目组来产生 规则,在最小信赖度(Minimum Confidence)的条件门槛下,若一规则 所求得的信赖度满足最小信赖度,称此规则为关联规则。例如:经由 高频k-项目组A,B所产生的规则AB,其信赖度可经由公式(2)求得, 若信赖度大于等于最小信赖度,则称AB为关联规则。一个经典的关联规则的例子是“啤酒与尿布”的故事:在一家超市里,有一个有趣的现象:

9、尿布和啤酒赫然摆在一起出 售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是 一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为 商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统,为了能够 准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行 购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓 库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基 础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘。一个意 外的发现是:跟尿布一起购买最多的商品竟是啤酒!经过大量实际 调查和分析,揭示了一个隐藏在尿布与啤酒背后的美国人的一种行 为模式:在美国,一些

10、年轻的父亲下班后经常要到超市去买婴儿尿布, 而他们中有30%40%的人同时也为自己买一些啤酒。产生这一现 象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布, 而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。按常规思维,尿布与啤酒风马牛不相及,若不是借助数据挖掘技 术对海量交易数据进行挖掘和分析,沃尔玛是不可能发现数据内在这 一有价值的规律的。用来衡量什么的关联规则才是用户感兴趣的关联规则主要有两 个标准:关联规则的支持度和可信度。对于关联规则 R: X?Y,其中:X?I, Y?I, X?Y=2 , 规则R的支持度表示同时包含X和Y的项目数与所有项目数的比。记 为 Sup(X?Y),Su

11、p(X?Y)=count(X?Y)D。支持度反映了 X 和Y中所包含的项目在项目集中同时出现的频率,支持度越大,关联 规则越重要。对于关联规则 R: X?Y,其中:X?I,Y?I,X?Y=2 , 规则R的可信度表示包含X和Y的项目数与包含X的项目数的比。记 为 Conf(X?Y),Conf(X?Y)=Sup(X?Y)Sup(X)。可信度 反映了如果项目中包含X,则项目中同时出现Y的概率,是对关联规 则的准确程度的衡量标准。满足最小支持度的关联规则称为频繁关联规则;同时满足最小支 持度和最小可信度的关联规则称为强关联规则,在关联规则挖掘的过 程中,需要先挖掘出所有的频繁规则,再从中挖掘出强关联规

12、则,只 有强关联规则才能指导用户的决策。2客户关系管理客户关系管理(CRM, CustomerRelationship Management)最早 GartnerGroup提出,是指企业与顾客之间建立的管理双方接触活动 的信息系统。在网络时代的顾客关系管理应该是利用现代信息技术手 段.在企业与顾客之间建立一种数字的、实时的、互动的交流管理系 统。更具体地说.CRM首先是一种管理理念,其核心思想是将企业的 客户(包括最终客户、分销商和合作伙伴)作为最重要的企业资源,通过完善的客户服务和深入的客户分析来满足客户的需求,保证实现客 户的终生价值。同时,CRM也是一种管理软件和技术,它将最佳的商 业实

13、践与数据挖掘、数据仓库、一对一营销、销售自动化以及其他信 息技术紧密结合在一起,为企业的销售、客户服务和决策支持等领域 提供了一个业务自动化的解决方案。这两个层面是相辅相成,互为作 用的。CRM是一种企业客户战略,是一种经营哲学。客户关系管理(Customer Relationship Management, CRM)是 一种旨在改善企业与客户之间关系的新型管理机制。通过实施客户关 系管理可以使企业能够方便地搜集、追踪、分析每一个客户的信息, 增强企业与客户之间的沟通,更好地满足客户的个性化需求,从而达 到以更快速、更优质的服务保留现有客户并挖掘潜在客户的目的。有效的客户关系管理还能够观察和分

14、析客户行为以及其对企业 的利润影响,使企业与客户的关系以及企业的利润都得到最优化,从 而达到双赢的目的。所以客户关系管理的思想与潜在价值对企业具有 极大的吸引力,绝大多数企业对于实施客户关系管理的规范化都存在 着强烈的欲望。因此,加强对客户关系管理理论的研究并通过对客户 关系的管理和分类挖掘对企业的决策提供有效依据已经成为当下需 要解决的重要课题。3关联规则挖掘在软件企业客户关系管理中的应用目前一个企业是否有竞争力已不再完全取决于它的产品和生产 运作效率,而在很大程度上取决于它是否建立和保持良好的客户关系。 过去由于技术的限制,企业信息系统的开放性不足,因此全方位了解 顾客,把握客户的特征与需

15、求只能是一种理想。而在网络科技的快速 发展条件下,加上日益成熟的数据仓库和数据挖掘技术,使得企业能 更有效地掌握客户的行为及需求。如果企业把利润作为自己的目标, 客户关系管理则是到达这个目标的最有用的工具,而数据挖掘则是这 个工具的最佳引擎。数据挖掘是一个迅速发展的学科,而且是面向应用的。数据挖掘 应用于CRM会提高企业的商业智能。数据挖掘与CRM的结合将是全方 面的,即销售、营销和客户服务都可以从数据挖掘中获得决策支持。 Data Miners的发起人Gordon S.Linoff认为:“数据挖掘通过整合 企业的数据,帮助将正确的信息传到每一个客户。数据挖掘是CRM的 必备组件之一”。以客户

16、关系管理的产品销售模块作为分析对象进行研究,利用关 联规则挖掘的Apriori算法对样本进行分析、挖掘,进而找到不同产 品销售之间的潜在关系。Apriori算法的核心思想是:通过对样本数据进行多次扫描,产 生长度不同的频繁集。通过设定最小支持度和最小可信度,最终挖掘 出对决策有用的强关联规则。算法的简要描述如下:在对客户的信息和资料进行管理的过程中,有的客户会同时购买 某两种或多种产品,某类的客户可能会对某种产品类型特别感兴趣。 如果挖掘出在产品和客户内部潜在的这种规律,便可以对客户实施有 重点的营销策略,进而提高客户的服务水平。在进行数据挖掘之前, 我们先将客户和客户购买的产品进行分类和标识,用不同的代码和序 号代表不同的客户和产品,然后再利用Apriori算法对数据进行分析 挖掘,找到数据之间存在的潜在联系。在此关联规则挖掘中,设定最小支持

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号