关联规则技术在crm中的研究与应用

上传人:f****u 文档编号:115162132 上传时间:2019-11-12 格式:PDF 页数:40 大小:391.71KB
返回 下载 相关 举报
关联规则技术在crm中的研究与应用_第1页
第1页 / 共40页
关联规则技术在crm中的研究与应用_第2页
第2页 / 共40页
关联规则技术在crm中的研究与应用_第3页
第3页 / 共40页
关联规则技术在crm中的研究与应用_第4页
第4页 / 共40页
关联规则技术在crm中的研究与应用_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《关联规则技术在crm中的研究与应用》由会员分享,可在线阅读,更多相关《关联规则技术在crm中的研究与应用(40页珍藏版)》请在金锄头文库上搜索。

1、中南民族大学 硕士学位论文 关联规则技术在CRM中的研究与应用 姓名:黄雄 申请学位级别:硕士 专业:计算机应用技术 指导教师:宋中山 20100501 中南民族大学硕士学位论文 I 摘 要 分析了目前数据挖掘的常用技术,以及数据挖掘技术在 CRM 中的应用,深 入研究了经典关联规则挖掘算法 Apriori 算法。Apriori 算法的主要问题是常常会 产生巨大数量的项集和规则,以至于一般用户很难从中挖掘出真正有用的规则。 其次是多次扫描事务数据库,过多的进行 I/O 操作。对每次 k 循环,候选项目集 Ck中的每个元素都必须通过扫描一次数据库来验证其是否加入 Lk。针对经典 Apriori

2、算法的不足,从减少数据库的扫描次数入手,提出了一种改进的 Apriori 算法-快速 Apriori 算法,快速 Apriori 算法在查找最大的频繁项集的过程中,只 需要扫描数据库一次来完成分离和统计整个数据库。 当扫描完整个数据库并计数 后,系统将会从所有的业务数据集, 21k CCC中得出候选项集。然后根据最 小支持度和置信度对候选项集进行剪枝,从 1 到 k 项集中确定出频繁项集。 和 Apriori 算法相比,快速 Apriori 算法大幅度的减少了扫描数据库的次数, 并且不需要进行合并和修剪操作。扫描完数据库后,就能根据最小支持度和频繁 项集的特性来确定所有的频繁项集), 2 ,

3、1( , 21 kiLLL i = ,并能通过剪枝后 的频繁项集表得出最大的频繁项集。 根据最大频繁项集和置信度可以确定数据间 的强关联规则。改进后的算法使得数据挖掘的效率和挖掘质量都得以提高,而且 也大大减少了系统资源的占用。 分析了关联规则技术在 CRM 的具体应用,并通过一个实例详细分析了快速 Apriori 算法在 CRM 客户分类中的具体实现。 关键词:数据挖掘,CRM,关联规则,频繁项集,快速 Apriori 算法 中南民族大学硕士学位论文 II Abstract In this paper, the current commonly used data mining techni

4、ques, and their applications in CRM have been analyzed. The typical association rule mining algorithm Apriori also has been deeply studied. A main problem for Apriori algorithm is, it may often create a huge number of itemsets (and rules), and the general users will hard to dig out useful rules. Bes

5、ides this, it may scan the transaction database repeatedly to cause the heavy operations on I/O. For each k cycle, every element in itemsets Ck must scan the database once to verify whether it join the LK. Referring to the limitation of Apriori, considering the database scanning number, in this pape

6、r, a improved Apriori named Fast Apriori algorithm has been proposed. In the Fast Apriori, only once scanning could separate and statistic the entire database in the process of searching for the largest frequent itemsets. When finish the entire database scanning and the counting, system will derive

7、the candidate itemsets from the operational data sets (C1, C2 . Ck), then, will prune the candidate itemsets according to the minimum support and the confidence in order to identify the frequent itemsets from 1 to k. Compared with the original Apriori algorithm, the Fast Apriori greatly reduce the d

8、atabase scanning number, and need not operate merge and trim. After scanning databases, all the frequent itemsets L1,L2Li,(i=1,2,k) could be confirmed according to the minimum support and the characteristics of frequent itemsets, and the maximum frequent itemsets could be given through the pruning o

9、f frequent itemsets. The strong association rules could be given based on the maximum frequent itemsets and the confidence. The improved algorithm not only could promote the efficiency and quality of data mining, but also could greatly reduce the system resource occupied rate. The applications of as

10、sociation rules in CRM have been analyzed in this paper. The detail realization of Fast Apriori algorithm in CRM customer classification has been analyzed by a case . Keywords: Customer Relationship Management, Data Mining, Association Rules, Frequent Itemsets, Fast Apriori algorithm 中南民族大学硕士学位论文 中南

11、民族大学中南民族大学 学位论文原创性声明学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 作者签名: 日期: 年 月 日 学位论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅。本人授权中南民族大学可以将本学位论文的

12、全部或部分内 容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存 和汇编本学位论文。 本学位论文属于 1、保密,在_年解密后适用本授权书。 2、不保密。 (请在以上相应方框内打“”) 作者签名: 日期: 年 月 日 导师签名: 日期: 年 月 日 中南民族大学硕士学位论文 3 第1章 绪 论 1.1 论文的研究背景和意义 人们的生活条件随着计算机的普及以及互联网的发展发生了巨大的变化, 社 会环境也随着改变。快节奏的生活对人们在收集、保存、处理数据和信息的能力 有更高的要求。很多研究所、电子商务公司、金融领域的企业、零售业、政府部 门等均已采用数据库,而且数据库的应用领域在不断延

13、伸。大量信息的快速积累 使得许多数据库的数据容量已经达到 TB 级,更有的达到了 PB 级1。目前的信 息爆炸、信息过量是摆在人们面前急需解决的问题。如何对这些数据进行充分的 利用,而不是让其变成数据垃圾。首先,需要有恰当的思路以及合理的科学方法 给予指导。最大程度利用现有数据,为企业、社会的决策和发展作贡献,这样这 些数据就可以引导社会生产力的发展, 不然这些数据非但不能为决策提供任何指 导作用,而且还成为制约社会发展的因素。我们该怎样对待这些海量数据并让其 发挥其价值?怎样更加仔细的对这些数据进行探讨?怎样挖掘出数据中暗含的 知识?这些问题是信息爆炸和知识化的时代给我们提出来的并且急需解决

14、。 因为 现有数据库还不具备完善的数据挖掘功能, 还无法发现暗含在海量数据中的规则 和数据间的关联,难以依据现有数据对将来的发展状况进行评估预测,没有挖掘 大量数据暗含规则的技术,以致大量数据变成“数据垃圾”的状况。客户关系管 理(Customer Relationship Management,CRM)的出现正好解决了企业数据库中大 量客户数据无法利用的问题,CRM 就是企业利用计算机信息技术,实现对客户 信息的调查了解、分析和服务,最终达到保留原有客户、发现新的客户的技术和 方法。 现今时代企业的发展是以客户为中心。 商场如战场, 在竞争激烈的环境下, 光想通过提高产品的质量是不可能挽留客

15、户的, 只有提高服务才能实现企业利益 最大化,赢得最终的胜利。如何在如此激烈的商业竞争中提高服务?如何轻松的 实现对客户的管理并与现有客户保持良好的联系, 同时吸引更多的新客户?如何 降低企业的总成本, 最大程度地获得更多利润?客户关系管理系统的出现使得这 些问题迎刃而解。而关联规则是实现客户关系管理系统中不得不提的算法之一。 关联规则在 CRM 中的应用主要有分类和预测,概括起来有客户群体分类、客户 盈利能力分析、客户获取和保持以及客户满意度分析等多个方面。 1.2 国内外相关综述 在当前的竞争环境下,企业实施客户关系管理的必要性毋庸置疑的,许多世 中南民族大学硕士学位论文 4 界领先的企业

16、都认识到它的重要性,并从中获益。海尔集团全天的电话中心服务 提高了客户对公司的信任度;增加了客户的拓展率;IBM 也在全面实施客户关 系管理系统,CRM 在工作流程、评估激励系统、管理系统、数据库工具方面的 运用取得了很大的进展, 成为其他企业的典范。 这两个成功的案例都表明了 CRM 的巨大优势。 在西方发达国家, 随着 ERP 系统在企业中的普及应用, 近几年来 CRM 开始 应用在保险、电信、证劵、银行、航空等行业,并以高于 400%的速度大幅度的 应用到其他各行业中2。 在中国,Oracle、SAP 已广泛应用到银行、电信、石化等大型企业中,为 CRM 的实施创造了条件。目前,由汉普管理咨询提供服务的方正电子、实达电 脑、全创通讯、华胜天成正在开展 CRM 系统的实施,一些制造企业如海尔和联 想也开始筹备实施 CRM,而其前期的 ERP 的成功应用为其顺利推行 CRM 带来 了便利。随着一些著名国外 CRM 厂商的陆续到来, “联成互动”首家发布了面 向中小企业的 CRM

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号