基于数据挖掘技术的企业CRM系统的设计与实现

上传人:桔**** 文档编号:487106853 上传时间:2023-10-23 格式:DOC 页数:11 大小:222KB
返回 下载 相关 举报
基于数据挖掘技术的企业CRM系统的设计与实现_第1页
第1页 / 共11页
基于数据挖掘技术的企业CRM系统的设计与实现_第2页
第2页 / 共11页
基于数据挖掘技术的企业CRM系统的设计与实现_第3页
第3页 / 共11页
基于数据挖掘技术的企业CRM系统的设计与实现_第4页
第4页 / 共11页
基于数据挖掘技术的企业CRM系统的设计与实现_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《基于数据挖掘技术的企业CRM系统的设计与实现》由会员分享,可在线阅读,更多相关《基于数据挖掘技术的企业CRM系统的设计与实现(11页珍藏版)》请在金锄头文库上搜索。

1、基于数据挖掘技术的企业CRM系统的设计与实现河北金融学院 郭佳 许明摘要:CRM (Customer Relationship Management)是客户关系管理的简称,它是一个系统性的工程,是技术和管理相结合的产物。CRM实现了企业由以产品为中心向以客户为中心的转变,客户首次作为一种资源纳入企业的管理视野。本文以企业销售业绩为对象,利用决策树分类算法中的ID3算法,得到支持决策,从而挖掘出理想客户,建立满足公司需求的CRM挖掘系统。关键字:客户关系管理;数据挖掘;决策树分类算法;ID3算法一、 客户关系管理及数据挖掘技术1.客户关系管理的概念客户关系管理(CRMCustomer Relat

2、ionship Management)自Gartner Group提出概念以来,许多研究机构都基于自己的理解提出了CRM的不同定义。归纳众多国内外著名公司以及学者对CRM的理解,我们可以从以下几个层面来理解CRM。(1)CRM是一种现代经营管理理念。(2)CRM包含的是一整套解决方案。(3)CRM意味着一套应用软件系统。2.数据挖掘的概念从技术上定义,数据挖掘(Data Mining,简称为DM)是一种半自动地从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘从数据中提取人们感兴趣的可用信息和知识,并将提取出来的

3、信息和知识表示成概念、规则、规律和模式等便于人们理解与利用的形式。如果从企业角度说,数据挖掘是一种新的客户信息处理技术,其主要特点是对企业数据库中的大量业务数据进行抽取、转换、分析和其他模式处理,从中提取辅助企业决策的关键性数据。因此,数据挖掘也可被描述为:是提取有用信息的数据产生过程,是从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的知识和规则,并能够根据已有的信息对未发生行为做出结果预测,为企业经营决策、市场策划提供依据的过程。二、 天鹏进出口公司CRM系统分析1.天鹏进出口公司实施CRM的可行性分析首先是市场需求的原因。企业销售成功的关键在于针对客户的需要,提供产品和服务来满足这

4、种需要,然后通过对客户关系的管理,确保客户满意和再次交易。然而过去的企业大多以为他们的产品和服务无与伦比,客户会一如既往的使用他们的产品。现在,客户变的越来越大胆和挑剔,他们不仅要求优质的产品,而且需要优质的服务。天鹏公司发现各部门的信息化程度越来越不能适应业务发展需要,需要提高日常业务的自动化和科学化。这是客户关系管理应运而生的需求基础。其次,技术的进步推进了CRM的发展。计算机、通讯技术、网络应用技术的保证使得构建CRM系统的想法不再停留在梦想阶段。办公自动化程度、员工计算机应用能力、企业信息化水平、企业管理水平的提高都有利于客户关系管理的实现。天鹏公司经过多年的发展,市场经济的观念已经深

5、入人心。公司的工作重点正在经历着从以产品为中心向以客户为中心的转移。在引入客户关系管理的理念和技术时,不可避免的要对企业原来的管理方式进行改变,创新的思想将有利于企业员工接受变革。因此发展CRM的时机已经成熟,通过CRM对该企业的客户资源进行有效的管理,不但会提高企业收益,也将改变企业运行的战略思维。2.天鹏进出口公司实施数据挖掘的可行性分析对该公司客户进行分类的数据挖掘是可行的,因为公司的客户资料已达到了数据挖掘所需要的海量,而公司的经营者也希望获得更大的利润,所以一般都支持数据挖掘,希望充分利用已有的数据信息;而且公司的信息化建设比较好,数据比较完备,网络设置和员工的计算机水平都比较好。而

6、且为了适应业务发展的需要,公司先后在上海、天津、匈牙利设立了办事处和分支机构,拉近公司与客户之间的距离,从而更加方便快捷的将国际领先的产品和优质规范的服务源源不断的呈现给广大客户。另外,当公司管理者需要对公司的贸易策略进行修改,对公司的进货量进行调整的时候,往往需要对以前的数据进行分析,而对于海量数据人们根本无从下手,分析数据只能凭借决策者的直觉,这样对数据是一种无形的浪费。在公司实行数据挖掘的目的就是从日积月累的海量数据中发现隐藏在数据中的潜在规则,根据这些规则,将客户合理分类,进而根据其特点制定“一对一”的个性化贸易策略。3.天鹏进出口公司CRM系统需求分析一个企业业务流程是系统设计的关键

7、,要实施开发CRM系统,必须确定系统的功能需求,这就必须先了解企业的业务流程,从业务流程中分析系统的需求。(1)客户信息管理客户信息包括客户名称、所属国家地区、详细地址、电话传真、电子邮箱、开户银行、银行账号、增值税信息等。(2)活动信息管理活动管理系统模块主要记录与客户之间的联系计划信息,以便及时和客户取得联系,随时了解客户的情况,保证稳定的客户来源。(3)销售信息管理销售管理系统模块主要是对与客户之间的销售进行管理,包括销售和销售列表两部分。销售部分用于记录与客户进行的销售事件,销售列表部分用于对与客户发生的销售进行统计。(4)服务信息管理服务管理系统模块主要是记录客户的反馈事件信息及其处

8、理方式,并对服务信息进行统计,帮助企业更好的把握服务的动态趋势。(5)费用信息管理与客户联系就必然会产生费用,费用管理系统模块主要记录与客户之间发生的费用信息,以控制和客户发生的费用。(6)分析管理分析管理系统主要用于对系统中的数据进行列表分析与图表分析,在该模块中始终贯穿着数据挖掘的思想。(7)报表管理报表管理系统主要用于对系统中的数据进行报表显示与数据文件生成,方便用户打印和下载,可以更快捷的将数字信息变为实际纸张上的信息。 (8)库存管理库存管理模块主要是对销售的产品进行有效的管理及其相应的进货,可分为库存管理、库存详表、进货管理和进货详表几部分。(9)E-mail管理E-mail管理系

9、统是为了使用户能够方便的联系客户,也是CRM的一个重要组成部分,使得用户可以方便的管理所属客户的电子邮件地址,并具有分类群发的功能。(10)后台管理后台管理是对负责系统管理和维护的用户进行授权,对系统部门进行管理;对客户、销售、服务等信息进行实时查询和汇总,提供分析数据列表和图表,并生成便于打印和下载的数据报表和数据文件,提供给管理高层进行分析和决策。三、 天鹏进出口公司CRM系统设计1.系统结构设计OLAP数据挖掘数据仓库ETL工具(抽取、转换、装载工具)外部数据交易数据历史数据规则输出接口规则库知识库分析人员图1 CRM系统结构图2.系统数据挖掘模型的设计(1)用于分类的训练数据源组在本文

10、研究的企业数据中,首先是将不同部分的数据进行集成,然后是对数据进行概化处理,将低层次的原始数据概化为高层次的概念,以便于进行数据挖掘。将具体的客户年龄概化为50三个年龄段,分别代表青年、中年和老年客户,将产品价格分为高、中、低三档等,具体见表1,将企业CRM系统数据库中销售及客户信息经汇总后得到的信息资料。它有4个属性:客户年龄段、文化程度、销售地区、产品档次,类别是销售业绩,分为好和差两类。表1训练样本集合attributeageeducationarealevelclass1=30Hlowbad2=30Hhighgood3=30Hmediumbad4=30Hhighgood5=30Lhig

11、hgood6=30Llowgood7=30Llowgood8=30Mhighgood9=30Mmediumgood10=30Mmediumgood1150M highbad2550Mhighbad2650Mmediumgood表2 训练数据中各属性的说明属性说明age客户的年龄段education文化程度area业务销售地区(本地区,外地)level产品档次class销售状况(2)天鹏进出口公司CRM系统中决策树分类算法的应用决策树分类是一种从无次序、无规则的训练样本集中推理出决策树表示形式的分类规则的方法。在各种决策树分类算法中,ID3 算法是最具有影响力的,接下来以企业销售业绩为对象,介绍

12、ID3算法在CRM系统中分类模型的建立。由表1可知:类标号属性有两个不同的值,因此有两个不同的类(即m=2)设类C1对应于good,类C2对应于bad。类good有18个样本,类bad有8个样本。为了计算每个属性的信息增益,先使用,所以初始信息熵为:I(s1,s2) = I(18,8)= 0.8905下一步,需要计算每个属性的熵,即客户年龄、文化程度、产品档次和销售区域。先看age属性,观察age的每个样本值的good、bad分布,对每个分布分别计算信息熵:当age=50:s13=1 s23=2时,I(s13,s23)= -如果样本按age划分,对一个给定的样本分类所需的信息熵为:E(age)

13、=0.8192 类似的,可以得到:E(education)= =0.7669E(production)= =0.853E(area)= 利用上述属性对当前分支节点进行相应样本集合划分所获得的信息增益分别为:Gain(age) = I(s1,s2)- E(age) =0.8905-0.8192=0.0713Gain(education) = I(s1,s2)- E(education) =0.8905-0.7769=0.1236Gain(production) = I(s1,s2)- E(production) =0.8905-0.853=0.0375Gain(area) = I(s1,s2)- E(area) =0.8905-0.783=0.1075Gain(equipment) =1.576 - 0.873 = 0.703由上述结果可知,属性education具有最高信息增益,因此成为决策树根节点的测试属性。如下所示:8I =30 highgood9I =30 medium good10=30 mediumgood11I =30 l

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号