《客户关系管理第九章 CRM中的数据仓库与数据挖掘》由会员分享,可在线阅读,更多相关《客户关系管理第九章 CRM中的数据仓库与数据挖掘(24页珍藏版)》请在金锄头文库上搜索。
1、 第九章 CRM中的数据仓库与数据挖掘本章内容 n第一节 客户关系管理与数据仓库n第二节 客户关系管理与数据挖掘n第三节 应用案例第一节 客户关系管理与数据仓库n一、数据仓库的基本概念n二、建立单独的数据仓库n三、数据仓库的数据组织n四、数据仓库结构n五、数据仓库如何支持CRM一、数据仓库的基本概念n数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。n数据仓库有以下几个特点:数据仓库中的数据是面向主题的、集成的、不可更新的(稳定的)、随时间不断变化的,建立数据仓库的目的是为了更好的支持决策的制定。 二、建立单独的数据仓库 操作数据库存放了大量的数据,为什么还要建
2、立单独的数据仓库?n操作数据库是为已知的任务和负载设计的,而数据仓库的查询通常是复杂的,涉及大量数据在汇总级的计算,可能需要特殊的数据组织、存取方法和基于多维视图的实现方法,在操作数据库上处理这些任务,会大大降低操作任务的性能。n另外,数据仓库与操作数据库分离是由于这两种系统中数据的结构、内容和用法都不相同。三、数据仓库的数据组织n(一)数据仓库数据组织方式n(二)数据仓库中的数据模型(一)数据仓库数据组织方式n数据仓库中数据的组织方式与操作数据库不同,通常采用分级的方式进行组织,一个典型的数据仓库的数据组织结构图如图9-1所示。在数据仓库中,数据被分成四种级别,分别是高度综合级、轻度综合级、
3、当前细节级、早期细节级。 后备数据后备数据后备数据后备数据元数据早期细节级当前细节级轻度综合级高度综合级图9-1 数据仓库数据组织结构图(二)数据仓库中的数据模型n1.多维数据模型的定义。多维数据模型的定义。由于数据仓库需要管理的数据量极为庞大,并且服务的目的不同,但是传统的数据建模方法主要面向事务型的分析处理工作,因此,需要有新的数据建模方法来完成数据仓库中数据的建模和组织,这种模型就是多维数据模型。n2. 几个相关的概念。几个相关的概念。 (1 1)数据立方体。)数据立方体。在多维数据模型中,数据是以多维逻辑方式 组织,数据在各个维之间相互交叉,形成立 体的数据视图即数据立方体。 (2)维
4、。)维。所谓维就是相同类数据的集合,是关于一个组织想要 记录的透视或实体。 (3 3)维表。)维表。每个维都有一个表与之相关联,该表称为维表,它 进一步描述维。n3.多维数据模型的存在形式。多维数据模型的存在形式。多维数据模式可以以星型模式、雪 花模式、事实星座模式的形式存在。四、数据仓库结构n(一)数据仓库的三层结构(如图(一)数据仓库的三层结构(如图9-2 所示)所示) (1) 底层是数据仓库服务器,它几乎总是一个关系数据库系 统,使用ODBC、OLE-DB、JDBC等连接程序,使用SQL 代码从操作数据库和外部数据源提取数据。 (2)中间层是OLAP服务器,其典型的实现是关系OLAP模型
5、和 多维OLAP模型。关系OLAP模型即扩充的关系DBMS,它 将多维数据上的操作映射为标准的关系操作。多维OLAP模 型是一种特殊的服务器,它直接实现多维数据和操作。 (3)顶层是客户,它包括查询和报告工具、分析工具和数据挖 掘工具。四、数据仓库结构查询/报告分析数据挖掘OLAP服务器OLAP服务器输出监控管理元数据存储数据仓库数据集市提取、清理转换、转入刷新操作数据库外部信息源数据数据底层:数据仓库服务器底层:数据仓库服务器中间层:中间层:OLAP服务器服务器顶层:前端工具顶层:前端工具图9-2 三层数据仓库结构四、数据仓库结构n(二)数据仓库模型(二)数据仓库模型1.企业仓库企业仓库 企
6、业仓库收集了关于主题的所有信息,跨越整个组织。企业数据仓库可以在传统的大型机上实现,需要广泛的商务建模,可能需要多年设计和建造。2.数据集市数据集市 数据集市包含企业范围数据的一个子集,对于特定的用户是有用的,其范围限于选定的主题。通常数据集市可以在低价格的部门服务器上实现。根据数据的来源不同,数据集市分为独立的和依赖的两类。3.虚拟仓库虚拟仓库 虚拟仓库是操作数据库上视图的集合。为了有效地处理查询,只有一些可能的汇总视图被物化。虚拟仓库易于建立,但需要操作数据库服务器具有剩余能力。五、数据仓库如何支持CRMn(一)数据仓库对(一)数据仓库对CRM的重要性。的重要性。 数据仓库可以将各个渠道得
7、来的数据整理成全面、完善的客户信息库。数据仓库内存储有详细的客户轮廓的信息和客户交易行为的历史数据,通过数据挖掘和数据分析,来发现隐藏在数据后面的真实情况,了解客户的需求,从而提高企业的收益率和竞争力。数据仓库是客户关系管理的基础,是CRM必需的基本技术。 五、数据仓库如何支持CRMn(二)(二)CRM中数据仓库的逻辑结构中数据仓库的逻辑结构 (见图(见图9-3)1、数据源、数据源 数据的来源主要有四个方面:客户信息、客户行为、生产系统和其他相关数据。 2、数据仓库系统、数据仓库系统 主要有数据仓库建设和数据仓库两个部分。数据仓库建设,利用数据仓库的数据ETL和设计工具将客户相关的数据集中到数
8、据仓库中。在数据仓库的基础上,通过OLAP和报表等将客户的整体行为分析、企业运营分析等传递给数据仓库用户。 3、CRM分析系统分析系统 由数据准备、客户分析数据集市、客户分析系统和调度监控模块构成。CRM分析系统的分析结果由OLAP和报表等,传递给市场专家。调度监控工具,负责控制客户分析系统的更新和维护。五、数据仓库如何支持CRM图9-3 CRM中数据仓库的逻辑结构图第二节 客户关系管理与数据挖掘n一、数据挖掘的基本定义n二、在CRM中应用数据挖掘n三、CRM中的数据挖掘流程一、数据挖掘的基本定义n简单地说,数据挖掘是从大量的数据中,抽取出潜在的,有价值的知识、模型或规则的过程。n数据挖掘的功
9、能大体可分为以下几种: 1.分类 2.聚类 3.关联分析 4.概念描述 5.孤立点分析 6.演变分析二、在CRM中应用数据挖掘n随着客户信息的日趋复杂,客户数据的大量积累,分析大量复杂的客户数据,挖掘客户价值,发现客户行为趋势,理解客户对企业的真正价值,用全生命周期的观点来分析客户关系是企业成功的关键因素,这些恰恰要依赖数据挖掘。n数据挖掘和数据库查询的不同点在于,数据查询只能根据现有的数据归纳一些事实,而数据挖掘可以发现事物之间的关系和隐藏的趋势与模式。n利用数据挖掘对这些数据进行分析,从中发现相关的知识和规律,可以使整个CRM系统形成一个闭环,充分发挥CRM系统的作用。三、CRM中的数据挖
10、掘流程n有效的有效的CRM中数据挖掘的基本步骤为:中数据挖掘的基本步骤为: 1.定义商业问题。定义商业问题。 2.建立营销数据库。建立营销数据库。步骤2到4是组成数据准备的核心。 3.探索数据。探索数据。 4.为建模准备数据。为建模准备数据。这是建立模型之前数据准备的最 后一步。主要有四个主要部分: (1)为建立模型选择变量 (2)从原始数据中构建新的预示值 (3)从数据中选取一个子集或样本来建立模型 (4)转换变量 5.数据挖掘模型的建立。数据挖掘模型的建立。 6.评价模型。评价模型。 7.将数据挖掘运用到将数据挖掘运用到CRM方案中。方案中。 第三节 应用案例n一、数据挖掘在证券行业中的应
11、用n二、数据挖掘在电信CRM中的应用一、数据挖掘在证券行业中的应用n(一)客户分析(一)客户分析 建立数据仓库来存放对全体客户、预定义客户群、某个客户的信息和交易数据,并通过对这些数据进行挖掘和关联分析,实现面向主题的信息抽取。 1.对客户的需求模式和盈利价值进行分类,找出最有价值和盈利潜力的客户群,以及他们最需要的服务,更好地配置资源,改进服务,牢牢抓住最有价值的客户。 2.通过对客户资源信息进行多角度挖掘,了解客户各项指标,掌握客户投诉、客户流失等信息,从而在客户离开券商之前,捕获信息,及时采取措施挽留客户。n(二)咨询服务(二)咨询服务 根据采集行情和交易数据,结合行情分析,预测未来大盘
12、走势,并发现交易情况随着大盘变化的规律,并根据这些规律做出趋势分析,对客户针对性进行咨询。 一、数据挖掘在证券行业中的应用n(三)风险防范(三)风险防范 通过对资金数据的分析,可以控制营业风险,同时可以改变公司总部原来的资金控制模式,并通过横向比较及时了解资金情况,起到风险预警的作用。n(四)经营状况分析(四)经营状况分析 通过数据挖掘,可以及时了解营业状况、资金情况、利润情况、客户群分布等重要的信息。并结合大盘走势,提供不同行情条件下的最大收益经营方式。同时,通过对各营业部经营情况的横向比较,以及对本营业部历史数据的纵向比较,对营业部的经营状况作出分析,提出经营建议。 二、数据挖掘在电信CR
13、M中的应用 在全球电信行业,数据挖掘技术已经被广泛应用于日常市场经营活动中,目前主要用于“分群”和“预测”。n(一)分群(一)分群 分群就是根据客户基本信息、客户的消费水平、客户的消费行为及客户与企业的交互,将客户分为不同的群,分群摆脱了传统的以客户价值为依据的“分类”思想,它综合考虑客户与企业交互的所有行为及基本人口统计信息。 电信企业有其先天性的IT优势,大量的数据包括: 客户基本信息、产品/服务使用信息、各种通话时长、各种通话费用、通话时间偏好、与企业互动信息等,都可拿来作为分群的变量(维度)。 电信运营商基于现有各种系统的数据作聚类,可能会得到:流失中用户群、长途用户群、数据业务用户群等。二、数据挖掘在电信CRM中的应用n(二)预测(二)预测 “预测”则是通过对客户过去在发生某种行为前一段时间的特定表现,来预测其他客户发生该行为的可能性。其主要应用包括流失预测、购买倾向预测、市场活动响应预测,通过预测模型可以大大提高流失中客户挽留率,提高市场活动响应率,从而保证企业持续增长的收入,提高营销活动的命中率。