基于数据挖掘技术客户流失预警模型【摘要】结合客户细分的思想,提出了一种基于 慢启动的频繁模式挖掘算法,并基于该算法提出了一种新的 电信企业客户流失预警模型,湖南某大型电信企业基于该客 户流失预警,在其一个地市分公司进行了客户维系与挽留二 期工程的实施试点,试点结果表明,提出的客户流失预警模 型具有良好的预警功能关键词】客户流失 客户维系与挽留预警模型电信 企业一、 引言随着电信企业之间的竞争加剧,电信运营商不断推出新 的套餐和新的业务,希望能够争取到更多的市场份额但同 时也在很大程度上加大了客户的不稳定性,使得客户离网现 象频繁发生研究表明,一个公司如果将其顾客流失率降低 5%,利润就能增加25%至85%O由此可见,大量的客户流失 让运营商蒙受巨大损失结合客户细分的思想,本文提出了一种新的电信企业客 户流失预警模型二、 相关定义(一)客户流失的定义与分类客户流失只指客户因为某些原因与电信运营商解除服 务合同的行为客户解除服务合同的原因有多种多样,但归 纳起来主要有如下几类:自然流失:是指客户因为企业不能 给提供所期望的产品和服务(如不能提供宽带上网功能等) 或者某些客观因素(如到异地工作或下岗等)而选择离网所 导致的客户流失;恶意流失:是指客户因为个人私欲因素(如 恶意欠费后为了逃避缴费等)而选择离网所导致的客户流 失;竞争流失:是指客户因为企业竞争对手因素(如竞争对 手提供了更优惠的资费政策)而选择离网所导致的客户流 失;失望流失:是指客户因为企业服务质量因素(如网络覆 盖或服务态度等)而选择离网所导致的客户流失。
三、客户流失预警模型的构建(一) 客户细分客户细分有多种方法,如依据客户的性别、年龄、支付 能力、信用度等均可对客户进行分类在客户流失预警模型 中,我们依据客户对企业的贡献大小进行分类,主要分为以 下三种:高价值客户、普通价值客户、低价值客户假定企 业每月均摊到每个客户的日常维护成本为C,则各类客户定 义如下:高价值客户:是指月均话费大于等于kC的客户; 普通价值客户:是指月均话费介于1C到也之间的客户;低 价值客户:是指月均话费小于1C的客户二) 模型数据属性分析影响客户流失预警判定的数据属性通常多种多样,这些 属性之间存在着或强或弱的相关关系,以全部属性作为细分 标准显然过于复杂,并且也难于在实时环境中识别和追溯目 标;而任意选取其中某个或某几个属性又会影响对客户流失 行为的解释力度,降低预警效果因此,较为有效的方法是 从这些相互关联的影响属性中,通过约简算法抽取对客户流 失行为起关键影响的属性;或者对这些属性进行抽取整合, 重新构造少数关键指标,这些指标是原有影响属性(或称因 子)的线性组合,能综合原有影响属性的最大信息,相互之 间的相关性较小 )) 流失客户的特征挖掘基于慢启动的频繁模式挖掘算法。
在传统的频繁模式挖 掘研究中,项(Item)是一个文字,在交易数据库中,它可 以代表商品,在分类时,它可以代表属性的值设I二{□, 12, , Im}为项的全集,D={T1, T2, , Tn}为事务数据库,其中,每个事务Ti (i[l, 2,…,n])包含事务ID 号TID和一个I中项的子集Itemseto定义一:I的子集XI称作项集或模式项集X的支持度 计数supes_count (X)为D中包含项集X的事务数,X的支 持度 sup-port (X) =supes_count (X) /1D| ,其中 |D| 是 D 中事务的个数定义二:对于预先指定的最小支持度阀值8,如果项集 (模式)X的支持度满足:support (X) 8 ,则称项集(模 式)X是频繁的定义三(频繁数):频繁数是指在事务数据D中,数据 项的支持度大于最小支持度阈值的所有数据项个数的总和, 记为R定义4 (最高频繁项次数):最高频繁项次数是指在 所有的频繁模式中项数最高的频繁项的项的个数值,记为Mo定义判决函数f为频繁项次数和频繁数的如下线性组 合:f二aR+BM,其中,a和B为权重因子,满足a+B=l基于上述公式,可给出基于慢启动的频繁模式挖掘算法 的实现步骤如下:(1) 最小支持度阈值指数递增过程)Stepl:取一个较 小的8值作为初始最小支持度阈值,根据式(1)计算判决 函数f的值flo……Stepi:取2i-l 6作为最小支持度阈值, 计算判决函数值fi,若fiWfi-1,转入步骤i+1。
Stepi+1: 取21 8作为最小支持度阈值,计算判决函数值fi+1,若 fi+l>fi,转入步骤i+22) 最小支持度阈值线性递增过程)Stepi+2:取 2i-l 8 + ^作为最小支持度阈值,计算判决函数值fi+2,若 fi+2Wfi,转入步骤i+3……Stepi+1+k:取2i-l 6 + (k-1) Z作为最小支持度阈值, 计算判决函数值fi+1+k,若fi+l+k>fi+k,结束这样最小 支持度阈值线性递增过程结束,得到最小的判决函数值 fi+k,以及最终最小支持度阈值2i 8+ (k-1) J客户流失预警模型的建模过程主要包括如下几个步骤:①数据抽取:首先,从业务系统中抽取离;②网客户数 据作为训练数据集合;对训练数据集合中的数据进行属性约 简,并将约简后的属性集合作为模型的训练输入数据集合; ③采用基于慢启动的频繁模式挖掘算法对模型的训练输入 数据集合进行频繁模式挖掘,并基于挖掘得到的流失客户特 征构建分类器;④输入新的客户数据作为测试数据集合;对 测试数据集合中的数据进行属性约简,并将约简后的属性集 合作为模型的测试输入数据集合;⑤采用基于慢启动的频繁 模式挖掘算法对模型的测试输入数据集合中的每个用户对 应的数据集合进行频繁模式挖掘;⑥将挖掘得到的新用户的 特征与分类器中的特征集合进行模式匹配,判定该用户是否 会具有离网倾向。
将有离网倾向的客户集反馈给客户维系与 挽留系统,为客户服务部门开展客户维系与挽留工作提供决 策参考四、结论本文实现了一个分组模糊神经网络,具有较好的逼近能 力和泛化能力,同时也在一定程度上减少了训练时间本文 作者创新点:提出了一种用于模糊神经网络函数逼近的新方 法,将分组的思想与模糊神经网络相结合应用于函数的逼 近参考文献:[1] 何玉彬,李新忠.神经网络控制技术及其应用M.北 京:科学出版社,2000, (12).[2] 韩峻峰,李玉惠等•模糊控制技术[M].重庆:重庆大 学出版,2003, (10).[3] 高隽.人工神经网络原理及其仿真实例[M].北京:机 械工业出版社,2007, (05).[4] 胡德文,王正志等•神经网络自适应控制[M].长沙: 国防科技大学出版社,2005, (09).[4] 王士同•神经模糊系统及其应用[M].北京:北京航空 航天大学出版社,2008, (07).[5] 伍世虔,徐军•动态模糊神经网络[M].北京:清华大 学出版社,2007, (06).[6] 王立新著,王迎军译•模糊系统与模糊控制教程[M]. 北京:清华大学出版社,2009, (08).。