DM案例-1客户流失预测分析

上传人:liy****100 文档编号:58902645 上传时间:2018-11-02 格式:PPT 页数:45 大小:1.90MB
返回 下载 相关 举报
DM案例-1客户流失预测分析_第1页
第1页 / 共45页
DM案例-1客户流失预测分析_第2页
第2页 / 共45页
DM案例-1客户流失预测分析_第3页
第3页 / 共45页
DM案例-1客户流失预测分析_第4页
第4页 / 共45页
DM案例-1客户流失预测分析_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《DM案例-1客户流失预测分析》由会员分享,可在线阅读,更多相关《DM案例-1客户流失预测分析(45页珍藏版)》请在金锄头文库上搜索。

1、TeradataTM Warehouse Miner Training Workshop 案例-1 客户流失预测分析,CMCC HQ ZhangLei Sunstone.ZhangTERADATA-NCR.COM,为什么进行客户流失预测? 移动服务的竞争进入白热化状态 月平均流失率6.5%(即随机抽样10000人中只能找到650个真正有流失倾向的客户) 月租型, 流失预测模型结果 找出流失倾向最高的客户, 前10000人名单中,约8000人(80%)下个月会流失 找出导致客户流失的原因以辅助设计和执行客户挽留的行销活动。 数据挖掘自动化机制更有效地利用挖掘的结果,专题概要,预测性 模型,响应

2、模型,自动化,分段,描述性 模型,根据业务目标对对象属性的初步划分 年龄分组; 商业用户/ 个人用户; 客户价值,根据业务目标对对象属性的描述 保有期(与客户价值有关); 信用评分,根据相关属性将对象划分到已定类别,以便针对性对待 流失倾向评分 使用量预测,现实模拟以改善预测能力、可控性和实施效果 购买倾向评分,挖掘结果的发布: 调度执行 收集响应 监控模型性能 记录结果,分析模型的种类,Partly adapted from Fayyad U. M., Piatetsky-Shapiro, P. Smith (1995), From Knowledge Discovery to Data M

3、ining: An Overview in Advanced Knowledge Discovery and Data Mining.,数据挖掘方法论,在这个数据挖掘的初始阶段,需明确阐述项目目标和客户业务需求。基于客户响应(如客户流失或产品购买趋势)特性,可以从概念上定义响应变量,与待选的预测变量没有直接的派生关系直接的派生关系意指响应变量可由一或多个预测变量直接计算出来。最终,为了这些目标可以必要地调整项目计划进程。包括 明确业务目标 定义响应变量 项目计划必要的调整,业务问题定义,搜寻并检查客户数据,创建一个数据映射概念图,将客户数据与建模相关的各个属性对应起来。数据能被整合到一个适当的

4、程度,省略不适当的记录(如若分析仅针对居民客户,则省略非居民客户)、不完整的数据记录、训练数据、试验数据等等。包括: 数据来源 数据映射 准备数据评估 数据的必要聚合 数据抽样,选取和抽样,核查目前的数据源,探索在每个待选的预测变量和响应变量之间是否存在关系。数值分析是全面理解数据的第一步,随之进行的统计分析便于更好地了解有关数据的分布。包括: 数据质量检查 数据的必要整理 通过图形化呈现工具和其他的统计方法理解数据 分析待选预测变量和响应变量之间的关系 数据转换以辅助数据的分析 数据派生为建立模型做准备 整理和呈现数据探索的发现,探索型数据分析,建立并确认分析模型,尝试不同的建模技术或结合不

5、同数据集,并比较不同模型的性能,选出最好的。包括: 为模型的训练和验证准备数据集 在模型的建立中使用适当的建模技术 针对不同的建模技术测试模型性能 必要地精炼分析模型 和主题专家一起检验分析模型 记录分析模型和结果,建模,用模型的结果来协助业务开展、战略设计和战术实施。收集结果进行反馈,为模型的退化进行侦测,更进一步改善模型性能。,实施,具体实施过程,以号码为单位 用户在网时间至少3个月 分析流失前6个月的数据以了解可能流失原因 正常用户 状态为正常 或 停话或强开 若状态为停话,停话原因属于自愿停话: 报停双停 报停单停 报停完全 挂失双停 挂失单停 挂失完全 若状态为停话,停话原因属于非自

6、愿停话: 冒高双停 冒高单停 欠停双停 欠停单停 强关双停 强关单停 强关完全 预拆 最近停话期间少于3个月 且6个月內至少有一次缴费记录 流失客户 状态为预销或预拆(一个月以上),客户流失的定义,业务理解,客户数据,合约属性,交互行为,客户忠诚度,支付行为,使用行为,近一个月缴费额 近三个月平均缴费额 近六个月平均缴费额 六个月通话移动平均 六个月通话移动差 受话次数/秒数 受话号码数 发话次数/秒数 拨打号码数 发短消息次数 话转比例 漫游次数 网内拨打比例 拨打固话次数 拨打简码次数 通话异常中断次数,迟缴次数 欠缴金额 催缴次数 催缴成功次数,累计积分数 已兑换次数 已兑换分数 兑换类

7、别,限话次数 联络次数 接触次数 接触类别 抱怨次数 查询销号离网次数 资费套餐变动 IMSI_DN更换次数 客户状态变化情况,使用期 年龄 资费套餐 所属地区 缴费方式 性别 合约多号码 客户类型 证件多号码 开通类型,分析月租型流失用户的数据来源,数据质量问题,50元月租全球通,20元月租全球通, 20元月租套餐,20元月租亲情卡,事事发,0元月租惠通卡,30元月租套餐等资费套餐的客户。 有过资费调整的客户。 在J地区,S地区,X地区,JZ地区,Y地区,L地区的用户流失倾向较高。 年龄不超过30岁的年轻族群流失比例高。 最近一个月缴费额不超过前两个月平均缴费额 在网时间少于17个月 六个月

8、内迟缴次数超过5次,流失客户特征,近六个月內有限话记录的客户。 被叫次数不超过主叫次数的34%。 近三个月主叫固网时长比例不超过8%或超过80%。 近三个月內不曾不超过2个 三个月内被叫次数不超过20次。 三个月内主叫次数不超过45次。 三个月内被叫不同号码不超过17个 三个月内主叫不同号码不超过11个 三个月内主叫秒数不超过2465秒 三个月内发送短消息不超过2个,流失客户特征 (续),模型结果,模型评分,最近一月出账与近三月平均出账额 比例不超过0.33 曾限话 最近一个月出账额不超过14元 更换过资费套餐 近六个月迟缴超过5次 在特定地区 得分:0.765分,最有可能销号的客户群组 #1

9、,最近一个月缴费额不超过前两个月平均缴费额 曾限话 最近一个月出账金额不超过14元 曾更换资费方案 六个月内迟缴5次以上 属于(J地区,S地区,X地区, JZ地区,Y地区,L地区) 资费属于低档普通套餐 近三个月被叫次数不超过20次,最近一个月缴费减少 曾限话 低档资费套餐 经常迟缴 更换过资费方案,最有可能销号的客户群组 #2,最近一个月缴费额不超过前两个月平均缴费额 曾限话 最近一个月出账金额不超过14元 曾更换资费方案 不属于(J地区,S地区,X地区, JZ地区,Y地区,L地区) 通过直属营业厅入网 六个月内迟缴5次以上 近三个月被叫不同号码数不超过11个 欠费金额在-246.37和14

10、31.87之间 被叫费用不超过13.67元 低档资费套餐 更换过SIM卡,最近一个月缴费减少 曾限话 曾更换资费方案 普通低档资费套餐 缴费行为较差,模型评估 命中率,X轴:按离网倾向评分从大到小排序后的客户占目标客户人数的百分比; Y轴:前x%的客户中被准确预测为离网的客户占这批客户的百分比,即命中率,X轴:按离网倾向评分从大到小排序后的离网客户占离网总人数的百分比; Y轴:(前x%的客户中的命中率)/离网率,模型评估 LIFT,客户流失模型的输出结果中包括一个客户流失指数,用来做为客户流失的概率(介于0到1之间),以区别不同客户间流失可能性的高低,如一个流失指数为0.8的客户比一个流失指数

11、为0.6的客户更可能离开。当营销部门欲推行一客户挽留计划,可按照客户流失指数的高低对客户排序,找出最可能流失的客户群,以最少的成本,最适当的沟通,达成最佳的客户挽留效果。,模型发布,客户离网0.851预测分析图:,客户离网预测分析图,钻取结果,启动,选择,下钻,获取,前端应用,数据挖掘自动化,自动化建模过程和结果 数据抽取,变换,衍生和评分自动化。 创建新的数据立方体或报表以产生挽留客户名单并提供各种流失群组的客户特征描述。 自动计算命中率/Lift报告以监测模型性能 综合信用模型/客户价值模型的结果确定目标客户,Data Mart,建模人员,数据挖掘自动化,数据挖掘平台,关键问题,数据挖掘需

12、要足够的历史数据支持(按照经验,一般需要积累6个月的历史数据) 数据挖掘需要正确的完备的数据支持(错误的数据之上无法挖掘出正确的结果),而PDM和ETL需要一段时间进行模型的完善和数据质量检查 不同省份的数据中蕴含着不同的规律,因此对A省移动挖掘专题来说重要的那些属性未必同样适用于B省,需要进行大量的数据探索和业务理解; 数据挖掘本身需要多次的试验,以确定合适的模型、合适的变量选择以及合适的数据 数据挖掘是一个过程而非产品,需要人的大量参与和分析,而这个过程又常常需要螺旋式的循环往复,以达到比较理想的目标 就A省移动的经验来说,客户流失预测专题一共用了三个月得到初步的结果,然后的两个月进行了调

13、整使之稳定;因此对于B省移动来说,预计在ETL基本完成后需要花费至少三个月的时间来完成流失预测专题,关键问题业务闭环的形成,数据采集/ETL,分析报表 & OLAP,数据挖掘,经营分析,信息反馈,主动营销,任务分配,营销活动策略制定,客户服务,客户,客户服务中心,现状分析支撑系统相对孤立,系统关系,场景假设 假设某地区客户规模为200万,通过对客户离网情况的分析,建立离网规则模型,并对该地区的客户进行分析,获取预离网客户名单,针对客户的特点设计营销活动方案进行客户挽留。 角色分配 市场分析师:提取预离网客户规则;打分、提取预离网客户列表;对预离网客户进行细分;评估挽留工作的效率和效果 营销策划

14、人员:进行营销措施设计 张三:某省移动通信用户用户,其身份是某集团客户中的金卡客户 李四:某省移动通信公司用户,其身份是普通客户,业务闭环客户挽留案例,业务闭环客户挽留案例,1、确定离网客户样本范围,业务闭环客户挽留案例,变量选择及数据抽样 数据探索 建模(获取流失特征) 评分并生成挽留名单(预测流失倾向) 结果发布,业务闭环客户挽留案例,7、市场分析师需对预离网客户列表进行细分,业务闭环客户挽留案例,8、营销策划人员进行营销措施设计,市场分析师,张三属于集团高收入群体,其对集团新业务非常感兴趣,建议通过客户经理与客户接触,为客户设计适合本集团的新业务综合解决方案进行挽留,李四,由于其属于只对

15、长途业务感兴趣的群体,因此通过为客户设计IP长途放心打的业务方案,挽留客户,业务闭环客户挽留案例,9、营销策划人员对营销措施的可行性分析,市场分析师,成本分析,时效性分析,业务闭环客户挽留案例,10、提供给市场部经理,供领导决策。审批后再提供给业务支撑部门,业务闭环客户挽留案例,11、挽留李四,IP电话的重度使用者(月平均IP费用达到80元),无论IP通话时长、通话次数均明列前茅 漫游费用第2高(月均30元 本地通话费用也较高(月均90元),呼叫中心,IP放心打,李四,接受,为客户办理相关手续,业务闭环客户挽留案例,12、挽留张三,大客户经理,张三,推荐新业务综合解决方案,接受,监督实施,业务闭环客户挽留案例,13、结果反馈,BASS,BOSS,业务闭环客户挽留案例,14、市场分析师总结,并对异动规则、挽留方案进行调整优化。,市场分析师,离网规则,挽留方案,Questions ?,Open Discussion,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号