中高端保有(卡类流失到50元以下)_模型分析报告课件

上传人:我*** 文档编号:145180854 上传时间:2020-09-17 格式:PPT 页数:23 大小:111KB
返回 下载 相关 举报
中高端保有(卡类流失到50元以下)_模型分析报告课件_第1页
第1页 / 共23页
中高端保有(卡类流失到50元以下)_模型分析报告课件_第2页
第2页 / 共23页
中高端保有(卡类流失到50元以下)_模型分析报告课件_第3页
第3页 / 共23页
中高端保有(卡类流失到50元以下)_模型分析报告课件_第4页
第4页 / 共23页
中高端保有(卡类流失到50元以下)_模型分析报告课件_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《中高端保有(卡类流失到50元以下)_模型分析报告课件》由会员分享,可在线阅读,更多相关《中高端保有(卡类流失到50元以下)_模型分析报告课件(23页珍藏版)》请在金锄头文库上搜索。

1、卡类中高端用户价值降低预警模型分析报告,主要内容,背景介绍 分析目标 模型定义 数据分析与探索 模型构建 模型评估,背景,2008年底,运营商重组基本完成,随着全业务运营时代的来临,移动市场上客户争夺越演越烈,尤其是中高端客户市场硝烟四起,战火纷飞。,为了赢得这场战争,集团公司把中高端客户保有作为09年的战略目标之一,为各省公司下达了相应的中高端保有任务,而省公司也对市公司下发锁定中高端考核指标。,分析目标,利用客户近期通信行为,建立中高端客户的价值流失预警模型,预测集团公司下发的客户以及最新的中高段客户的价值下降的情况,使中高端客户保有更有针对性,更有效地支撑客户挽留活动,实现集团公司中高端

2、客户保有的目标。,模型定义,分析用户群: 集团公司下发的拍照用户中的卡类用户:08底在网且10、11、12月三个月累计ARPU不低于360元,且客户年底状态正常且12月是通话的卡类客户。 中高端客户:最近三个月账单总金额不小于360元的卡类用户,模型目标: 预测哪些客户的在预测窗口的ARPU将会低于50元,将此类用户定义为流失用户。 时间窗口:,构建模型时的时间窗口: 分析窗口:2008年10月至12月,选择拍照用户此窗口内的通信行为进行分析 预测窗口:2009年2月,用此窗口内的ARPU来打流失标签,主要内容,背景介绍 分析目标 模型定义 数据分析与探索 模型构建 模型评估 总结,数据分析与

3、探索,目标: 通过对数据质量的检查、各个变量关系的探索,选取进入逐步逻辑回归模型的变量 对象: 用户:944029个卡类拍照用户 数据:本地、长途、漫游通话,交往圈,ARPU等 方法: 值分析:对数据质量进行检查,处理缺失值 直方图分析:直观的看到该变量和流失的关系。 相关性分析:对于相关性比较大的变量,只选取其中一个进入模型。,数据分析与探索:直方图分析,通过直方图,我们可以直观的看到该变量和流失的关系。 我们按照等频分箱的方法,将用户分成10个箱,计算每个分箱内的流失率。 如右图所示,是按照网内主叫号码数将用户分成10个箱(尽可能使得每个箱里面的用户数相等)。 红柱子是该分箱内2009年2

4、月ARPU小于50元的用户(即流失的用户),紫柱子是该分箱内2009年2月ARPU大于等于50元的用户。 黄线是各个分箱的流失比率。蓝线是全体用户中的流失率。 观察第十个分箱的网内主叫号码数区间,可以发现此区间内包含比较异常的数据,而等频分箱的方法可以降低这类数据对分析的影响。,生成该直方图的数据,按照外内主叫号码数的多少将用户分成10个箱,用户数,流失率,网内主叫号码数,数据分析与探索:国内漫游,左图:有国内漫游被叫的人群流失率较高,其中被叫次数多的流失率又偏小 右图:由国内漫游带来的价值增长不太稳定,容易流失,本月国内漫游网内主叫次数,本月国内漫游网内主叫次数与最近三个月平均值的比值,数据

5、分析与探索:国内与省内漫游,从上面两图比较,省内漫游和国内漫游的情况有较大区别: 国内漫游的流失偏高 大部分用户省内漫游的流失偏低,本月国内漫游网内主叫次数,本月省内内漫游网内被叫次数,数据分析与探索:国内与省内长途,比较上面两图,国内长途和省内长途的区别: 在有国内长途的人群中,呼叫多的流失风险偏高 省内长途呼叫多的流失少,最近三个月国内长途主叫时长的平均值,有国内长途的人群,最近三个月省内长途主叫时长的平均值,数据分析与探索:网内通话占比,网内通话占比过高或者过低的人群,流失率都偏大。 当此比值是0.63到0.68时流失率最小,最近两个月网内通话占比的平均值,数据分析与探索:变量筛选,直方

6、图分析的结果还可以用于变量筛选:如果流失率曲线与变量的关系比较复杂,我们可以简单的将其排除在模型输入变量之外,或者利用分箱结果,生成一些标志变量。,本月被叫联通gsm号码数与最近三个月平均值的比值,本月ARPU与最近三个月平均值的比值,数据分析与探索:ARPU波动,在当本月ARPU波动较大的人群中,流失率较大 在模型构建时,我们有可以利用这一性质,生成新的变量,标识该用户的ARPU是否在本月波动较大,2.1793 =本月ARPU与最近三个月平均值的比值=3,本月ARPU与最近三个月平均值的比值,本月ARPU与最近三个月平均值的比值,主要内容,背景介绍 分析目标 模型定义 数据分析与探索 模型构

7、建 模型评估,模型构建:建模工具,该业务问题是一个二元预测问题,并且从数据探索的结果来看,与之相关的数据大都是数值型的数据,因而适合用逻辑回归的方法来建模。,Teradata Warehouse Miner能够方便的建立逻辑回归模型,并且能够很好的配合Teradata数据库进行大量数据的计算,是建模工具一个较好选择。,模型构建:建模流程,模型输入变量,训练集,测试集,LG模型,我们将944029个用户按照6:4的比例分成训练集(566417个用户)和测试集(377612个用户)来构建、评估模型。,模型结果,通过用训练集来建模,我们得到用户在下下个月arpu低于50元的概率为 :,其中Y=常数+

8、变量1*系数1+变量2*系数2+变量3*系数3 +。,注:1.系数是正的,说明该变量和流失是正相关。 2.如果从系数得出的相关性和直方图分析的结果不一致,应当对模型进行调整(比如去掉某些变量、合并某些变量)。 3.标准化系数消除了量冈的影响,可以用其绝对值大小来比较各个变量对流失的影响。,模型结果分析,主要内容,背景介绍 分析目标 模型定义 数据质量分析 数据探索 模型构建 模型评估,模型评估,我们使用命中率(Response %)、提升率(Lift)、覆盖率(Capture Respones%)来对模型进行评估: 命中率=提取的客户中流失的数目/提取的人数 提升率=命中率/总体的流失率 覆盖率=提取的客户中流失的数目/总体的流失的人数,模型评估,测试集评估结果: 前3%(约1.1万用户)的命中率为35%,提升率为4.1,覆盖率为12.3% 前5%(约1.9万用户)的命中率为31%,提升率为3.6,覆盖率为18%,模型部署,在模型建立好之后,我们将每月按照模型的打分公式给客户打分,并提供得分在前3%或者5%的客户名单。 为了保证模型的正确性,还将定期对模型进行评估,当模型退化严重时必须重新建模。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号