大数据分析与挖掘 实训4 基于决策树的客户流失预测及应对

上传人:知** 文档编号:183390436 上传时间:2021-06-04 格式:PPTX 页数:38 大小:3.24MB
返回 下载 相关 举报
大数据分析与挖掘 实训4 基于决策树的客户流失预测及应对_第1页
第1页 / 共38页
大数据分析与挖掘 实训4 基于决策树的客户流失预测及应对_第2页
第2页 / 共38页
大数据分析与挖掘 实训4 基于决策树的客户流失预测及应对_第3页
第3页 / 共38页
大数据分析与挖掘 实训4 基于决策树的客户流失预测及应对_第4页
第4页 / 共38页
大数据分析与挖掘 实训4 基于决策树的客户流失预测及应对_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《大数据分析与挖掘 实训4 基于决策树的客户流失预测及应对》由会员分享,可在线阅读,更多相关《大数据分析与挖掘 实训4 基于决策树的客户流失预测及应对(38页珍藏版)》请在金锄头文库上搜索。

1、,大数据技术在企业创新背景下高校物流人才培养中的转化与应用,基于决策树(C4.5)的电信客户流失预测及应对,开篇话题,讨论:如果有一个机会摆在你的面前,你还会选择你的中国移动或者中国联通吗?,开篇话题,任务背景电信企业现状,任务背景电信企业现状,某电信企业运营中积累了海量客户历史交易信息及客户个人数据 如何利用好现有数据进行客户特征分析、掌握流失动因、建立预警机制、减少客户流失?,问题提出案例背景,问题提出案例数据,电信客户流失数据体量:1000 instances,41 features,问题提出数据理解,目标:建立客户流失预测模型、构建客户流失预警系统,制定客户挽留策略,问题提出任务理解,

2、经过预处理后的数据集,构建空树。,选取未作判断的属性作为测试节点。,基于不同的划分标准,问题分析数据探索与挖掘,问题分析数据探索与挖掘,1.客户流失在年龄段的分布情况,1.客户流失在工龄段的分布情况,问题分析数据分析,3.客户流失在不同维度的分布情况,4.客户流失在工龄和收入两个维度上的分布情况,问题分析数据分析,问题分析数据探索与挖掘,四类流失客户在通话用时属性上的分布图,四类流失客户在通话用时属性上的箱线图,问题解决结果解读,四类流失客户在收入日志属性上的箱线图,四类流失客户在收入日志属性上的分布图,问题解决结果解读,流失预防,产品设计:满足细分客群 保存服务:存量保持套餐 细节管理:避免

3、蝴蝶效应 常客方案:客户忠诚激励,问题解决管理优化1-客户划分与流失预防,问题解决管理优化2-客户挽留,挽留策略 危机公关;降低负面影响 拉式营销:价格吸引-服务到家 广告策略:形象广告-创新告知 个案管理:实施正面蝴蝶效应,问题学习知识点学习1-客户流失管理,问题学习知识点学习2-数据挖掘,问题学习知识点学习2-数据挖掘,问题学习知识点学习2-特征分析,问题学习知识点学习2-特征分析,特征选择度量 信息增益(ID3, C4.5) 选取时,偏向于多值属性 增益率(C4.5) 偏向不平衡划分 Gini指标( CART, SLIQ, SPRINT) 偏向于多值属性 类的数量很大时,计算较困难,特征

4、选择度量 ANONA方差分析 变异系数分析 X 2 检验 统计样本的实际观测值与理论推断值之间的偏离程度 RelifF 特征权重算法 FCBA 一种快速过滤的特征选择算法 (X,Y)=2 (,) +(),特点 1.是一种以给定的数据样本为基础的归纳学习方法 2.在给定已知类标号的数据集的情况下,采用自顶向下的递归方式来产生一个类似于流程图的树结构,问题学习知识点学习3-决策树(C4.5)模型,经过预处理后的数据集,构建空树。,选取未作判断的属性作为测试节点。,基于不同的划分标准,C4.5决策树构建过程 使用训练集构建一棵决策树 对树减枝,得到最优决策树,问题学习知识点学习4-决策树构造流程,问

5、题学习知识点学习5-C4.5决策树生长算法,问题学习知识点学习6-C4.5决策树生算法实例,记录了某网球俱乐部2周时间每天的天气信息以及顾客是否光顾俱乐部的信息,第一步:计算样本集S的信息熵:,第二步:计算各属性对样本集的信息熵、信息增益、信息增益率: (1)Outlook属性将数据集划分为三个子集,与取值sunny、overcast、rain对应的三个子集的目标属性取值(yes/no)分布为:2/3,4/0,3/2。,(2)windy属性将数据集S划分为两个子集,与取值NO,Yes对应的两个子集的目标属性取值(yes/no)分布为:6/2,3/3。,最佳分裂点,(3)对于temperatur

6、e属性,(4)对于humidity属性,于是,信息增益率最大的属性是outlook,决策树根节点为outlook,包括三个分支。,问题学习知识点学习7-模型评估的指标和方法,问题学习知识点学习7-模型评估的指标和方法,精准率(P),召回率(R),F1= 2PR +,准确率(CA),正,负,真,假,ROC曲线,AUC,问题学习知识点学习7-模型评估的指标和方法,任务拓展快运企业客户流失预测,任务目标:1.通过深入挖掘历史客户流失数据,使用决策树算法构建电信客户流失预警系统; 2.从多个维度深入分析电信历史流失客户的特征,精准划分价值客户 数据:快运企业客户数据 具体要求:1.载入原始数据,深入理

7、解数据特征的含义,对任务场景有足够的把握; 2 . 数据清洗,过滤掉缺失值比重超过50%的属性特征,对其他存在缺失值的属性进行弥补缺失值处理; 3.通过数据可视化的方式(箱线图,散点图,马赛克图,分布图,线图)深入探索历史电信流失客户在不同维度上的分布状况; 4.将原始数据集随机采样成训练数据集(70%)和测试数据集(30%),并选用决策树算法构建电信客户流失预警模型,评估模型的性能; 5.构建树图,深入观察产生的决策树模型特征; 6.筛选出历史流失客户数据,从多个维度深入分析电信历史流失客户的特征形态,精准划分对企业产生不同价值的客户,并构建体系; 7. 针对不同的类型潜在流失客户制定不同的客户挽留策略和价值提升策略,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号