【大数据分析技术系列】构建有指导的数据挖掘模型方法

上传人:xzh****18 文档编号:44551565 上传时间:2018-06-14 格式:PDF 页数:11 大小:396.77KB
返回 下载 相关 举报
【大数据分析技术系列】构建有指导的数据挖掘模型方法_第1页
第1页 / 共11页
【大数据分析技术系列】构建有指导的数据挖掘模型方法_第2页
第2页 / 共11页
【大数据分析技术系列】构建有指导的数据挖掘模型方法_第3页
第3页 / 共11页
【大数据分析技术系列】构建有指导的数据挖掘模型方法_第4页
第4页 / 共11页
【大数据分析技术系列】构建有指导的数据挖掘模型方法_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《【大数据分析技术系列】构建有指导的数据挖掘模型方法》由会员分享,可在线阅读,更多相关《【大数据分析技术系列】构建有指导的数据挖掘模型方法(11页珍藏版)》请在金锄头文库上搜索。

1、 I 【大数据分析技术系列】【大数据分析技术系列】 构建有指导的数据挖掘模型构建有指导的数据挖掘模型方法方法 目目 录录 有指导数据挖掘方法:有指导数据挖掘方法: . 1 1 步骤:步骤: . 2 2 1、把业务问题转换为数据挖掘问题 . 2 1.1 如何使用结果? . 3 1.2 如何交付结果? . 3 2、择合适的数据 . 4 2.1 什么数据可用? . 4 2.2 多少数据才足够? . 4 2.3 需要多久的历史? . 5 2.4 数据必须包含什么? . 5 3、认识数据 . 5 3.1 检查分布 . 6 3.2 值与描述的比较 . 6 3.3 询问大问题 . 6 II 4、创建一个模型

2、集 . 6 4.1 聚合客户签名 . 6 4.2 创建一个平衡的样本 . 7 4.3 时间帧 . 7 4.4 创建一个预测模型 . 7 4.5 创建一个剖析模型集 . 8 4.6 划分模型集 . 8 1 1 数据挖掘的目的,就是从数据中找到更多的优质用户。什么是有指导的数据挖掘方法模型, 以及数据挖掘如何构建模型。 在构建一个有指导的数据挖掘模型,首先要理解和定义一些模型试图估计的目标变量。一个典型的案例,二元响应模型, 如为直接邮寄和电子邮件营销活动选择客户的模型。模型的构建选择历史客户数据,这些客户响应了以前类似的活动。有指导数据挖掘的目的就是找到更多类似的客户,以提高未来活动的响应。 这

3、构造有指导的数据挖掘模型的过程中, 首先要定义模型的结构和目标; 二、增加响应建模。三、考虑模型的稳定性;四、通过预测模型、剖析模型来讨论模型的稳定性。下面我们将从具体的步骤谈起,如何构造一个有指导的数据挖掘模型。 有指导数据挖掘方法:有指导数据挖掘方法: 把业务问题转换为数据挖掘问题 选择合适的数据 认识数据 创建一个模型集 修复问题数据 转换数据以揭示信息 构建模型 评估模型 部署模型 评估结果 重新开始2 2 步骤:步骤: 1、把业务问题转换为数据挖掘问题、把业务问题转换为数据挖掘问题 爱丽丝梦游仙境中,爱丽丝说“我不关心去哪儿”。猫说:“那么,你走哪条路都没什么问题”。 爱丽丝又补充到

4、: 只要我能到达某个地方。 猫: “哦,你一定能做到这一点,只要你能走足够长的时间。” 猫可能有另外一个意思,如果没有确定的目的地,就不能确定你是否已经走了足够长的时间。 有指导数据挖掘项目的目标就是找到定义明确的业务问题的解决方案。 一个特定项目的数据挖掘目标不应该是广泛的、 通用的条例。 应该把那些广泛的目标,具体化,细化,深入观察客户行为可能变成具体的目标: 确定谁是不大可能续订的客户 为以家庭为基础的企业客户设定一个拨打计划,该计划将减少客户的退出率 确定那些网络交易可能是欺诈 如果葡萄酒和啤酒已停止销售,列出处于销售风险的产品 根据当前市场营销策略,预测未来三年的客户数量3 3 有指

5、导数据挖掘往往作为一个技术问题, 即找到一个模型以解释一组输入变量与目标变量的关系。这往往是数据挖掘的中心,但如果目标变量没有正确的定义以及没有确定适当的输入变量。反过来,这些任务又取决于对要解决的业务问题的理解程度。没有正确的理解业务问题就没办法把数据转化为挖掘任务。在技术开始之前,必须认识两个问题:如何使用结果?以何种方式交付结果? 上述两个问题, 都是建立在客户的真正需求是什么?而不是作为数据挖掘工程师认为的什么是有用的数据,什么对客户最好的数据。这些结果看似有利于客户提高销售额,但是我们交付的结果是什么,我们有理解客户的需求吗?所有前提,不要着急急着动手,先理解真正需求,不可盲目主断。

6、 1.1 如何使用结果?如何使用结果? 例如:许多数据挖掘工作旨在提高客户保留 主动向高风险或高价值的客户提供一个优惠,挽留他们 改变获取渠道的组合,以利于那些能带来最忠实客户的渠道 预测未来几个月的客户数量 改变会影响客户的满意度的产品的缺陷 这些目标都会对数据挖掘过程产生影。响。通过电话或直接邮寄的营销活动接触现有客户, 意味着除了确定客户风险之外, 你要了解为什么他们处于风险中,从而可以构造一个有吸引力的优惠。电话,不能过早或过迟。预测意味着除了确定那些客户可能离开,确定有多少新客户加入,以及他们会停留多久。而新客户的加入,不只是意味着预测模型要解决的问题,还是被纳入到业务目标和预算之中

7、。 1.2 如何交付结果?如何交付结果? 有指导的数据挖掘项目可能会产生几个不同类型的交付形式。 交付形式往往是一个报表或充满图标和图形的简报。交付形式会影响数据挖掘的结果。当我们的目的是提醒销售惊雷时,产生一个营销测试的客户列表是不够的。所谓的如何交付结果,就是在挖掘结果产生之后,我们要如何给用户提供这个结果,目的是好的,但实际的过程中会遇到,会遇到我们没有办法去交付这个结果。因为,你交付的结果,可能会导致一些本不该流失的客户,却流失了。这也是在具体工作之前,我们要考虑的问题。 数据挖掘人员的作用是确保业务问题的最后表述可以被转换成一个技术问题。前提是正确的业务问题。4 4 2、择合适的数据

8、、择合适的数据 2.1 什么数据可用?什么数据可用? 寻找客户数据的首要地方就是企业数据仓库。 仓库中的数据已经被清洗和核实过, 并且多个数据源被整合到一起。一个单一的数据模型有望确保命名相似的字段在整个数据库和兼容的数据类型中都有相同的含义。 企业数据库是一个历史数据库,新数据不断的被追加,但历史数据一直不变。从这一点更有利于做决策支持。 问题在于,在许多企业组织中,这样的数据仓库实际上并不存在,或者存在一个或多个数据仓库,不符合直接作为规范的数据用来挖掘。在这种情况下,挖掘人员,必须寻求来自不同的部门的数据库和业务系统内的数据。业务系统数据是指执行一个特定的任务,如网站运行,索赔处理,完成呼叫或账单处理。它们的目标是快速、准确

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号