[全]数据分析必备经典模型详解

上传人:赵**** 文档编号:157923849 上传时间:2020-12-28 格式:DOCX 页数:13 大小:22.79KB
返回 下载 相关 举报
[全]数据分析必备经典模型详解_第1页
第1页 / 共13页
[全]数据分析必备经典模型详解_第2页
第2页 / 共13页
[全]数据分析必备经典模型详解_第3页
第3页 / 共13页
[全]数据分析必备经典模型详解_第4页
第4页 / 共13页
[全]数据分析必备经典模型详解_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《[全]数据分析必备经典模型详解》由会员分享,可在线阅读,更多相关《[全]数据分析必备经典模型详解(13页珍藏版)》请在金锄头文库上搜索。

1、数据分析必备经典模型详解目标思维第一个要讲的思维是目标思维,很多人都觉得不屑一顾,但是很多人做数据分析之所以失败,恰恰就是没有这个目标思维因为只要找到了、找准了数据分析的目标,基本上能够解决数据分析场景里90%以上的问题首先何为目标?目就是眼睛,标就是靶子,也就是用眼睛盯着靶子瞄准,这就是目标思维大家可能会说这很简单嘛,那我们就举一个实际的业务场景例子来看一下,你们究竟是不是真的理解目标思维。某个租房APP最近新上线了一个二手房交易功能,业务找到你想让你分析一下,这个功能的用户使用人数有多少?首先我们看到这个业务问题,业务方已经提出了一个十分具体的问题,那就是:功能的使用用户有多少?于是一般没

2、有经验的数据分析小白就会去数据库取数,做个表格交给业务然而狗血的就是业务这时候就会说,这个数据不是我想要的,你再拿别的数据来;没办法,你只能再从数据库里重新取数。这时候你也许就会无语,明明是业务自己想要的数据,为什么还会这么多的扯皮和无效沟通其实原因很简单,因为业务想要的数据并不一定就是他真正需要的数据而我们在接到业务的需求之后,需要先想一下这个需求的真正核心目的是什么,如果知道了业务目标,那么就可以把这样一个取数需求变成一个分析类需求,最终的交付形式就成了一份PPT,这样就能避免成为取数机器。假如我们已经知道了业务的真实需求,是否就已经结束了?当时不是,我们需要通过这个目标确定我们分析的指标

3、,如果你没有清晰的业务目标,那么也就不可能制定出准确的数据指标。还是这个例子,如果业务人员很专业,让你分析一下这个二手房交易功能的留存率这时候如果你不去分析业务的分析目的,你还是会陷入误区,所以我一般听到业务人员跟我提这种具体的需求,我都会先反问一句“你分析这个指标的目的是什么”?如果业务说是为了验证功能的使用率,因为如果用户用过之后还会用,说明这个功能是有价值的。那么我们就要继续想,为什么要验证这个功能的价值,因为要确保这个功能能带来利润,帮助用户解决一些问题,我们才会添加这个功能。也就是说我们的分析目的要从产品角度出发,用户为什么要用这个软件?是为了租房子?那么我们就可以用成交率来衡量这个

4、问题,成交率与功能价值的关系显然更加密切。这就是目标思维,这个思维是数据分析的开始,一般不懂业务逻辑或者不懂目标思维的人是很难准备找到自己的分析目的的,所以我们以后在遇到需求的时候,先别急着取数据,先去想想目的是什么?假设思维假设思维简单来说,就是通过不断假设、不断论证、不断推理、不断推翻原假设的方式,直到去找到我们最终的真实原因或者结论比如说某APP的转化率下降了,我们不知道是什么原因,可能是业务运营差、可能是用户质量下降、可能是行业因素等等,我们不妨先假设一下:转化率下降是因为业务运营差那么为了验证这个观点,我们需要去找运营数据和转化率数据之间的逻辑关系,这就需要用到演绎思维了如果发现业务

5、运营效果跟以前是一样的,同时其他APP的转化率并没有因为运营而变差,那么就可以推翻这个假设,我们继而重新假设同样的,我们还是要注意假设思维中的一个误区:将假设当做预设。我们在进行假设的时候,很多数据分析师特别喜欢坚持自己的原有假设,那么最终的论证过程就变成了:比如还是刚才转化率的例子,我们为了证明“转化率低与运营效果差有关系”,就会找各种数据去验证这个假设,如果不能验证,就以为是数据不充分、或者还没找到合适的数据,直到我们去验证了这个假设。这就是把假设当做了预设的立场,很多人不敢去抛弃原来的假设,以为这样做是自己的能力不合格实际上,想要证明一个观点,只要你肯去找,不管观点多么荒谬,总能找到支持

6、你的理由。比如为了让你验证印度比中国更富有这个荒诞的假设,我们完全可以找出很多证据证明:印度每年30%-40%的GDP增长来自于生产力而非劳动力印度的耕地面积和人均耕地面积比中国多两倍印度不良贷款率比中国低很多相反的,为了证明印度比中国穷我也能找出很多理由:印度GDP总值和人均GDP均低于中国世界最贫穷的人口中有25%聚集在印度、居世界第一世界500强企业中中国远超印度所以真正的数据分析,一定要站在客观的角度,敢于去抛弃自己的假设溯源思维溯源思维简单来说就是对问题进行细分后再细分,把问题进行分解到可以找到原因,列出解决办法有时候我们不仅仅只使用对比思维和细分思维就可以得出来结果,这时候要想追溯

7、数据源,然后基于此思考数据源背后可能隐藏的逻辑关系,或许会有其他的数据结果比如说,某公司在全国有5个大区,其中华北大区今年未完成销量任务我们能够分析出是江苏地区的销量下降了,再细分是南京有问题很多人可能细化到这一步就结束了,因为地区维度已经细分到底了,不能继续细化到某个区某个街道等等但是根据溯源思维,我们需要找到事物本身发生的原因比如我们需要对北京地区的销量进行溯源分析,发现销量降低是因为客户数减少我们还要继续溯源客户数减少的原因,发现是因为竞争对手抢走了我们的客户继续溯源为什么竞争对手能抢走我们的客户,分析发现是竞争对手举办了优惠活动,吸引了大部分的客户那么我们就要采取一定的措施,比如提高优

8、惠程度,将客户重新拉回来这个就是溯源的思维,我们一定需要去追根到可以真正发现问题的原因,我们用溯源思维分析数据久了,我们对数据的敏感和业务的理解也能逐步加深逆向思维有时候我们做数据分析,不能仅仅依靠正常的逻辑推理,有时候需要灵活乍现、剑走偏锋,也就是逆向思维王老板花40元进了一双鞋,零售价50元。一个小伙子来买鞋,拿一张100元人民币,王老板找不开,只能去找邻居换了两张50,然后找给了小伙子50元。后来邻居发现这个100是假币,没办法王老板又还了邻居100问这场交易里,王大爷一共损失了多少钱?如果我们按照逻辑推理关系去慢慢推到王大爷亏了多少钱,恐怕非常困难,因为逻辑关系比较复杂,我们不妨用逆向

9、思维。题中问王老板损失多少钱,其实就是问小伙子赚了多少钱走,因为邻居没赔没赚,所以不考虑他。小伙子赚了多少钱?太简单了,就是一双鞋加50元零钱!在运营中,我们可以采用这种思维方式观察数据,或者不自觉地采用这种思维方式观察数据。我们将自己认知的正常的数据表现(大部分情况下出现的)进行详细的罗列,然后列出它们所对应的反常情况。在追踪数据时,我们的注意力就着重放在这些反常情况上。结构思维很多人在分析的时候没有思路,不知道从何下手,这就是缺少结构化思维的表现不如我们就直接看一下下面这个例子,看看大家是否具有结构化思维:一家线下零售企业最近某个产品的销售额下降了,让你找一下造成销售额下降的原因是什么。我

10、们看一下甲乙两个人的分析思路是什么?甲:先从时间维度上进行分析,看看销售额的下降是突然下降,还是持续性下降;然后再以门店为维度,看一下是不是因为地理位置的原因造成了下降;除此之外,还要对比一下横向的竞争对手,可以去问一些销售人员他们掌握的情况;对了,还有活动,有可能是因为活动造成的销售额下降。非常混乱对不对?这是因为我们在思考问题的时候,习惯用点对点的方式,想到一点就是一点也就是说是乱打枪,也许有可能你可以凭借着经验找到原因但是大多数情况下,你很难找到完全穷尽的原因,也就是为什么你的数据分析总是没思路乙:我们要分析的问题是销售额下降,一般来说会有内部和外部两个方面的原因内部就是自身的一些原因造

11、成了下降,外部原因是不受我们控制的不可抗力因素内部原因我们可以参照5w2h里的几个因素,when、why、who、how等外部因素包括市场竞争、市场容量、政策等知道了这些关键因素,我们再继续进行拆解,就能找出所有的可能原因这样分析是不是感觉清晰了许多?结构化思维方法是怎么处理这个问题呢?在面对这么一个问题时,结构化思维方法首先做的并不是立刻着手清洗数据。而是根据对业务的理解,先为数据分析画一个思维导图,它的作用相当于你来到一个陌生的城市拿出百度地图查询乘坐交通工具到入住的酒店的路线图。这个思维导图就是一个知道你到达目的地的路线图。事实上,结构化思维就是由麦肯锡提出的著名的“金字塔思维”,如下图

12、就是典型的结构化:无论是作为表达者、或者是信息接受者,都要先建立起符合金字塔结构的框架,然后按照逻辑、顺序等进行重点内容阐述而关于金字塔结构,我理解的关键核心就是“主要-重要-次要”其中的“主要”就是明确中心思想,对此书中提出了4种要求:“结论先行、以上统下、归类分组、逻辑递进”,这也是金字塔原理的四个原则其中的“重要”就是在建立金字塔结构时,一定要遵守先重要后次要、先全局后细节、先结论后原因、先结果后过程的原则进行内容安排最后的“次要”就是要把无关的、逻辑性差的、相关性低的因素和内容筛选出去更详细来讲就是:结论先行:中心思维要放在最前面以上统下:上一层一定要是对下一层内容的总结归类分组:每组

13、的思想要属于同一逻辑范围逻辑推进:每组的顺序要按照一定的逻辑关系归纳与演绎首先什么是归纳和推理?我直接简单举个例子就行了:归纳:树能燃烧、纸能燃烧、筷子能燃烧,所以木制品能够燃烧推理:木制品能够燃烧,筷子属于木制品,所以筷子能够燃烧。很显然,归纳是从个体属性出发,寻找因子之间的共性,总结出一个一般的特性而演绎则相反,是从一般整体出发,寻找事物之间的逻辑,从而得到某个个体的特性在实际的业务分析场景中,我们会潜移默化的用到演绎和归纳思维,比如说演绎法,我们最常见的就是三段论:大前提、小前提和结论。但是演绎法要注意避免一个大误区:比如“最近公司利润率下降,是因为成本过高,所以我们要降低大家的薪资。”

14、首先这个论断是基于演绎法的三段论,每一段论之间的逻辑关系都是正确的,利润率确实与成本过高有关,而成本自然也包括人力薪资的成本,看似好像逻辑紧密,但如果这个论断是真的,可能每个公司都会用这个理由裁员降薪了问题出在哪呢?明明每一段轮之间的关系都是有逻辑的,问题就出在大前提和小前提之间的论证是否真的有说服力比如说公司的利润率是否仅仅是因为成本过高?这是大前提的论证成本过高是否只能降低大家的薪资?这是小前提的论证很显然,这两个前提的论证过程是不严密的,因此会出现逻辑上的不通。那么归纳法就比较简单了,归纳法是从结果出发,寻找原因,通过观察对比、分析,找到事物之间因果关系的一种方法同样的,归纳法也要注意一

15、个误区:黑天鹅事件。农场主每天早上7点准时到鸡场里喂鸡,久而久之火鸡们都得出了一个结论就是农场主每天7点都会来喂鸡,但是圣诞节这天等到火鸡们的却是一把刀。这就是归纳法的一个致命误区,也就是以偏概全,我们无法阻止黑天鹅事件的发生相关思维在大数据时代,核心就是相关思维,这种思维是建立在相关分析的基础上。啤酒与尿布的故事,是一个相关分析的经典案例。这个故事产生于20世纪90年代的美国沃尔玛超市中,当时沃尔玛拥有世界上最大的数据仓库系统为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘,一个意外的发现是:跟尿布一起购买最多的商品竟是啤酒经过大量实际调查和分析,揭示了一个隐藏在尿布与啤酒背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%40%的人同时也为自己买一些啤酒产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。举个简单例子,一般来说女性去超市买的东西是化妆品、服装、时蔬等等,而男性去超市买的东西大多是日用品,所以超市里会设

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号