简单实用的电商数据分析方法论

上传人:桔**** 文档编号:469754738 上传时间:2023-11-06 格式:DOCX 页数:7 大小:16.98KB
返回 下载 相关 举报
简单实用的电商数据分析方法论_第1页
第1页 / 共7页
简单实用的电商数据分析方法论_第2页
第2页 / 共7页
简单实用的电商数据分析方法论_第3页
第3页 / 共7页
简单实用的电商数据分析方法论_第4页
第4页 / 共7页
简单实用的电商数据分析方法论_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《简单实用的电商数据分析方法论》由会员分享,可在线阅读,更多相关《简单实用的电商数据分析方法论(7页珍藏版)》请在金锄头文库上搜索。

1、简单实用的电商数据分析方法论导读:说到数据分析,大家可能就会想到回归,聚类什么的,不过对于电商的小伙伴来 说,这些都太复杂了。而实际分析的时候,其实并不需要这么复杂的算法,大家需要的只是:对比细分转化分类只要掌握了这四种思想,基本上己经可以应付日常的分析工作了。一、对比思想数据对比主要是横向和纵向两个角度,指标间的横向对比帮助我们认识预期值的合理 性,而指标自身在时间维度上的对比,即我们通常说的趋势分析。以店铺的成交额分析为例:纵向对比我们可以把最近30天的成交额显示在坐标轴上,这样就可以很明显的看到最近的成交 额是否达到了预期,当然我们也可以以周或者月(或者季度,年等等)为单位。所有的分析其

2、实都必须要考虑实际的场景,我们看到今天的成交额比昨天大也许说明的 问题还是很有限,因为今天和昨天的性质可能未必一样,例如今天可能是周六,或者恰好是 节假日等等。所以我们在做纵向对比的时候,例如要判断今天(假设是周六)的成交额是否 合理,除了看最近30天的趋势数据,我们还可以考虑:最近10周的周六成交额趋势如果今天恰好是一个节日,例如双十一,那么可以考虑和上一年的双十一做一个对比。 (说明:因为间隔时间比较长,数据反映出来的意义可能比较有限)横向对比例如我们说,店铺这周的成交额上涨了 10%,那我们是不是应该高兴呢?当然应该高兴,不过这个上涨的背后是否隐含着什么危机呢?当然是有的,例如你的竞 争

3、对手们这周的成交额都上涨了 20%!当你洋洋得意的时候,可能己经被竞争对手拉开距 离了。也就是说,我们对一个现象判断好不好,这是需要一个参照系的。在现在的电商时代, 你完全有可能知道竞争对手的成交额上涨了多少的。再举一个更常见的例子:假如我在不同的地方(或者平台)开了很多家店铺,某商品的成交额在A店铺上涨了 10%,那这个是否值得高兴?这个显然未必,我们还要对比商品A在各家店铺的上涨情况,例如可以对比平均曲线。二、细分思想使用转化的思想,我们己经基本可以判断一个指标(例如成交额)是否合理了。不过还 仅仅知道是否合理是不够的,我们还需要知道问题所在,这时可以用上细分的思想了。通过 细分的思想,我

4、们可以对分析对象剥维抽堇,逐步定位到问题点。细分的角度可以有很多, 越细分越能准确描述问题。例如,我们通过查看趋势,知道了这个月成交额下降了这个问题后,现在我们用细分的 思想来找出问题的所在:成交额细分成交额=客单价X客户数对比客单价和客户数的趋势,就可以判断出影响成交额变化的主要因素是什么,如果是 客户数问题,我们则对客户数进行细分,如果是客单价问题,则对客单价进行细分。客户数细分客户数=新客户+老客户老客户=二次成交客户+多次成交客户一段时间内的新客户反映的是店铺的引流效果,而老客户反馈的是店铺的产品质量,服 务质量和客户维护营销等。对于店铺来说,促成二次成交都是非常重要的,特别是对于电商

5、客户,因为对于电商, 客户转移的成本比线下低很多0客单价细分客单价=成交价X人均成交数人均成交数这是店铺一个非常值得关注的指标,它能最直接地反馈出店铺在服务质量和 客户维护营销等方面的效果,如果该值过小表明店铺的客户流失率很大,应该重点关注。成交价反馈的通常是导购的能力,促销活动的效果等,具体还可以对这个指标进行分解。成交价细分成交价=件单价X连带率成交价的上升或者下跌,反映的问题可能很多,对其进行分解后就很明确了。件单价的变化通常是有促销的力度,商品结构和消费结构(例如季节因素等)变化引起 的。连带率这个反馈的是店铺内导购的能力,或者促销手段(例如买一送一等)的效果,也 是店铺管理人员重点要

6、关注的指标。细分思想其实就是不断用更小的量化指标去细分一个大的指标,从而这到定位问题的目 的。三、转化思想细分的思想可以从纵向定位问题,但是单单细分是不够的。这些指标是从哪里来的,每 一个步骤的转化率怎么样,哪一个步骤的转化不好,可以改善?这些通过转化率都可以分析 出来。例如我们要分析本周的活跃客户数(有成交的客户数),那么我们就要分析这些活跃的 客户数是从哪里来的,梳理一下可以简单分为以下4个步骤:进入店铺的客户数=浏览过商品的客户数=下单的客户数=交易成功的客户 数这里4个步骤就会有3个转化率,哪些步骤转化率比较高,哪些步骤转化率比较低,历 史趋势怎么样,是否合理,是否有改进的空间等等。通

7、过应用转化的思想,能够有效的指导 和优化实际的运营工作。四、分类思想上面我们己经介绍了对比,细分和转化三种实用的数据分析思想,现在我们还有再介绍 一种非常实用的思想,那就是分类思想。分类思想简单的说,就是把一些对象,按照某种规则,划分为若干个类别,然后分析各 个类别的特征,并以此来指导我们的行动。严格说,分类其实也是细分的一种,不过因为它比较重要,所以独自开来。分类思想的应用很多,例如对客户的分类,我们可以用RFM分析模型,也可以用简单 的利用某个指标的值(例如渠道标识,这样我们就可以分析到各个渠道客户的质量等)。基 于这些客户的分类,我们就可以进行精准的客户营销了。在电商或者零饵业上,我们经

8、常做的分类还有商品分类,经典的有按照品类分类,或者 ABC分类,这些对于我们做商品运营都是非常重要的。当然还有非常复杂的分类方法,例如聚类算法,不过这些不在我们的讨论范围内。一、统计分析方法论: 料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估 计和描述的方法。目的是描述数据特征,找出数据的基本规律。描述统计分为集 中趋势分析和离中趋势分析和相关分析三大部分。在数据的预处理部分,我们曾经提到利用频数分析和交义频数分析来检验异 常值。此外,频数分析也可以发现一些统计规律。比如说,收入低的被调查者用 户满意度比收入高的被调查者高,或者女性的用户满意度比男性低等。不过这些 规律

9、只是表面的特征,在后面的分析中还要经过检验。(2)数据的集中趋势分析:数据的集中趋势分析是用来反映数据的一般水平, 常用的指标有平均值、中位数和众数等。各指标的具体意义如下:平均值:是衡量数据的中心位置的重要指标,反映了一些数据必然性的特点,包 括算术平均值、加权算术平均值、调和平均值和儿何平均值。中位数:是另外一种反映数据的中心位置的指标,其确定方法是将所有数据以由 小到大的顺序排列,位于中央的数据值就是中位数。众数:是指在数据中发生频率最高的数据值。如果各个数据之间的差异程度较小,用平均值就有较好的代表性;而如果数据之 间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代

10、 表性。(3)数据的离散程度分析:数据的离散程度分析主要是用来反映数据之间的差 异程度,常用的指标有方差和标准差。方差是标准差的平方,根据不同的数据类 型有不同的计算方法。(4)数据的分布:在统计分析中,通常要假设样本的分布属于正态分布,数据 的正态性离群值检验,己知标准差Nau检验,未知标准差时,有Gnibbs检验, Dixon检验,偏度-峰度法等。其中常用偏度-峰度法需要用偏度和峰度两个指标 来检查样本是否符合正态分布。偏度衡量的是样本分布的偏斜方向和程度;而峰 度衡量的是样本分布曲线的尖峰程度。一般情况下,如果样本的偏度接近于0, 而峰度接近于3,就可以判断总体的分布接近于正态分布。(5

11、)绘制统计图:用图形的形式来表达数据,比用文字表达更清晰、更简明。 在SPSS软件里,可以很容易的绘制各个变量的统计图形,包括条形图、饼图和 折线图等。2. 假设检验:是数理统计学中根据一定假设条件由样本推断总体的一种方法。具 体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的 统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的 样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或 接受假设H0的判断。常用的假设检验方法有u检验法、佥验法、Z2检验法(卡 方检验)、F检验法,秩和检验等。3. 相关分析:相关分析是研究现象之间是否存在某种

12、依存关系,并对具体有依存 关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一 种统计方法。常见的有线性相关分析、偏相关分析和距离分析。相关分析与回归 分析在实际应用中有密切关系。然而在回归分析中,所关心的是一个随机变量Y 对另一个(或一组)随机变量X的依赖关系的函数形式。而在相关分析中,所 讨论的变量的地位一样,分析侧重于随机变量之间的种种相关特征。例如,以X、 Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X 去预测Yo4. 方差分析(Analysis of Variance,简称ANOVA): 乂称变异数分析”或“F检验”, 是R.A.Fisher

13、发明的,用于两个及两个以上样本均数差别的显著性检验。由于 各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一 是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量 有显著影响的变量。5. 回归分析:回归主要的种类有:线性回归,曲线回归,二元logistic回归,多 元logistic回归。回归分析的应用是非常广泛的,统计软件包使各种回归方法计 算十分方便。一般来说,回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建 立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否

14、能 够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测。6. 聚类分析:聚类主要解决的是在“物以类聚、人以群分”,比如以收入分群,高 富帅VS矮丑穷;比如按职场分群,职场精英VS职场小白等等。聚类的方法层出不穷,基于用户间彼此距离的长短来对用户进行聚类划分的方法 依然是当前最流行的方法。大致的思路是这样的:首先确定选择哪些指标对用户 进行聚类;然后在选择的指标上计算用户彼此间的距离,距离的计算公式很多, 最常用的就是直线距离(把选择的指标当作维度、用户在每个指标下都有相应的 取值,可以看作多维空间中的一个点,用户彼此间的距离就可理解为两者之间的 直线距离。);最后聚类方法把

15、彼此距离比较短的用户聚为一类,类与类之间的 距离相对比较长。常用的算法k-means分层、FCM等。7. 判别分析:从己知的各种分类情况中总结规律(训练出判别函数),当新样品 进入时,判断其与判别函数之间的相似程度(概率最大,距离最近,离差最小等 判别准则)。常用判别方法:最大似然法,距离判别法,Fisher判别法,Baves判别法,逐步 判别法等。注意事项:a. 判别分析的基本条件:分组类型在两组以上,解释变量必须是可测的;b. 每个解释变量不能是其它解释变量的线性组合(比如出现多重共线性情况时, 判别权重会出现问题);c. 各解释变量之间服从多元正态分布(不符合时,可使用Logistic回

16、归替代), 且各组解释变量的协方差矩阵相等(各组协方方差矩阵有显著差异时,判别函数 不相同)。相对而言,即使判别函数违反上述适用条件,也很稳健,对结果影响不大。应用领域:对客户进行信用预测,寻找潜在客户(是否为消费者,公司是否成功, 学生是否被录用等等),临床上用于鉴别诊断。8. 主成分与因子分析:主成分分析基本原理:利用降维(线性变换)的思想,在 损失很少信息的前提下把多个指标转化为儿个综合指标(主成分),即每个主成分 都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具 有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简 化系统结构,抓住问题实质的目的。因子分析基本原理:利用降维的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号