基于信息熵的改进RFM模型 姜京彤 刘峰涛Summary:本研究为电子商务背景下线上零售企业的客户细分方法提供了一个参考范式,通过熵权法为RFM模型指标赋权,良好的解决了RFM模型指标权重的确定多余随意和单一的问题,提高了模型的科学性能够帮助企业很好的解决客户关系管理方式亟需转变的难题,既具有现实研究意义,又具有科学研究价值Key:客户细分;RFM模型;信息熵1. 电子商务时代线上零售企业特征近年来,信息技术高速发展,与此同时,互联网的产生与推广也引发社会的广泛关注,网民数量激增,信息化的步伐日益加快,由此催生的电子商务发展日益壮大与完善,线上零售企业与日俱增,电子商务已经成为推动国民经济发展的一大重要组成部分随着电子商务时代的到来,线上交易数量激增,市场竞争愈演愈烈,企业逐渐将经营的重点从产品转移到客户上来,企业与客户之间的关系也发生了根本性的变化,已经由过去的以产品为中心转变为现如今的以客户为中心,能否更好的把握住顾客这一关键性因素已经成为企业能否取得长足发展的关键;此外,电子商务的背景下,产品的多样性、交易的频繁性、用户的广泛性以及客戶需求异质性都为企业进行客户细分带来挑战,对客户的购买行为进行预测的难度也有所增加。
具体来说,电子商务背景下线上零售企业有如下特征:(1)线上零售企业商品具有多样性,企业往往不会只销售某几种商品,而是同时提供多种商品,这些商品单价相对较低,或者相互之间为互补商品,因此具有多次重复购买的需求而随着电子商务的快速发展,很多零售企业的不同商品商品分布在不同地区,需求量的增大是的企业产生大量的销售数据,而这些数据体现出客户的购买意愿,相当有分析价值2)企业的客户分布非常广泛,并且客户储备并不是处于一个相对稳定的状态,每时每刻都会有新进入的甚至是大量的客户产生购买行为,而这些客户不限时间、地点、交易次数,由此产生的大量数据背后隐含着巨大的价值因此,对客户的行为进行细分,进一步反应客户背后的购买行为特征,识别企业的流失客户和有效客户进而进行对应的维护,是十分有必要的3)互联网是有记忆的,相较于传统线下零售企业,电子商务的背景下线上零售企业能够更加容易的追踪到客户在某一段时间内的购买途径、购买时间、页面停留时间等,从而产生的大量数据为企业更加精准的、快速的、高效的挖掘客户行为,找到精准目标人群提供了可能此外,数据挖掘技术的出现也为企业进行海量数据分析提供了技术支持4)随着电子商务的快速发展,用户数量和产品种类都在快速增加,企业能够把握住客户真实需求从而进行精准营销成为企业制胜的关键法宝。
因此,除了传统企业通过客户性别、年龄等对客户消费进行预测,客户过去的购买行为同样对客户的消费产生重要影响,需要进行对应分析和挖掘总体说来,电子商务时代,产品数量的大量性和种类的多样性、客户的随机性和广泛性、客户需求的异质性和连续性以及信息渠道的可追溯性和易获得性都能够为企业提供大量的客户购买行为信息,此外,数据挖掘技术的产生与发展也为大数据的处理提供了技术支持,企业客户关系管理模式以及方法需要进行转变,本文基于这样的时代背景,提出一种新的客户细分模型为企业进行客户关系管理提供参考2. 传统RFM模型的优势与不足2.1传统RFM模型的优势在进行消费行为分析时,如何运用合适的分析模型是非常重要的课题,因顾客在消费上有各种行为的不同,如何将不同群体的选择逻辑以及对各消费群体价值观的判断进行很简洁的图表化分布研究,找出个消费群体适合的营销模式,差别式经营以打动各消费群体的内心需求,达成销售分析目的传统RFM模型具有理解简单、逻辑清晰和便捷高效的特点,并且能够较为直接和动态的反应客户在其出现购买行为的某一段生命周期内能够为企业带来价值的较为详细的变动情况,因此在企业进行客户关系管理、客户精准营销从而最大化的提高客户留存率以及客户价值方面得到了较为广泛的应用,大量有关客户关系管理的研究也都建立在这种客户指标评价体系之上。
具体说来,RFM模型拥有如下优点:(1)RFM模型通过R、F、M三个指标作为衡量客户价值的基础,能够较为简便的反映出客户价值,减少了不同评价体系的大量指标对于计算上带来的复杂性,降低了大量指标的冗余且三个不同指标能够较为全面的反应客户价值,并较为有效的识别优质客户、普通客户和流失客户,更好的企业进行客户关系管理提供精准分类2)RFM模型能够通过三个指标较为全面的反应客户行为,反映客户过去的购买意愿与偏好因为客户的购买行为具有一定的连续性和相关性,在一定的时间周期之后,客户很有可能再次发生对于同类产品的购买,因此对客户购买行为进行追踪是相当有必要的RFM模型就能够满足企业这一要求,通过简单的三个指标反应客户购买轨迹,使企业更加精准的对顾客购买行为进行预测3)RFM模型三个指标的数据具有易获取性现如今,信息技术高速发展,用户的互联网行为都是有迹可循的在网络时代,客户消费行为数据的易获取性是企业进行客户关系管理、识别客户能够为公司带来的价值并进而对客户消费行为进行分析,最终进行精准营销的一大优势2.2传统RFM模型的不足传统RFM模型的不足之处主要是在于计算方面的不足,体现如下:(1)指标的选择RFM模型通过三个指标较为全面的反应客户行为,分别是客户最近一次消费的时间、消费的频率以及消费的金额。
三个指标分别从不同的方面对客户进行了刻画,但是模型中消费的频率和消费的总金额之间存在着共线性的问题,客户购买的频率高,那么一般说来,客户的消费总金额也会比较高,因此对于客户价值的刻画的计算上,这三个指标会存在一定的重复性2)权重的确定根据传统的RFM模型,他在确定三个指标的权重问题时,原理上是认为三个指标是同样重要的在企业的发展过程当中,随着企业的成熟度不断提高、不同业务的不断拓展以及日益激烈的市场竞争,或者简单说来,企业在生命周期中处于一个不同的发展方向,都会对三个不同指标的权重产生重要影响对于提供高单价、低频率的商品或服务的企业来说,例如冰箱、彩电之类的耐用品或航旅、游轮之类的服务,企业在进行客户细分时往往将单次消费的金额放在比较重要的位置,仅此会降低另外两个指标的权重;而对于提供低单价、高频率的商品或服务的企业来说,企业在进行客户细分时会把消费频率放在比较重要的位置面对这一问题,就需要企业运用一定的方法不斷地对数据进行跟进从而进行权重的更新,为权重的确定提供一个良好的简易的范式3)细分结果过于复杂传统的客户细分RFM模型将细分指标均匀的分成了若干个类别,因而指标互相重新排列组合之后会出现多个细分结果。
例如,若将指标均匀的分成5类,会得到125个细分结果但在企业的实际应用中并不需要这么多的细分结果,客户之间的边界也没有那么明显,而且对于这么多细分结果企业也无法给出精准的定义,对每一个细分类群去定制专门的策略去进行精准的客户关系管理意义也不大,所以企业实际上确保划分的类群界限清晰易懂、易于操作即可在过去的有关RFM模型研究中,大部分学者是从指标优化的角度去进行改进,让指标更加完善和全面,本研究从客户价值的计算角度出发,对RFM模型中的算法进行优化,引入信息熵的概念,通过熵权法去对指标权重进行客观的计算3. 基于熵权法确定指标权重的过程在RFM模型的实际应用中,R、F、M三个指标的重要性程度对于不同企业或者处于同一企业所处的不同时期的重要性程度是不同的,所以需要运用科学的方法确定三个指标的权重这里采用熵权法的方式确定,根据数据本身的结构确定属性权重,更加具有客观性和真实性,解决权重的确定过于主观的缺点熵权法确定指标权重的具体过程如下:(1)原始数据集假设现在有m个企业客户,n个属性,形成待评客户的相应属性的原始数据矩阵X=(xij)mn其中,rij是第i个企业客户的第j个属性评价值2)数据集归一化在客户细分RFM模型中,基于机器学习的领域,不同的属性指标通常拥有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲的影响,需要进行数据的标准化处理,来解决数据指标之间的可比性。
原始数据集经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价其中,最典型的就是数据的归一化处理简而言之,归一化的目的就是使得预处理的数据被限定在一定的范围内(比如[0,1]或者[-1,1]),从而消除奇异样本数据导致的不良影响此外,不同的指标对评价对象的影响存在差异,因而需要区分正向指标和反向指标,为了便于观察,本研究将归一化的结果限定在[0,1]之间,换而言之,对于正向指标和负向指标需要进行不同的归一化处理:具体的,在RFM模型中,R对于客户价值的影响是反向的,R的值越大顾客的价值越低;R的值越小,顾客的价值越高而F、M对于客户价值的影响均为正向的,F、M值越大,顾客价值越大,反之亦然因此对于R、F、M三个指标需要采用不同的归一化公式分别进行处理,具体处理如下:其中Rmαx、Rmαx分别为属性R 的最大值和最小值,Fmαx为属性F 的最大值、Mmαx、Mmαx分别为属性M的最大值和最小值4.结束语在电子商务的时代背景下,RFM模型为企业进行大量的客户行为数据分析提供了模型支持本章在提出了RFM模型的适用性和不足之处后,针对RFM模型的不足之处提出改进方法,针对R、F、M三个属性的权重确定问题,摒弃传统RFM模型认为三个指标权重相同的计算方法,将熵权法的思想引入客户细分RFM模型中,将企业客户视作空间中的微粒子,根据数据本身的结构来客观的确定指标的权重,没有掺杂人的经验和主观性,更加具有客观性,能够更加纯粹的反映客户的真实价值。