市场购物篮分析——GRI关联规则的应用

上传人:鲁** 文档编号:555032260 上传时间:2023-11-01 格式:DOCX 页数:4 大小:94.08KB
返回 下载 相关 举报
市场购物篮分析——GRI关联规则的应用_第1页
第1页 / 共4页
市场购物篮分析——GRI关联规则的应用_第2页
第2页 / 共4页
市场购物篮分析——GRI关联规则的应用_第3页
第3页 / 共4页
市场购物篮分析——GRI关联规则的应用_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《市场购物篮分析——GRI关联规则的应用》由会员分享,可在线阅读,更多相关《市场购物篮分析——GRI关联规则的应用(4页珍藏版)》请在金锄头文库上搜索。

1、数说工作室出品 市场购物篮分析GRI关联规则的应用跳过理论看实例一、什么是关联规则1. 从啤酒与尿布的故事说开关联规则有一个经典的啤酒与尿布的案例:一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据

2、进行分析和挖掘。一个意外的发现是:跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了一个隐藏在尿布与啤酒背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。 2. 关联规则的应用关联规则就是从一种行为中发现与之相关联的另一种行为,即AB,并用一定的概率度加以保证。关联规则广泛的应用在零售业、金融业和互联网行业。最典型的运用是超市的购物篮分析,挖掘一般顾客在购买X产品的同时还会购买其他什么

3、产品,于是制定相应营销策略,进行捆绑销售,增加销售量。又如金融业中,预测银行客户需求,如果数据库中显示,某个高信用限额的客户更换了地址,这个客户很有可能新近购买了一栋更大的住宅,因此会有可能需要更高信用限额,更高端的新信用卡,或者需要一个住房改善贷款,这些产品都可以通过信用卡账单邮寄给客户。电子购物网站也使用关联规则进行挖掘,一些购物网站使用关联规则设置相应的交叉销售,也就是购买某种商品的顾客会看到相关的另外一种商品的广告。二、关联规则的原理一般规则归纳GRI1. GRI规则的形式GRI规则的形式:If Y=y then X=x with probability p,其中X和Y是两个指标,x和

4、y是两个指标的值,then前面的是条件,后面的是结果。符合条件的规则将按一定顺序选入规则集表中。2. 支持度与可信度实例(Instances):条件为真的记录数。支持度(support):实例占总记录数的比例,NaN。衡量规则的重要性。可信度:或叫置信度。条件和结果都为真的记录数,占实例的比例,NrNa。衡量规则的准确度。作用度(lift):条件概率与无条件概率的比值,p(c|a)p(c)。作用度越大,实际意义越好。3. 规则的选取(1)只有真值才能被选入,条件和结果含有假的规则都不能被选入。(2)只有规则的支持度和可信度超过特定的阈值,才能被选入规则表中。(3)条件的记录数不能超过特定值,否

5、则也不能被选入规则。(4)被选入规则表中的规则数是有限的。二、案例分析基于SPSS Clementine的市场购物篮分析1. 数据说明案例选自clementine自带的案例数据。某超市1000名顾客的购买记录。图1 数据图示变量包括顾客ID,性别、是否是本地人、年龄、收入等个人信息,也包括购买产品,如是否购买水果蔬菜、鲜肉、冻肉、啤酒等以及购买金额和购买方法,如图1所示。现在超市希望能找出顾客购买产品之间的关系,即是否购买了A产品的顾客,也购买了B产品,以及这些顾客的个人特征。2. 软件实现将数据装入clementine,并制定类型。将所有产品类别的方向设置为“双向”,其余均设置为“无”。图2

6、 字段方向设置将GRI节点接入类型节点,并执行。结果显示87.42%的置信度保证买冻肉的人也会买啤酒和灌装蔬菜,并且可以看出啤酒和冻肉存在双向关联。为了使得结果更直观,使用“网络”节点来显示双向关联(网络节点只能显示双向关联)图3 双向关联图示根据双向关联图示,有三个客户群突出显示:(1)购买鱼同时也购买果蔬的客户,可将这类客户称为“健康食客”。(2)购买酒同时也购买粮果的客户。(3)同时购买啤酒、冻肉和罐装蔬菜的客户。现在知道顾客奇妙的购买行为,为了更好的将分析结果用在营销上,最好还能知道这三种顾客的特征,如年龄,收入,从而能更准确的制定销售策略。Clementine的C5.0模型是一个很好的工具。配置好C5.0节点后,可以发现第三类客户群的人口统计学特征:此图显示收入在16900以下,性别为男的会成为第三类客户,此图显示当一次购买金额超过32美元,性别为女,且收入在20000以上的会称为第二类客户。当客户不是本地人,并且年龄小于24岁时,会成为第一类客户,即“健康食客”。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 国内外标准规范

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号