大型超市“购物篮”分析

上传人:cn****1 文档编号:464346916 上传时间:2023-02-07 格式:DOC 页数:15 大小:352.50KB
返回 下载 相关 举报
大型超市“购物篮”分析_第1页
第1页 / 共15页
大型超市“购物篮”分析_第2页
第2页 / 共15页
大型超市“购物篮”分析_第3页
第3页 / 共15页
大型超市“购物篮”分析_第4页
第4页 / 共15页
大型超市“购物篮”分析_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《大型超市“购物篮”分析》由会员分享,可在线阅读,更多相关《大型超市“购物篮”分析(15页珍藏版)》请在金锄头文库上搜索。

1、-题 目 大型超市“购物篮分析 摘 要本文根据顾客购置记录,通过“购物篮分析,运用多种模型得出结果,并给出促销方案。问题一要求构建能表达多种商品关联程度数学模型。根据4717个顾客对999中商品购置记录,先用对数据进展预处理,将其转化为0-1模型,然后求出购置商品集合和购置商品集合,考虑到同时购置两种商品占购置人数频率,即相关性,存在购置人数少但相关性大缺陷。在改良模型中,因为存在购置商品数少但也会使相关性大情况,所以对两种情况进展综合考虑,得出最优模型:用求解0-1矩阵,求出两商品间关联系数较大前八位,有相关系数值在0-1围之,与所得模型函数围一致,可知,该模型是准确可靠。问题二要求出有效方

2、法来找出最频繁被购置商品记录,且越多越好。根据问题一所得0-1矩阵,将其代入 运用模型,先算出单项商品频繁项集,将支持度较小数据剔除后,最后选取被购置次数最多前18个商品,其中最畅销为368号商品。根据这18个畅销品,运用同样方法将其转化为两两商品组合,得到被同时购置次数200次以上商品;根据此算法依次迭代,得到同时购置3种商品和同时购置4种商品数据,更多商品被同时购置次数较少因此不予考虑,最后得出:两件商品被同时购置次数最高是368和529号;三件商品被同时购置次数最高是368、489和682;四件商品被同时购置次数最高是68、937、895和413。问题三要求给出方案使效益最大。根据问题一

3、中0-1模型和问题二中模型,将得到购置次数最多商品信息和题中所给利润表相比拟,将利润小数量多商品作为赠品和利润大数量多商品一同销售;将共同购置次数多且利润大两商品组合作为促销品进展销售,以进一步提高超市综合效益。关键词 0-1模型 模型 数据预处理 相关系数一、问题背景和重述1.1问题背景随着信息技术开展,通过分析大量历史数据来发现模式和利用规律数据挖掘技术应运而生,然而大多数商家并不是数据挖掘技术领域专家,如何使数据挖掘技术平民化,成为当代很多学者研究热点之一。购物篮分析是数据挖掘技术应用在零售业中一种有效方式,其目就是在顾客购置交易中分析能够同时购置一类产品或一组产品可能性,利于商品摆放,

4、也利于提高促销活动效果。随着人们生活水平提高,特别是城市,根本物质生活已满足,人们有更高追求并呈现多样性,从企业角度看,了解和掌握顾客消费特征和规律,有利于提高企业利润,同时也能提高消费者满意度。本文以一个面向大型超市购物篮问题,构建数学模型。1.2问题重述作为超市经理,经常关心问题是顾客购物习惯。他们想知道:“什么商品组或集合顾客多半会在一次购物时同时购置.。现在假设我们是*超市市场分析员,已经掌握了该超市近一个星期所有顾客购置物品清单和相应商品价格,需要给超市经理一个合理“购物篮分析报告,并提供一个促销方案初步方案。问题1:题目中表格数据显示了该超市在一个星期 4717 个顾客对 999

5、种商品购置记录,表格中每一行代表一个顾客购置记录,数字代表了其购置商品超市部编号。建立一种数学模型,该模型能定量表达超市中多种商品间关联关系密切程度。问题2:根据在问题1中建立模型,寻找一种快速有效方法能从表格购置记录中分析出哪些商品是最频繁被同时购置。超市经理希望得到尽可能多商品被频繁同时购置信息,所以找到最频繁被同时购置商品数量越多越好。例如:如果商品1、商品2、商品3在 4717 个购物记录中同时出现了200次,则可以认为这三个商品同时频繁出现了200次,商品数量是3。问题3:题目给出了这999中商品对应利润,根据在问题1、问题2中建立模型,给出一种初步促销方案,使超市效益进一步增大。二

6、、问题分析2.1问题一分析要求构建模型定量表达超市多种商品间关联关系密切程度,根据4717个顾客对999种商品购置记录,令表示第个顾客购置情况,当第个顾客购物篮里有第个商品,;没有购置,则。这就把复杂繁多数据化为了简单易求0-1模型。根据购置记录,求出购置商品顾客集合和购置商品顾客集合,两集合交集同时购置所代表人数与购置人数比值即为频率,此频率表示两商品相关程度,考虑到购置人数较少也会造成频率较大情况,对模型进展改良,将同时购置人数与至少买一种商品人数比值作为相关系数,转化后模型仍存在缺陷,购置次数较少时也会造成系数较大但不能反映商品相关性问题。综上两种考虑,将两个模型结合起来,得到最优模型,

7、用此模型来定量表达商品间关联关系密切程度。由题目可知,此模型所得结果必定大于0小于1,为验证模型可靠性,本文运用对数据进展预处理,将数据转化为0-1矩阵后,再根据公式编程筛选出两商品相关系数较大前八位,由所得系数与函数大于0小于1性质相比,假设符合,则模型是可靠;假设不符合,则再求新定量模型。2.2问题二分析要求我们寻找一种快速有效方法从购置记录中找出被最频繁购置商品,并且被同时购置数量越多越好。根据问题一对数据进展0-1矩阵处理,并在中对数据进展求和以及排序处理,得到一次购置一次商品次数最多前18个商品。由于数量繁多,我们将从这18种商品中求出两件被同时购置以及三件、四件商品被同时购置信息。

8、因此我们调出这18种商品0-1矩阵,并用编程得到两件商品同时被购置频数,并用算法原理提出支持度,用其来筛选得到众多数据,修改程序以得到三件商品、四件商品被同时购置数据。2.3问题三分析对于问题三,要求根据问题一和问题模型给出一种促销方案,促使效益进一步增大。首先我们定义为超市收益,商品数量为,商品利润为。则。我们考虑将数据中卖出数量多商品且利润大商品附赠以卖出商品数量多但是收益较小商品来进一步提高它们卖出数量以获得更大利润。而对于那些卖出数量以及能够获得利润都适中商品,根据问题二求得两件商品被同时购置数量将它们放在一起促销,这样也会获得较高利润。三、模型假设1、超市货源充足最大限度满足顾客需求

9、;2、短时期,商品销售情况保持不变;3、每位顾客购物行为都是理性,真实反映当地消费情况;4、假设两商品同时被购置次数大于200为高销量商品;5、假设商品收益只考虑销售所得收入,不考虑商品本钱;四、符号说明和名词解释4.1符号说明第个消费者购物篮中第种商品购置中上品人集合超市收益购置商品人数被购置商品利润4.2名词解释1、布尔量:此题中所指是购置或未购置,购置时布尔量=1,未购置布尔量=0;五、模型建立与求解5.1模型准备5.1.1问题一模型准备由于此题是针对大型超市购物篮问题,数据繁多,且只考虑顾客购置记录,即买或不买,并以此研究商品间关联程度,因此此题先对所给数据进展预处理,将4717位顾客

10、对999种商品购置转化为0-1模型,方便问题求解。首先以表示第个消费者*次购物行为,如果在消费者购物篮中发现了第种商品,则有,否则同时表示第个消费者购置第种商品。5.2问题一模型建立与求解5.2.1模型建立此题消费者购置只有两种情况,即购置或不购置,因此可以用到0-1模型。为表达超市中多种商品间密切关联程度,此题建立了定量模型。首先,用来描述第个消费者购物情况,表示第个消费者购置了第个商品,反之,表示未购置。因为是根据顾客对商品购置记录来求解,因此本文对购置*种商品顾客进展分类,设购置人集合为,购置人集合为,则表示同时购置商品和商品顾客。由此可将两种商品相关联程度表示为:此公式表示同时购置两种

11、商品频率,频率越高,相关性越大,但假设购置人数少,也会导致频率值较大,显然这样表达不能准确反映两商品间关联程度,因此对此模型还应进一步改良。对购置人数进展改良,考虑到有顾客在两种商品中至少购置一种情况,将化为,则两种商品相关联程度转化为:此公式表示两种商品都买情况占至少购置一种情况比值,即频率,也能反映两商品间关联程度,但其同第一个公式类似,存在购置商品次数少但导致频率较大,而不能反映两商品相关性缺陷,因此,综合两种情况,得到最优模型:表示两商品相关性,假设较大,剔除购置次数较小情况,即可反映当消费者购置一种商品时,对另一种商品购置可能性很大,两种商品关联相关性密切。5.2.2模型求解对上述模

12、型进展具体求解,其中表示同时购置商品和商品人数,公式为:表示两种商品中至少购置一种商品人数,其具体公式为:小于购置人数,同时小于至少购置一种商品人数,所以小与1。将题目中所给数据运用进展预处理,将其转化为0-1矩阵,由于数据过多,则将所得矩阵放在附录中,详见附录1。根据所得关联函数公式,用编程求出两商品间关联系数较大前八位,如下列图所示:表 两商品间相关系数两个商品相关系数22839813237170.93748097437870.81820544856370.8127685559590.75496375328480.7230635844390.71727444769730.7047645从图

13、中可知,228和398两种商品关联相关性最密切。同时有相关系数值在0-1围之,与所得模型函数围一致,可知,该模型是准确可靠。5.3问题二模型建立与求解分析最频繁被同时购置商品,且越多越好。首先我们要找出单独一项商品被购置频数,根据频数较高单项商品集,通过筛选得出两种商品被同时购置频数,以此类推,层层迭代,找出多种商品被同时购置频数。算法使用频繁项集先验性质,通过逐层搜索迭代方法,先扫描数据库,再累积每个项计数,并收集满足最小支持度项,找出频繁项集集合,直到所求条件。因此本文运用算法,对此题作出分析并求出最正确结果。其具体算法过程如下:此算法表达出假设是一个频繁项集,则每一个子集都是一个频繁项集

14、。首先我们提出支持度概念,支持度是中包含和事务数与总事务数比值。可以利用支持度大小来筛选数据。设是同时购置项商品人员集合。先从999中商品中找出单项频繁项集,根据项频繁项集,找出下一频繁项集即,并算出其中支持度,将支持度较小元素删除,最终得到结果。5.3.1对单项商品购置要给出尽可能多商品被同时购置信息,由所给购置记录,可以先由简单单项商品开场,求出它们被购置次数。根据问题一所得预处理后1中购置记录,详见附录1,用对单项商品购置次数进展求和。由于题目只要求给出频繁被购置商品,频数较少予以剔除,因此经过排序后得到购置次数最多前十八个数据如下:表 前18个被购置次数最多商品商品号被购置次数368133882911035291089510960419943217935489886438851956841766830914825682819692814851798205782720758722757883744从表中我们可以看出368号商品被购置次数最多,851商品被购置次数相对较少,但这18种商品都可以作为最频繁购置商品被经理采用,来研究商品购物篮问题。5.3.2同时对两项商品购置上述18个单项商品被同时购置次数较为频繁,说明这18项商品最为畅销,以这18项商品为一个频繁项集,根据算法,构建0-1矩阵,对每一个商品都可以用一个

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号