基于Apriori算法的超市商品销售数据的关联规则分析

上传人:豆浆 文档编号:10492547 上传时间:2017-10-09 格式:DOC 页数:6 大小:85KB
返回 下载 相关 举报
基于Apriori算法的超市商品销售数据的关联规则分析_第1页
第1页 / 共6页
基于Apriori算法的超市商品销售数据的关联规则分析_第2页
第2页 / 共6页
基于Apriori算法的超市商品销售数据的关联规则分析_第3页
第3页 / 共6页
基于Apriori算法的超市商品销售数据的关联规则分析_第4页
第4页 / 共6页
基于Apriori算法的超市商品销售数据的关联规则分析_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《基于Apriori算法的超市商品销售数据的关联规则分析》由会员分享,可在线阅读,更多相关《基于Apriori算法的超市商品销售数据的关联规则分析(6页珍藏版)》请在金锄头文库上搜索。

1、基于 Apriori 算法的超市商品销售数据的关联规则分析郑印(华中师范大学 计算机学院, 湖北 武汉 430079)Apriori association rules algorithm based supermarket merchandise sales dataZhengyin(Computer College, Central China Normal University, Hubei 430079, China)摘要:Apriori 算法广泛应用于商业中,应用于消费市场价格分析中,它能够很快的求出各种产品之间的价格关系和它们之间的影响。尤其是在超市零售业中的应用更是广泛,通过对销

2、售数据记录的分析,挖掘出商品的关联规则,有利于提高超市零售业的销售利率,增强其市场竞争力。关键词:关联规则;Apriori 算法;销售利率Abstract:Apriori algorithm is widely used in business and prices analysis of consumer market , it can quickly determine the impact of prices relationships between the various products. Especially using in supermarket retailing is e

3、ven more widespread, through the analysis of sales data of record, the association rule mining commodities, help to improve the supermarket retail sales rates, and enhance their market competitiveness. Key words:Association rules; Apriori algorithm; sales rate1.研究背景超市零售业是数据挖掘应用较为活跃的一个领域。了解客户的购买习性和趋势

4、,对于零售商制订销售策略是至关重要的。通过关联规则的挖掘,分析客户对商品的需求状况,发现顾客的潜在需求特征,有目的性的开展广告和销售业务。通过对顾客的忠诚度分析,相应调整商品的价格和类型,改进销售服务,有利于保持现有客户,寻找潜在的客户,扩大销售的范围和规模,从而增加销售量。通过分析销售的数据记录,目前主要应用于销售预测、库存需求、零售点选择和价格分析,分析客户的购买行为和习惯,分析商场的销售商品的构成,使商品的选择与搭配更为科学。因此,对超市经营信息、数据的整理、挖掘,从中得出对经营有用的信息,增强超市的竞争能力,已经成为各家超市企业面临的一个紧迫课题,同时,Apriori 算法作为关联规则

5、挖掘的重要算法,也被各个企业所运用。2.关联规则的基本概念设 I = i 1 , i 2 , , i m 是 项 的 集 合 。 设 任 务 相 关 的 数 据 D 是 数 据 库 事 务 的 集 合 ,其 中 每 个 事 务 T 是 项 的 集 合 。 每 一 个 事 务 有 一 个 标 识 符 , 称 作 TID。 设 A 是 一 个 项 集 , 事 务 T 包 含 A 当 且 仅 当 AT 。 关 联 规 则 是 形 如 A B 的 蕴 涵 式 , 其 中 AI , BI , 并 且 A B = 。 关 联 分 析 中 还 包 括 两 个 重 要 的 参 数 , 支 持 度 (min_s

6、up) 和 置 信 度 (min_conf)。 具 体 定 义 如 下 :支 持 度 :support(AB) = P(A B),即 A 和 B 这 两 个 项 集 在 事 务 集 D 中 同 时 出 现 的 概 率 。置 信 度 :confidence(AB) = P(B | A) , 即 在 出 现 项 集 A 的 事 务 集 D 中 , 项 集 B 也 同 时出 现 的 概 率 。同 时 满 足 最 小 支 持 度 (min_sup)和 最 小 置 信 度 (min_conf)的 规 则 称 作 强 规 则 。项 的 集 合 称 为 项 集 (itemset), 包 含 k 个 项 的

7、项 集 称 为 k 项 集 。 项 集 的 出 现 频 率 是 包 含项 集 的 事 务 数 , 简 称 为 项 集 的 频 率 、 支 持 计 数 或 计 数 。 如 果 项 集 的 出 现 频 率 大 于 或 等 于 最 小 支 持度 , 则 称 为 频 繁 项 集 频 繁 k 项 集 的 集 合 通 常 记 作 Lk 。3.Apriori 算法分析关联规则(Association Rules) 的挖掘是数据挖掘中的一个重要问题。我们采用的是相关性分析的方法,采用的是Apriori算法。Apriori 算 法 是 一 种 最 有 影 响 的 挖 掘 布 尔 关 联 规 则 频 繁 项 集

8、的 算 法 。 其 核 心 是 基 于 两 阶 段 频 集 思想 的 递 推 算 法 。 该 关 联 规 则 在 分 类 上 属 于 单 维 、 单 层 、 布 尔 关 联 规 则 。 在 这 里 , 所 有 支 持 度 大 于 最 小支 持 度 的 项 集 称 为 频 繁 项 集 , 简 称 频 集 。该 算 法 的 基 本 思 想 是 : 首 先 找 出 所 有 的 频 集 , 这 些 项 集 出 现 的 频 繁 性 至 少 和 预 定 义 的 最 小 支 持 度一 样 。 然 后 由 频 集 产 生 强 关 联 规 则 , 这 些 规 则 必 须 满 足 最 小 支 持 度 和 最 小

9、可 信 度 。 然 后 使 用 第 1步 找 到 的 频 集 产 生 期 望 的 规 则 , 产 生 只 包 含 集 合 的 项 的 所 有 规 则 , 其 中 每 一 条 规 则 的 右 部 只 有 一 项 ,这 里 采 用 的 是 中 规 则 的 定 义 。 一 旦 这 些 规 则 被 生 成 , 那 么 只 有 那 些 大 于 用 户 给 定 的 最 小 可 信 度 的 规 则才 被 留 下 来 。 为 了 生 成 所 有 频 集 , 使 用 了 递 推 的 方 法 。Apriori 算法采用连接步和剪枝步两种方式来找出所有的频繁项集。1)连接步为找出 Lk(所有的频繁 k 项集的集合)

10、 ,通过将 Lk-1(所有的频繁 k-1项集的集合)与自身连接产生候选 k 项集的集合。候选集合记作 Ck。设 l1和 l2是 Lk-1中的成员。记 lij表示 li中的第 j 项。假设Apriori 算法对事务或项集中的项按字典次序排序,即对于(k-1)项集 li,l i1鸡肉; : 1.0牛奶;-鸡肉; : 1.0衣服;-鸡肉; : 1.0牛肉;-奶酪; : 0.75牛奶;-衣服; : 0.75牛奶;-衣服;鸡肉; : 0.75牛奶;牛肉;-鸡肉; : 1.0奶酪;鸡肉;-牛肉; : 1.0衣服;-牛奶; : 1.0牛肉;-鸡肉; : 0.75牛奶;鸡肉;-衣服; : 0.75鸡肉;-牛奶

11、; : 0.8衣服;鸡肉;-牛奶; : 1.0衣服;-牛奶;鸡肉; : 1.0奶酪;-牛肉; : 0.75f)结果分析从上面我们可以看到事务集中的所有频繁项集,如牛奶;衣服; : 3;牛肉;鸡肉; : 3;奶酪;鸡肉; : 2;牛奶;衣服;鸡肉; : 3等,他们的支持度都大于2。在这些频繁集中,牛奶,衣服可以和鸡肉建立关联规则,因为他们的信任度大于所设定的最小信任度,如上面所示还有很多频繁项集可建立关联规则。与此同时,我们还可以看出顾客的消费习惯和那些商品顾客会同时购买,超市应该根据上面的分析结果来进购商品和安排商品的摆放位置。拿鸡肉的例子简单分析下,很多顾客购买鸡肉,因为鸡肉的支持度达到了5,远远的高于设定的支持度,同时发现很多顾客在购买鸡肉的同时还购买了牛奶,所以超市应该把鸡肉和牛奶放到一起,方便顾客的购买。参考文献1陈文伟. 数据仓库与数据挖掘 . 北京: 人民邮电出版社, 20042康晓东. 数据仓库的数据挖掘技术 . 北京: 机械工业出版社, 20043Mehmed Kantardzic. 数据挖掘 . 北京: 清华大学出版社, 20034钱颂迪. 运筹学(第二版). 北京: 清华大学出版社, 1990 华 中 师 范 大 学研 究 生 课 程 论 文论文题目 完成时间 课程名称 专 业 年 级 成 绩评卷人姓 名学 号

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号