基于微软案例数据库数据挖掘知识点总结(Micros代关联规则分析

上传人:gg****m 文档编号:233979124 上传时间:2022-01-03 格式:DOCX 页数:30 大小:802.53KB
返回 下载 相关 举报
基于微软案例数据库数据挖掘知识点总结(Micros代关联规则分析_第1页
第1页 / 共30页
基于微软案例数据库数据挖掘知识点总结(Micros代关联规则分析_第2页
第2页 / 共30页
基于微软案例数据库数据挖掘知识点总结(Micros代关联规则分析_第3页
第3页 / 共30页
基于微软案例数据库数据挖掘知识点总结(Micros代关联规则分析_第4页
第4页 / 共30页
基于微软案例数据库数据挖掘知识点总结(Micros代关联规则分析_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《基于微软案例数据库数据挖掘知识点总结(Micros代关联规则分析》由会员分享,可在线阅读,更多相关《基于微软案例数据库数据挖掘知识点总结(Micros代关联规则分析(30页珍藏版)》请在金锄头文库上搜索。

1、基于微软案例数据库数据挖掘知识点总结(Micros。代关联规则分析算法)木篇继续我们的微软挖掘算法系列总结,前儿篇我们分别介绍了: Microsoft决策树分析算 迭、Microsoft聚类分析算法、Microsoft Naive Bayes 算法、Microsoft 时序算法,后 续还补充了二篇结果预测篇、Microsoft时序算法结果预算+下期彩票预测篇,看样了 有必要整理一篇目录了,不同的算法应用的场景也是不同的,每篇文章都有它自己的应用场 景介绍,有兴趣的同学可以参阅。木篇我们总结微软挖掘算法系列中一款比较重要的算法: Microsoft关联规则分析算法,根据马克思哲学理论,所谓世间力

2、物皆有联系,而且联系是 普遍的,此篇的Microsoft关联规则算法就是用来挖掘关联关系的典型算法,闲言少叙,我 们直接进入正题。应用场景介绍关联规则算法是在大量数据事例中挖掘项集Z间的关联或相关联系,它典型的应用就是购物 篮分析,通过关联规则分析帮助我们发现交易数据库中不同的商品(项)Z间的联系,找到 顾客购买行为模式,如购买某一个商品对其它商品的影响。进而通过挖掘结果应用于我们的 超市货品摆放、库存安排、电了商务网站的导航安排、产品分类、根据购买模式对用户讲行 分类,相关产品推荐等等。比较典型的为大家所熟知的就是:啤酒和尿布的故事其实很多电了商务网站中在我们浏览相关产品的时候,它的旁边都会

3、有相关产品推荐,当然 这些它们可能仅仅是利用了分类的原理,将相同类型的的产品根据浏览量进而推荐给你,这 也是关联规则川川的一种较简单的方式,而关联规则算法是基于大景的数据事实,通过数据 层而的挖掘来告诉你某些产品项存在关联,有可能这种关联关系有可能是门身的,比如:牙 刷和才膏、筷了和碗有些木q就没有关联是通过外界因索所形成的关系,经典的就是: 啤酒和尿布,前一种关系通过常识我们有时候可以获取,但后一种关系通过经验就不易获得, 而我们的关联规则算法解决的就是这部分问题。技术准备(1) 微软案例数据仓库(AdventureWorksD/208R2),这里我们应用到两张表:vA ssocSeqLin

4、eltems表和vAssocSeqOrders表,这两张表典型的“一对多”的关联关系,v AssocSeqOrders为订单表,vAssocSeqLinelterns表为订单明细表,两者通过Order Number关联,稍后的步骤我们会详细的分析这两张表内容(2) VS2008、SQL Server、Analysis Services操作步骤(1)我们这里还是利用上一期的解决方案,然后数据源,然后数据源视图,很简单的步骤,|;|不明白的可以看我们前面几篇文章,然后将这两张表的主外键关联上,我们来看图:vAssocSeqOrdersCycling CapSport-100Water Bottle

5、这里我们选择Microsoft关联规则算法,然示下一步:遊挖扼向导指走表类型指走分析时要使用的表类型。撬入表= 完成(F) 躺Mou? Clas30K)? Clas? Clas ubeA.re Tu这里我们标示好事例表和嵌套表,下一步我们指泄上型数据表浏览vAssfimberShShsfcy押弓 Developmer Default; 数据挖捷向导指走走型数据指定分析中所用的列.表/列键f输入日 紹vAssocSeqOrders團CustomerKeyO41In comeGroup0画词OrderNumber画SERegi onO日踊vAssocSeqLi neltems(Lin eNumbe

6、rininModelJ WJ为当前选定的可预涎匸上一步(B)下一步(bl) 就(E) |这这里面我们配置好键.和输入、输出预测列,然示起个名字:relevanceI : Q Ml * i A -忌v Developmer Default 弓 omitrelevance.dmm 设计浏览 vAssocSeqLineltems 表 浏览 vAssocSeqOrders 表 Orderltems.dsv 设计|瓜挖掘结构丨氏挖掘複型|氐挖掘模型查看器| 挖掘准确性图表| &挖掘模型预测lev列Jv rel国 a 舐日0数据源视囹疥丨沟勺丨XCustomer KeyIncome GroupOrder

7、Numberv Assoc Seq Line Items0 VA:Mo01 vA:至此,我们的Microsoft关联规则分析算法已经初步建立好了,下面一步我们来配置该算 法儿个关键属性值。(3)参数配置此种算法有两个参数比较重要,我们来看:Support:定义规则被视为有效前必须存在的事例百分比。也就是说作为关联规则筛选的事 例可能性,比如设置成10%,也就是说在只要在所有事例中所占比为10%的时候才能进 行挖掘。Probability:定义关联被视为有效前必须存在的可能性。该参数是作为结果筛选的一个预定 参数,比如设置成10%,也就是说在预测结果中概率产生为10%以上的结果值才被展示。我们将

8、该模型的两个参数设置为:MINIMUM PROBABILITY = 0.2MINIMUM_SUPPORT = 0.01mm痕计厂|模型查看器挖掘咨确性圏表I。挖掘模型预测I A算法参数relevanceHJkJksMicrosoft As翻濟Keyrredi ct参数():MAXIMUM_FEMSET_COUNT MAXIMUMJTEMSET_SIZE MAXIMUM.SUPPORT MINIMUM IMPORTANCE MINIMUM_FEMSET_SIZE MINIMUM_PROBABIUTY MINIMUM.SUPPORT默认值范围2000001,)30,5001.0(0.0,.999999999(,)11,5000.40.0,1.10.00.0,.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号