昆明理工大学

上传人:s9****2 文档编号:561924725 上传时间:2023-07-30 格式:DOCX 页数:9 大小:595.67KB
返回 下载 相关 举报
昆明理工大学_第1页
第1页 / 共9页
昆明理工大学_第2页
第2页 / 共9页
昆明理工大学_第3页
第3页 / 共9页
昆明理工大学_第4页
第4页 / 共9页
昆明理工大学_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《昆明理工大学》由会员分享,可在线阅读,更多相关《昆明理工大学(9页珍藏版)》请在金锄头文库上搜索。

1、昆明理工大学信息工程与自动化学院学生实验报告2018 2019 学年 第 2 学期 )课程名称:数据仓库与数据挖掘开课实验室:信自楼 4442019 年05月31日年级、专业、班物联网161学号201610410147姓名郑凯成绩实验项目名称数据挖掘及决策树指导教师游进国教该同学是否了解实验原理:A. 了解口B.基本了解口C.不了解口师该同学的实验能力:A.强口B.中等C.差师该同学的实验是否达到要求:A.达到口B.基本达到口C.未达到口评实验报告是否规范:A.规范口B.基本规范口C.不规范口评实验过程是否详细记录:A.详细口B. 一般C.没有口语教师签名:年月日、上机目的及内容1.理解数据挖

2、掘的基本概念及其过程;2理解数据挖掘与数据仓库、OLAP之间的关系3. 理解基本的数据挖掘技术与方法的工作原理与过程,掌握数据挖掘相关工具的使用。4将创建一个数据挖掘模型以训练销售数据,并使用“Microsoft决策树”算法在客户群中找出 购买自行车模式。请将要挖掘的维度(事例维度)设置为客户,再将客户的属性设置为数据挖掘算 法识别模式时要使用的信息。然后算法将使用决策树从中确定模式。下一步需要训练模型,以便能 够浏览树视图并从中读取模式。市场部将根据这些模式选择潜在的客户发送自行车促销信息。5. 利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的 各种问题和解

3、决的方法与过程,并根据实验案例绘出模型及操作过程。实验完成后,应根据实验情况写 出实验报告。二、实验原理及基本技术路线图(方框原理图或程序流程图) 数据挖掘是指以某种方式分析数据源,从中发现一些潜在的有用的信息,所以数据挖掘又称作知识 发现,而关联规则挖掘则是数据挖掘中的一个很重要的课题,顾名思义,它是从数据背后发现事物之间 可能存在的关联或者联系。关联规则挖掘是从事务集合中挖掘出这样的关联规则:它的支持度和置信度大于最低阈值(minsup,minconf),这个阈值是由用户指定的。根据支持度= (X,Y).coun t/T.count,置信度 = (X,Y).count/X.count ,要

4、想找出满足条件的关联规则,首先必须找出这样的集合F=X U Y ,它满 足F.count/T.count $ minsup,其中F.count是T中包含F的事务的个数,然后再从F中找出这样的 蕴含式XY,它满足(X,Y).count/X.count $ minconf,并且X二F-Y。我们称像F这样的集合称为频 繁项目集,假如F中的元素个数为k,我们称这样的频繁项目集为k-频繁项目集,它是项目集合I的子 集。所以关联规则挖掘可以大致分为两步:1)从事务集合中找出频繁项目集;2)从频繁项目集合中生成满足最低置信度的关联规则。最出名的关联规则挖掘算法是Apriori算法,它主要利用了向下封闭属性:

5、如果一个项集是频繁 项目集,那么它的非空子集必定是频繁项目集。它先生成1-频繁项目集,再利用 1-频繁项目集生成 2- 频繁项目集。然后根据2-频繁项目集生成3-频繁项目集。依次类推,直至生成所有的频繁项目 集,然后从频繁项目集中找出符合条件的关联规则。三、所用仪器、材料(设备名称、型号、规格等或使用软件)1 台 PC 及 Microsoft SQL Server 套件四、实验方法、步骤(或:程序代码或操作过程)1. 数据准备2. 实现挖掘任务3. 查看挖掘结果五、实验过程原始记录( 测试数据、图表、计算等)1. 连接管理器2. 创建 AdventureWoks -I =旦 P yIfI 二

6、-q w * | 耳j- l. 必I.HLAduMiHlMroWiiii ltmi&dlL I J-fr :|U iWfrik * u b n ii ui irwlAFM iHbi 44U任Jii%.!E.ii-#-uVfLrk.di|-. li 工11|-1初1咸.勺3. 选择数据源4. 建立数据挖掘肩龙列时内客和散HR最型raw扌沁0b见的刁毎豹也s%aik炜门门耳口 rrzFTl圍0-3圍圍rr3列AgeBike Buyer匚ommute DistanceCustomer KeyEngilish Edu匚巴甘口口English OccupationFirst Narri&GenderGe

7、og raphy KtyHa use-FlagL 臼 51 NameFvl a ritl StatusINumbe-r Cars OwnedNumber Children 3 HomeRegion内咨裘型 Co-ntinum Discrete- Dis Crete- K&y Dis 匚El D-is crcte- Oi&crets Discrete Dis 匚El D-is crcte- Oi&crets is errtr Dis;匚抚 D-is rrete- discrete-Long Long TextLongTexS T cxS Text TextTrxtT cxS Text T uxt

8、 Long Long Text栓皿般:自 just栓jcd fr W 4咼审强” g U:L_r K4miV-ds| -. zniN2i? 斗 izimAazifitaa -zj itj u.-culn 詩 fzjsAh 於関瞩睛 U E :MaDid d.LMi Zr-ci!iSni刊 ufi咒科.|用bk| j |3C曰白圉匕* *27. 决策树依赖关系网络61 口U-tniHI vMvanrrBjBf-Kd2LS A-Jw DI Ki-acA!nc-afcFFnitHTiQr 2 h Lik Ema 疋ifl 创讦HT片 匸i 三躍曲4 CD S!*HfllE 3B 叫1El *畋nn

9、L.U =3.*wfr t 口出凸O口冊凸X*1初环Z M*4lmg.cimm L1iht| Advenoixe Worfe CW血y L*tt丘泊英 X弧l?W曲| 帧齡 占媳IE税2!近占寻 出世帖准士罔走巴Ml囱口型禅箱IfaXMg握井西 阳住阵|期豳肛.*!E19S | 闷畤疑nra.q x 口 I A-iJAd V rite r4*! Ar kAqC* a.dbfrTdre WkxI:_j曲命遊 豹 Adsieivure Wcrfc!二愴IMft S Tjgewd MdSlfME:六、实验结果、分析和结论(误差分析与数据处理、成果总结等。其中,绘制曲线图时必 须用计算纸或程序运行结果

10、、改进、收获)实验结果:实验达到预期效果。分析和结论: 数据挖掘是指以某种方式分析数据源,从中发现一些潜在的有用的信息,所以数据挖掘又称作知识 发现,而关联规则挖掘则是数据挖掘中的一个很重要的课题,顾名思义,它是从数据背后发现事物之间 可能存在的关联或者联系。决策树是分类应用中采用最广泛的模型之一。与神经网络和贝叶斯方法相比, 决策树无须花费大量的时间和进行上千次的迭代来训练模型,更适用于大规模数据集。在部署时,出现 由 于“创建用于目标邮件方案的挖掘结构”中“内容类型”的设置没有严格按照教程来,导致后续有继承 键而无法部署,重新设置更改后才得以解决。注:教师必须按照上述各项内容严格要求,认真批改和评定学生成绩。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号