数据挖掘实验指导

上传人:M****1 文档编号:494914757 上传时间:2022-08-28 格式:DOCX 页数:6 大小:218.24KB
返回 下载 相关 举报
数据挖掘实验指导_第1页
第1页 / 共6页
数据挖掘实验指导_第2页
第2页 / 共6页
数据挖掘实验指导_第3页
第3页 / 共6页
数据挖掘实验指导_第4页
第4页 / 共6页
数据挖掘实验指导_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《数据挖掘实验指导》由会员分享,可在线阅读,更多相关《数据挖掘实验指导(6页珍藏版)》请在金锄头文库上搜索。

1、实验 3 分类分析一、实验目的(1) 学习决策树分类学习方法,学习其中C4.5学习算法,了解其他Id3、C5.0等其它分类 学习方法。( 2)应用 Weka 软件和 Clementine 软件,学会导入数据文件,并对数据文件进行分类分析(3) 学会如何选择学习函数并调节学习训练参数以达到最佳学习效果。(4) 学习并应用其他决策树学习算法,可以进行各种算法对照比较。二、实验内容1、 相关知识 决策树是利用一系列规则构建一棵树.它可高度自动化地建立起易于为用户所理解的模 型并且具有较好地处理缺省数据及带有噪声数据等能力。可以直观、清晰地表达加工的逻辑 要求。特别适合于判断因素比较少、逻辑组合关系不

2、复杂的情况。数据挖掘中决策树是一种 经常要用到的技术,可以用于分析数据,同样也可以用来作预测。决策树分类算法有CLS,ID3,C4.5,CART等算法。这里采用C4.5算法和C5.0算法WEKA 里的J48决策树模型是对Quinlan的C4.5决策树算法的实现,并加入了比较好的剪枝过程,有 非常好的精度。2、weka 软件练习(1) 用 J48 算法对“weather.arff”(C:Program FilesWeka-3-7data)作分类分析。(2) 选择其他数据进行决策树分类学习(bank-data-final.arff),学习并应用其他决策树学习 算法(如Id3算法),可以进行各种算法

3、对照比较。3、Clementine 软件练习用 C5.0 算法对 bank-data.csv 作分类分析。三、实验操作1、 weka 软件练习(1) 在开始程序(或者桌面图标)中找到WEKA,单击即可启动WEKA,启动WEKA时 会发现首先出现的一个命令提示符。接着将出现如下Weka GUI Chooser界面。(2) 选择GUI Chooser中的探索者(Explorer)用户界面。点击预处理(Preprocess)功能 按钮的,Open file,选择其中的“weather”数据作关联规则的分析。打开“weather.arff”, 可 以 看 到 “ Current relation ”、

4、“ Attributes ”“ Selected attribute ” 三 个 区 域 。(4)选中J48分类器后,J48以及它的相关默认参数值出现在Choose按钮旁边的条形框中。 单击这个条形框会打开J48分类器的对象编辑器,编辑器会显示J48的各个参数的含义。根 据实际情况选择适当的参数,探索者通常会合理地设定这些参数的默认值(如minnumobj: 叶子节点最小实例数目)。(5) 选定分类器后,单击Start按钮使其开始工作。Weka每次运行时间的较短。在它工作 时,坐在右下角的小鸟会即时起舞,随后结果就显示在右区域中。( 6 )实验结果 在窗口的右区域默认显示了全部输出结果。在该结

5、果的开头给出了数据集概要并注明所 需要的评估方法是默认的10折交叉验证。可以选择其他的验证方法来重新分类学习。2、Clementine 软件练习(1)在开始程序(或者桌面图标)中找到Clementine,单击启动Clementine。(2)在“源”选项卡中选择“可变文件”,右键单击选择“编辑”。在“文件”选项卡中导 入数据文件(bank-data.csv),在“类型”选项卡中,单击“读取值”按钮,“pep”字段(类 别字段)输入方向选择为“输出”。V(W Wk读取值 渚除值 渚除所有值字段类型值缺失检查方向2SJ肉刷新mining课件I十四周实验bank-data.csv文件編帘AAAAAAA

6、AAA出 无输输输输输输输输输输输无无无无无无无无无无无无ida无类型age少范围18,67sexo标志MALE/FEM.region吧集INNER_CI.income&范围5014.21,6.marriedO标志YES/NOchildren少范围0,3carO标志YES/NOsave_actO标志YES/NOcurrent日 ctO标志YES/NOmortgageO标志YES/NOpepO标志YES/NOC收藏夹查看当前字段J查看未使用的字段设置0(症业观圈文件数据过滤类型注解确定取消应用重置(3)在“建模”选项卡中选择5.0”,单击“运行”按钮。在输出的“模型”和“查看器” 选项卡中查看分类结果。四、实验结果pep/国甌 s uj9 I X /四 children 1 模式:NO变讹用耍性H标:3Ve_3Ct|r模型 查看器 汇总 设置 注解确定 职消

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号