数据挖掘实验指导书

上传人:cn****1 文档编号:563383224 上传时间:2024-02-20 格式:DOCX 页数:56 大小:2.25MB
返回 下载 相关 举报
数据挖掘实验指导书_第1页
第1页 / 共56页
数据挖掘实验指导书_第2页
第2页 / 共56页
数据挖掘实验指导书_第3页
第3页 / 共56页
数据挖掘实验指导书_第4页
第4页 / 共56页
数据挖掘实验指导书_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《数据挖掘实验指导书》由会员分享,可在线阅读,更多相关《数据挖掘实验指导书(56页珍藏版)》请在金锄头文库上搜索。

1、商务数据分析实验指导书适用于国际经济与贸易专业)江西财经大学国际经贸学院编写人:戴爱明目录前 言 1实验一、SPSS Clementine软件功能演练5实验二、 SPSS Clementine 数据可视化 9实验三、决策树 C5.0 建模17实验四、关联规则挖掘30实验五、聚类分析(异常值检测)38前言一、课程简介商务数据分析充分利用数据挖掘技术从大量商务数据中获取有 效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据 挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信 息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为 数据库中知识发现(Knowledge Di

2、scovery in Database, KDD),因此, 数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘 过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数 据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓 库应用中极为重要和相对独立的方面和工具。数据挖掘有机结合了来自多学科技术,其中包括:数据库、数理 统计、机器学习、高性能计算、模式识别、神经网络、数据可视化、 信息检索、图像与信号处理、空间数据分析等,这里我们强调商务数 据分析所处理的是大规模数据,且其算法应是高效的和可扩展的。通 过数据分析,可从数据库中挖掘出有意义的知识、规律,或更高层次 的信息,

3、并可以从多个角度对其进行浏览察看。所挖掘出的知识可以 帮助进行商务决策支持。当前商务数据分析应用主要集中在电信、零 售、农业、网络日志、银行等方面。二、课程的任务和实验的教学目标课程编号:课程属性:专业任选课实验学时:8适用专业:国际经济与贸易先修课程:数据库技术、概率论与数理统计、统计学商务数据分析是一门理论和实践相结合的课程,其上机实验 的目的主要是实现数据挖掘的主要算法,训练学生实际动手进行数据 挖掘设计和软件应用的能力,加深对数据挖掘相关概念和算法的理 解。本课程具有技术性和实践性较强的特点,因此,配合基本原理的 讲授,应当安排相应的实习操作。通过实验和操作,使学生巩固和加 深数据仓库

4、与数据挖掘理论知识,进一步加强学生独立分析问题和解 决问题的能力、综合设计及创新能力的培养,为今后工作打下良好的 基础。经过多层次、多方式的全面训练后,学生应达到下列要求:1进一步巩固和加深数据挖掘基本知识的理解,提高综合运用 所学知识,建立、管理和分析商务数据的能力。2能根据需要选学参考书,查阅相关的工具,通过独立思考, 深入钻研有关问题,学会自己独立分析问题、解决问题,具有一定的 创新能力。3能正确处理大规模数据,选择数据挖掘工具的开发平台和相 关的软件解决实践问题。4能独立撰写实验报告,准确分析实验结果,总结有关的问题 提出相关的建议。三、实验教材及参考书理论课教材及参考书:肯数据仓库与

5、数据挖掘教程(丛书名:高等院校信息管理与信 息系统专业系列教材)作者: 陈文伟 编著,清华大学出版 社,2006.8肯数据仓库和数据挖掘,苏新宁 等编著,清华大学出版社,2006.4肯 数据仓库与数据挖掘技术(第2版),陈京民编著,电子工 业出版社, 2007.11肯 Jiawei Han, Micheline Kamber. Data Mining: Concepts and Techniques.高等教育出版社(影印版),2001.5.肯 Ian H. Witten, Eibe Frank. Data Mining: Practical Machine Learning Tools and

6、 Techniques (第二版). 机械工业出版社(影 印版), 2005.肯 Richard J. Roiger, Michael W. Geatz. Data Mining: A Tutorial-Based Primer清华大学出版社,2003.实验教材:肯 数据挖掘Clementine应用实务,谢邦昌主编,机械工业出版 社, 2008.4肯 数据挖掘原理与SPSS Clementine应用宝典,元昌安 主编, 电子工业出版社, 2009.8四、实验基本内容及学时分配按照商务数据分析实验教学大纲的要求,共设立实验4 个,总计 20 学时。试验基本内容与学时分配如下表:序号实验名称实验学

7、时每组人数实验属性实验者类别开出要求1SPSS Clementine软件功能演练11演练本科必开2实验一、SPSS Clementine 数据可视化11演练本科必开3分类发现21验证综合本科必开4关联规则21验证综合本科必开5聚类分析(异常检测)21验证综合本科必开五、实验方式与基本要求1、本课程的实验为非单独设课,因此,应该课程的内容安排和 进度,配合技术原理的讲授,进行相应的操作和实验。2、该课以综合性实验为主,教师给出实验题目,实验前学生必 须进行预习,3、在规定的时间内,由学生独立完成,出现问题,教师要引导 学生独立分析、解决,不得包办代替。4、实验中按要求做好学生实验情况及结果记录,

8、实验后认真填 写实验记录。5、实验指导书仅作为上机时的参考步骤,不能作为唯一的依据 以教材和课堂讲授为准。实验一、SPSS Clementine软件功能演练【实验目的】1、熟悉 SPSS Clementine 软件功能和操作特点。2、了解 SPSS Clementine 软件的各选项面板和操作方法。3、熟练掌握 SPSS Clementine 工作流程。【实验内容】1、打开 SPSS Clementine 软件,逐一操作各选项,熟悉软件功能。2、打开一有数据库、或新建数据文件,读入SPSS Clementine,并使用各种 输出节点,熟悉数据输入输出。(要求:至少做access数据库文件、ex

9、cel文件、 txt 文件、可变文件的导入、导出)【实验步骤】1、启动 Clementine:请从 Windows 的“开始”菜单中选择: 所有程序SPSS Clementine 11.1飼 SPSS Clementine 11. 1SPSS Clementine client 11.1D hFTi 0 ED o cijjti mt at i unLi i: erLE e Authur i i:=lt i un W i i :=Lt_ d SFSS ClemerLtine: Client 11. 1SFSS Li chtlsh Utility2、Clementine 窗口当第一次启动 Clem

10、entine 时,工作区将以默认视图打开。中间的区域称作 流工作区。在 Clementine 中,这将是用来工作的主要区域。Clementine 中绝大部分的数据和建模工具都在选项板中,该区域位于流工 作区的下方。每个选项卡都包含一组以图形表示数据挖掘任务的节点,例如访问 和过滤数据,创建图形和构建模型。E收藏夹(F)数据源(U)记录选项(尺)字段选项(D)A图形(G) | 建模训)数据库建模(B)输出(0) 导出(E) |麺据理变项女件选匿抽样忙总导腔类里辻总割臣圈杀闿圈且古圈命念H Q神竪阿貉 Kohonen05.0C&RT K-MeansS平田B服务器:本地服务器|128MB/14OMB

11、要将节点添加到工组区,可在节点选项板中双击图标或将其拖拽至工作区后释放。随后可将各个图标连接以创建一个表示数据流动的流。窗口的右上方是输出和对象管理器。这些选项卡用于查看和管理各种 Clementine 对象。“流”选项卡包含了当前会话中打开的所有流。可以将这些流保存并关闭 也可将其添加到工程中。流输出 模型豹疣1越 drug:也 drugplot曲 druglearn:也 fraud納 drugreport输出”选项卡包含了由 Clementine 中的流操作产生的各类文件。可以显示、重命名和关闭此处所列的表格、图形和报告。疣输出模型阳)Table ( 1 3于字段,1,000条记录)Dru

12、g的分布Na_to_K的直方图Patient Records ( 8 个字段,200 . 怛讯日认K的散点图H Drug的分析“模型”选项卡是一个功能强大的工具,包含了在一次会话中产生的所有模 型(即,已在 Clementine 中构建完毕的模型)。通过它,可以对模型作更深入 的查看、将其添加至流中、导出或为其加注解。窗口右侧底部的部分是工程工具,它用来创建和管理数据挖掘工程。查看在 Clementine 中 创 建 的 工 程 有 两 种 方 式 - 类 视 图 或 CRISP-DM 视 图 。“CRISP-DM”选项卡提供了一种组织工程的方式。“类”选项卡提供了一种在 Clementine

13、 中按类别(即,按照所创建对象的类别)组织工作的方式。当要获 取数据、流、模型等对象的详尽目录时,这种视图十分有用。实验二、SPSS Clementine数据可视化实验目的】1、熟悉 SPSS Clementine 绘图。2、了解 SPSS Clementine 图形选项面板各节点的使用方法3、熟练掌握 SPSS Clementine 数据可视化流程。【实验内容】1、打开SPSS Clementine软件,逐一操作各图形选项面板,熟悉软件功能。2、打开一有数据库、或新建数据文件,读入SPSS Clementine,并使用各种 输出节点,熟悉数据输入输出。(要求:至少做分布图、直方图、收集图、多

14、重 散点图、时间散点图)实验步骤】1 、启动 Clementine:请从 Windows 的“开始”菜单中选择所有程序PSS Clementine 11.1SPSS Clementine client 11.1SPSS Clementine 11. 1D hFTi 0 EIlociurienor.Li i: erLE e hut her i za t i on W i i :=Lt_ d SFSS Clementine Client 11. 1SFSS Lichtlsh Utility2、建立一个流、导入相关数据,打开图形选项面板3、绘制以下各类图形1)以颜色为层次的图2)以大小为层次的图n nonu .uou -0.070-iJt*1* J *VtI O.OBO-I *.?:;.U.UDU n nzm -1h9 4 ” k*U .UHJ n non::U.UJU -0.020-1:3* : 11 HIGH LOW N

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号