大数据背景下数据挖掘课程的教学研究

上传人:小** 文档编号:34143715 上传时间:2018-02-21 格式:DOC 页数:5 大小:46KB
返回 下载 相关 举报
大数据背景下数据挖掘课程的教学研究_第1页
第1页 / 共5页
大数据背景下数据挖掘课程的教学研究_第2页
第2页 / 共5页
大数据背景下数据挖掘课程的教学研究_第3页
第3页 / 共5页
大数据背景下数据挖掘课程的教学研究_第4页
第4页 / 共5页
大数据背景下数据挖掘课程的教学研究_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《大数据背景下数据挖掘课程的教学研究》由会员分享,可在线阅读,更多相关《大数据背景下数据挖掘课程的教学研究(5页珍藏版)》请在金锄头文库上搜索。

1、大数据背景下“数据挖掘”课程的教学研究 黄艳梅 江西工程学院 摘 要: 数据挖掘是大数据背景下的独特产物, 如今已经走进了各大高等职业院校, 从而为大数据的有效应用提供了较大帮助。在这种情况下, “数据挖掘”课程的教学改革及研究引起了社会以及教育界的一致关注。“数据挖掘”课程因涉及的知识较杂, 学科较多, 因此, 在具体教学的过程中, 遭遇了较大难题。一般而言, “数据挖掘”课程的学习内容包括数据预处理、数据仓库、数据挖掘和数据挖掘应用。现如今, 数据挖掘技术虽然已经在各行各业进行大面积的应用, 但是主要的应用还是在电子商务、移动网络、网络办公等领域。文章以“数据挖掘”为主要内容进行分析, 对

2、当前的教学改革提出相应的建议。关键词: 数据挖掘; 大数据; 教学; 改革; 作者简介:黄艳梅 (1979) , 女, 江西南昌人, 讲师, 硕士;研究方向:计算机网络技术。基金:2016 年江西省高等学校教学改革研究省级课题;项目名称:大数据时代高职院校数据存储与应用的建设研究;项目编号:JXJG-16-28-3Teaching research on “Data Mining” course under the background of big dataHuang Yanmei Jiangxi University of Engineering; Abstract: Data minin

3、g is a unique product under the background of big data, and now it has entered the major higher vocational colleges, so as to provide effective help for the effective application of big data. In this case, the teaching reform and research of “Data Mining” course has aroused the unanimous concern of

4、the society and the educational circles. The “Data Mining ” course involves more knowledge and more subjects, so it encounters great difficulties in the process of teaching. Generally speaking, the course of “Data Mining” includes data preprocessing, data warehouse, data mining and data mining appli

5、cations. Today, data mining has been widely used in all walks of life, but the main application areas are in e-commerce, mobile network, network office and so on. This paper analyzes the data mining as the main content and puts forward some suggestions for the current teaching reform.Keyword: Data M

6、ining; big data; teaching; reform; 0 引言大数据背景下, 人们利用网络能够在最短的时间内处理相关事务, 极大地提升了生产能力和效率。伴随着数据越来越丰富, 如何有效地利用数据促进社会各行各业的发展已经成为人们需要探索的问题, 而“数据挖掘”课程就是基于这种情况下的产物, 对于数据化在各领域的发展具有积极的促进作用。但是, 由于课程的复杂性正在日益加深, 教学面临极大的困难, 因此, 有效地进行教学改革是课程发展的必由之路。本文在分析教学现状的基础上, 从增强学生数据敏锐意识、夯实学生的理论基础、培养学生的实践能力以及提升学生独自探索能力这几个方面对课程的改革

7、方向进行了探索。1 大数据相关概述大数据是一个较为宽泛的概念, 互联网发展到一定时期, 由于其相关的数据处理能力、数据存储能力、数据检索功能以及数据具体应用较强, 人们将这种现象统称为“大数据现象”。因此, 大数据不能简单地用具象化的事物进行概括。人们普遍认为大数据是一个支撑网络运行的数据集合, 并通过多台计算机进行数据互联, 通过云处理、云计算的方式对其进行挖掘及应用。(1) 数据包有大小之分, 而其单位也随着日渐庞大的数据库产生了一定变化, 如 MB, GB, TB 以及 EB 等, 未来随着数据库的不断壮大, 相信会出现更大的数据统计单位。 (2) 数据的表现形式较多, 其中文本形式最普

8、遍, 易存储、易挖掘。另外, 图片、音频、视频等现如今应用较广的数据形式, 占用的数据库空间较大, 但也正逐渐成为一般性的数据结构形式, 而其他的如网络中的关键词等为一些不完整的数据结构形式1。 (3) 在实际应用过程中, 数据化的处理、存储、挖掘与应用是一个相互促进的过程, 之间也存在着较大联系, 不同的数据结构形式可以相互转换, 因此, 在丰富数据存储网络的同时, 也为实际挖掘与应用加大了难度。而从数据的本质而言, 数据本身就是从社会的各领域中汇总而来, 社会各领域的不断深入联系, 使人们在进行数据处理时需要加大处理范围, 因此, 造成了数据处理的难度2。 (4) 在数据处理的过程中, 大

9、数据运行的速度较快, 在一定程度上加快了数据处理整个过程的效率。2 教学软件分类如今, 数据挖掘工具也有不同种类, 常用的一般有 WEKA, Rapid Miner, NLTK, Orange, KNIME 以及 R-Programming 等。其中, WEKA 基于 Java 编程语言, 因其设计较为繁杂, 功能较为全面, 因此, 在实际运用过程中, 可以适应多领域的数据挖掘需求。此外, 它能对数据处理的整个过程进行干涉, 并根据实际需求进行软件功能的定义, 以此让其功能更加适用。Rapid Miner 是一款位列挖掘工具排行榜榜首的工具, 广受人们的喜爱, 其主要原因在于虽然其也是基于Ja

10、va 编程语言的工具, 但是在实际运用过程中不须用户实际编写, 极大地节省了用户的时间。更可贵的是此软件在实际运用过程中镶嵌了 WEKA 的一些运行程序, 使其功能更加完善, 此外, 它是一款开源数据工具3。NLTK 在语言处理方面是这类挖掘工具的最强者, 对各类语言能够精确分析并实施处理工作, 在运行的过程中, 极大地解放了使用者的双手, 基于 Python 的工具能够为实际的使用体验增添一些乐趣, 因为它还能够自定义一些任务。Orange 的优点则在于它可视化的编程设计, 包容性强, 并且其附加了强大的文本挖掘工具, 对运用具有实际性的帮助, 因此, 适用从简单到复杂的一系列数据处理工作,

11、 深受各类用户的喜爱。KNIME 在数据处理阶段, 具有较为全面的功能, 并能够同时适用商用以及开源性的工作需要, 在具体处理的过程中, 尽量照顾到了用户多次处理的需要, 以便用户对结果进一步完善。R-Programming 集成了大部分软件的优点, 重点是在统计、制图上具有一定的成效, 包含了这方面软件的开发、数据建模, 其编写的语言综合了 C 语言、FORTRAN 语言以及 R 语言。在这款工具中, R 语言被极大地扩展, 使其工具的使用难度也进一步降低4。本文选用的是功能较为全面的 WEKA 数据挖掘工具, 因其适用的系统为中文版3.6.11 版本, 也是一款比较适用于学习的软件, 其中

12、包含了在预处理过程中能够使用到的学习算法、数据预处理、数据分类、回归分析等, 在交互界面上能够实现可视化。而如果需要针对某项数据进行特定的处理, 一般也可以选择在其中编辑出适用的算法, 以适应教学内容。而其广泛使用的历史也能够证明其具有较为完备的系统功能, 比较适用于新课程的改革和研究。因此, 本文以WEKA 数据挖掘工具为基础, 对“数据挖掘”课程的教学实践进行探索, 为提高学生的实践能力以及夯实理论基础提供一定的帮助。3 实践教学示例3.1 实验准备一般而言, 在进行实验之前, 教师需要准备相关数据, 以便具有明确的实验流程。 (1) 对于工具的认识, 在 WEKA 中, 首先要认识其数据

13、格式, 以免在分析的过程中数据运行出现问题。WEKA 的数据格式为 ARFF, 所以在进行运算分析以及处理过后的文件格式均为一致, 一般文件都储存在其自带的存储库中。需要明确注意的是, 在进行教学之前, 需要安装专门的文件阅读编辑器。 (2) 选择合适的算法以及实验的数据集。本文教学实验中所选用的是 C4.5, 选用的数据集为某种疾病的预测样本数据集, 并提前将其转化为对应的格式, 其中属性为9 个, 样本为 260 个。其中 1 个类别属性, 并为两个可能性。 (3) 掌握相应的工具中的测试使用方式, 以及 C4.5 算法具体实施关键内容。3.2 实验步骤主要的步骤具体分为以下几个方面。首先

14、, 将相应的数据集加载进数据挖掘工具, 在其面板上选择对应文件进行加载, 一般在其接口处, 以此完成数据预处理工作。其次, 在其工具中的分类功能, “工具 assify”中设置相关参数, 因其有很多的子条目, 因此, 具体操作如下:单击“设置 assify”“trees”“J48”“y 参数分类器”“J48”“c0.25”“M2”。老师在学生完成后需要对此认真进行检查, 让学生能够明确步骤;设定其测试选项, 具体如下, 单击“老师 assify”“Testoptions”“usetrainingtest”, 这个过程不拘于一种形式, 可以让学生进行多选择的练习;评估样本设置, 单击“这个ass

15、ify”“Start”, 进行评估以及分类器的设定, 学生应该分析其中的结果输出, 从而进行具体判断, 完成数据挖掘工作;对于所分析的结果进行了解之后, 将以上步骤进行重复演练, 随机更改以及添加相应的样本数据属性以及分类参数, 从而得到不一样的结果。最后, 老师在对学生的试验成果进行评估之后, 引导学生对相应的结果进行可视化展示, 具体如下:单击“进行 assify”“Resu It List”“trees.J48”“vsua Iizetree”。4 结语“数据挖掘”是一门涉及范围广、多门类、专业性的实践应用课程, 早在 20 世纪八九十年代, 国外计算机领域的专家就提出将其作为一个独立的计

16、算机门类进行研究, 到了 21 世纪初期, 随着人们对于计算机数据处理及应用要求的不断提升, 数据挖掘也逐渐发挥出了相应的功用, 在诸多领域内起着积极的作用。随着数据形式、内容的不断丰富, 必将演变出更实用的数据挖掘技术, 为教学改革提供动力。参考文献1方璐.浅析大数据时代的科学研究方法J.信息通信, 2014 (5) :150-151. 2张艳.大数据背景下的数据挖掘课程教学新思考J.计算机时代, 2014 (4) :59-61. 3李海林.大数据环境下的数据挖掘课程教学探索J.计算机时代, 2014 (2) :54-55. 4叶明全, 黄道斌, 卢小杰, 等.大数据时代下数据挖掘课程实践教学探索J.池州学院学报, 2016 (6) :128-130.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号