数据挖掘在个性化远程教育系统中的应用研究

上传人:第*** 文档编号:30644673 上传时间:2018-01-31 格式:DOC 页数:7 大小:112KB
返回 下载 相关 举报
数据挖掘在个性化远程教育系统中的应用研究_第1页
第1页 / 共7页
数据挖掘在个性化远程教育系统中的应用研究_第2页
第2页 / 共7页
数据挖掘在个性化远程教育系统中的应用研究_第3页
第3页 / 共7页
数据挖掘在个性化远程教育系统中的应用研究_第4页
第4页 / 共7页
数据挖掘在个性化远程教育系统中的应用研究_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《数据挖掘在个性化远程教育系统中的应用研究》由会员分享,可在线阅读,更多相关《数据挖掘在个性化远程教育系统中的应用研究(7页珍藏版)》请在金锄头文库上搜索。

1、647数据挖掘在个性化远程教育系统中的应用研究Data Mining in Individuality Long-distance Education System Applied Research本文在分析了当前众多远程教育网站中存在的不足后,提出将近年来在电子商务等方面广泛运用的数据挖掘技术(data mining)引入到远程教学系统中。考虑到远程教育系统和电子商务等系统存在着诸多不同之处,文中提出了一种基于代理(Agent)的系统架构模型,并在此基础上介绍了以学生学习评价数据为实体的多维数据立方体(data cube)模型的构建方法,并用 Microsoft SQL Server 中提供

2、的 OLAP 分析服务工具实现了此模型。关键词: 远程教育 数据挖掘 OLAP 多维数据模型1 引言随着计算机的普及和 Internet 网的推广,基于 Web 的远程教育站点在国内外如雨后春笋般迅速崛起,教学对象遍及小学生、中学生、大学生各个学习层次,教学内容覆盖了数学、语文、英语、美术、音乐各学科门类。但是,目前数目众多的 Web 远程教学站点有以下几个明显的共同缺点:1 现有的远程教育站点其教学内容在表现形式上基本上都是静态的,即学习资料以 HTML 静态网页形式发布在网站上,一旦放上去后,就很少再进行修改。教学课件的设计者并不知道他的课件是否合理,是否符合教学规律,页面之间的链接是否适

3、应学生的访问习惯和学习内容进度的安排。学生只能是按静态课件所设计的顺序按部就班的学习,对以往学习中存有疑问的知识点及可能感兴趣的知识无法主动获取,这极大的限制了学生学习的自主性及积极性,从而不能达到最佳的教学效果。2 现有的远程教育站点不能根据学生本人的情况因材施教,缺乏个性化教学。无论哪个学生访问该站点,其教学策略,教学内容及授课顺序都是一样的,站点不能根据学生的自身情况提供适合于他个人的学习习惯及学习进度安排,结果使学生的个性无法发挥。3 现有的远程教育站点虽然提供了学生在线作业和在线测试等功能,以此检验学生学习效果。但是其评价测试结果并没有和学生下一步学习相联系,并没有给出学生在今后学习

4、过程中所要注意的学习重点和难点,对学生个人的学习方式也没加以纠正和引导,缺乏对学生学习整个过程的监控管理。4 现有的部分远程教育站点大多数是根据学生所在年级和班级给学生加以分组聚类,对于在同一组中的学生布置同样的学习内容,使得这对于那些学习进度超前的学生为了保持和大家同步而放慢学习进度,相反对于那些学习后进的同学为了追赶大家的进度而忽略甚至放弃某些教学内容的学习,至使后面的学习更加困难。以上这些在现有远程教育站点中存在的问题极大地制约了现代远程教育技术的进一步完善和发展。经过多年的教学实践应用,在现有的远程教育站点上积累了大量有用的信息,但这些信息存储分散,记录凌乱,数据庞大,如:学生注册信息

5、,登录信息,浏览路径信息,答疑信息,作业信息,测试信息,交流信息,学习状态信息,学习进度信息等大量资源,如何利用这些资源建立一个智能化、个性化的远程教育环境,是现代远程教育技术发展中的一个关键问题。6482 具有数据挖掘功能的代理系统架构2.1 数据挖掘技术与知识发现随着计算机技术的发展,特别是数据库管理系统的广泛应用,人们积累的数据越来越多。庞大的数据背后隐藏着许多重要的信息,但在庞大数据中发现隐藏的关系和规则却不是件容易的事。如何解决“数据爆炸但知识贫乏”的现象,这一疑问直接促成了数据库中的数据挖掘技术的产生。数据挖掘(DM:Data Mining)就是从大量的、不完全的、有噪声的、模糊的

6、、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它涉及到对数据库中的大量数据进行抽取、转换、分析和其他模型化处理,从中提取辅助决策的关键性数据。简而言之,数据挖掘就是深层次的数据信息分析方法。数据挖掘可以视为另一个常用的术语数据库中的知识发现(KDD: Knowledge Discovery in Databases)的同义词。通常知识发现的过程由以下步骤组成:图 1 知识发现的过程(1)信息收集:根据确定的数据分析对象抽象出在数据分析中所需要的特征信息,然后选择合适的信息收集方法,将收集到的信息存入数据库。(2)数据清理:在数据库中的数据一般是不

7、完整的(有些感兴趣的属性缺少属性值) ,含噪声的(包含错误的属性值) ,并且是不一致的(同样的信息不同的表示方式) ,因此需要进行数据清理,将完整、正确、一致的数据信息存入数据仓库中。(3)数据挖掘:根据数据仓库中的数据信息,选择合适的分析工具,应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息,得出有用的分析信息。(4)知识表示:将数据挖掘所得到的分析信息以可视化的方式呈现给用户,或作为新的知识存放在知识库中,供其他应用程序使用。数据挖掘技术现在广泛的应用于电子商务系统,智能化机器人系统,自适应管理系统的研究开发中,取得了不错的成就,但在远程教育系统中并没

8、有得到充分发展,这是因为远程教育有与其他系统不同的方面。在众多的原因中其中之一就是传统的远程教育模型对用户信息的收集不够全面,记录方式不够统一,收集到的信息缺乏管理等,因此,有必要设计一种全新的远程教育系统架构。2.2 基于代理(Agent)的系统架构由于数据挖掘系统所需的数据都存储在数据库中,数据挖掘系统一般不直接从界面获取用户信息,因此需要将用户信息获取与数据挖掘分开。这样传统的两层 B/S 网站架构就并不能满足数据挖掘系统实现的需要。本文提供了一种基于 Agent 的系统架构模型,该模型将信息获取和分析分开,适合于数据挖649掘的需要。近年来代理(Agent)技术得到了迅猛地发展,其展现

9、出十分诱人的应用前景。一般来说 Agent 主要具有自治性(autonomy ) 、社会性(social ability) 、反应性(reactivity) 、能动性(pre-activeness)四个基本特性: 自治性:代理可以在没有人或其他代理直接干预的情况下运作,而且对自己的行为和内部状态有控制能力;社会性:代理和其他代理可以通过代理语言进行信息交流;反应性:代理能够理解周围的环境,并对环境的变化做出实时的响应;能动性:代理不仅简单地对其环境做出反应,也能够通过接受某些启动信息,表现出有目标的行为。图 2 就是一种基于代理的 Web 远程教育系统模型:数据层中间层交互层用户浏览器网站AS

10、P页面学生代理教学内容数据库学生学习信息数据库分析信息数据库数据挖掘系统用户服务系统图 2 基于代理的系统模型图 2 的这种基于代理的系统架构是按照目前流行的 B/S 三层模型设计的,三层模型包括:交互层、中间层以及数据层。交互层只由一些 ASP 页面构成,主要功能是接受用户请求,将经系统分析处理后的内容呈现给用户,交互层不负责系统具体功能的实现。系统主要的分析处理功能集中在中间层,其中学生代理充当了中介的作用。当用户注册进入该系统时,就生成一个学生代理对象与用户相对应,这个学生代理对象将用户在该系统上所有动作都转化为对其他子系统功能的调用。学生代理记录着用户当前的学习进度、心理状态和在系统中

11、的访问权利限制等数据信息,学生代理就是在该系统中对用户这个真实对象的抽象。其他子系统的访问交互对象也仅限于学生代理对象,在对子系统设计和实现过程中系统并不必关心是怎么和真实用户进行交流的,它们将学生代理对象当作真实用户,这样就将功能的实现和显示分开,方便各子系统的独立分析、设计以及最后完成后各子系统间的整合。在该模型中,我们关注的焦点是数据挖掘子系统。数据挖掘系统将由学生代理获取的用户当前状态信息以及数据库中记录的用户以往学习信息一起进行分析,得出适合于用户当前学习的教学策略信息,该信息可以提供给用户服务系统,由其生成适合用户的课件、作业以及测试等,也可直接提供给用户,使用户对自己当前的学习效

12、果心里有数。数据挖掘系统同用户服务系统并不直接进行交互,它们之间的功能调用是通过学生代理来完成,之间的数据是通过数据库传输的。这样做是因为可以将数据分析和教学内容呈现完全分割开,由不同的人员进行设计和实现,各子系统内部的实现细节对于其他子系统的设计开发人员来说是透明的。当各子系统分别完成后,进行系统集成,最终完成为一个统一的、完整的个性化远程教育系统。6503 基于 OLAP 技术的数据挖掘解决方案3.1 OLAP 技术OLAP(On-Line Analytical Processing 联机分析处理)是一种目前相当流行的数据挖掘分析技术,它具有汇总、合并和聚集功能,以及从不同的角度观察信息的

13、能力。OLAP 是基于多维数据模型的。该模型将数据看作数据立方体(data cube)形式。数据立方体允许以多维角度对数据建模和观察。它由维和事实定义。维是关于一个组织想要记录的透视或实体。每一个维都有一个表与之相关联,该表称为维表。多维数据模型围绕中心主题组织。该主题用事实表表示。事实是数值度量的。事实表包括事实的名称或度量,以及每个相关维表的关键字。当在 OLAP 系统中建立起数据立方体后,用户能够以多维视图的方式浏览数据仓库中的数据,并且可以对数据进行向上上卷 ( roll-up) 、向下钻取 (drill-down) 、旋转 (rotation) 、视角变换(focus change)

14、等操作,从多个角度、多个侧面,以浏览的方式进行信息查询。OL AP 系统的出现,使用户不再需要编写复杂的查询语句,借助 OL AP 系统的图形用户界面 (GUI ) ,就可以深入了解包含在数据中的信息。3.2 针对学习评价的多维数据模型为了在远程教育系统中实现个性化教学,首先我们必须对学生的学习做出评价。只要在充分了解了学生的学习状况后,我们才能制定出适合于学生的教学策略。因此我们建立了如下的多维数据模型。3.2.1 事实表在建立多维数据模型过程中首先要确定多维数据模型围绕的中心主题,即设计事实表。很明显在我们这个系统中的中心主题就是对学生学习的评价,然而对于一个学习者的学习评价往往并不是件容

15、易的事,它涉及到学习者很多方面综合评估,而且有些方面的评估很难用数值来度量。所以我们决定将学习者的评价化分为几个容易用数值表示方面的评价,对每个方面分别给出评价,然后进行加权综合,最终得出对于一个学习者的评价。其评价方面构成了评价项目维表。3.2.2 评价项目维表学生是整个系统的主体,一个真正的个性化教育系统必须随时跟踪学生的学习状态和学习进度,并做出评价和反馈,提出提示和建议信息。其评价项目分为以下五个方面:(1)交互程度:在当前的许多远程教育网站都提供了内容丰富的交互功能,例如:BBS,聊天室,电子白板,在线 QQ 等,这些工具促进了学习者和学习者、学习者和教师、学习者与学习材料之间的交互

16、。对学习者交互程度的评价可以通过记录学习者利用网络教学支撑平台中的各种交流工具辅助学习进行,如:学习者在论坛学习相关内容上发帖数量,以及其他学习者对其帖子的兴趣程度以及认可程度等,教师也可对学习者所提问题的深度和与教学内容相关程度给出一定的评价。(2)答疑情况:学习者在网络学习过程中遇到了疑问可以向教师或是系统设置的智能导师系统寻求帮助,通过答疑学习者可以更加深入地理解学习的内容,可以促进知识意义的建构。答疑情况可以通过学习者请教的问题数、浏览问题解决的次数、以及提供解决方案的次数等信息反映学习者对所学知识理解程度以及学习的主动程度。(3)资源利用情况:学习者对资源的利用不仅指利用教师或因特网提供的资源,而且还包括学生在学习过程中所上载的数据。前者包括对网络教学平台及其中的资源的使用情况,如记录学习者的在线学习时间,浏览页面的范围和次数来提供学习者学习的范围和进度;后者包括利用浏览器或搜索引擎来浏览因特网资源的情况,也包含学习者上传学习相关资料的次数、大小以及质量等。(4)作业成绩:根据作业完成情况与

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 工程造价

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号