开题报告(数据挖掘)

上传人:新** 文档编号:576428072 上传时间:2024-08-19 格式:PPT 页数:20 大小:722.50KB
返回 下载 相关 举报
开题报告(数据挖掘)_第1页
第1页 / 共20页
开题报告(数据挖掘)_第2页
第2页 / 共20页
开题报告(数据挖掘)_第3页
第3页 / 共20页
开题报告(数据挖掘)_第4页
第4页 / 共20页
开题报告(数据挖掘)_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《开题报告(数据挖掘)》由会员分享,可在线阅读,更多相关《开题报告(数据挖掘)(20页珍藏版)》请在金锄头文库上搜索。

1、数据挖掘在高职教学中的应用数据挖掘在高职教学中的应用汇报人:汇报人:导导 师:师:学学 院:计算机科学与技术学院院:计算机科学与技术学院2021/8/141内容概要内容概要n选题目的和意义选题目的和意义 n国内外研究动态国内外研究动态 n研究的主要内容研究的主要内容n实验设计方案实验设计方案n准备工作情况和主要工作措施准备工作情况和主要工作措施 n论文进度安排及预期达到研究结果论文进度安排及预期达到研究结果 2021/8/142选题目的和意义选题目的和意义n由由于于我我国国大大众众化化高高等等教教育育的的普普及及,高高校校学学生生数数量量的的激激增增,给给高高校校教教学学工工作作带带来来了了诸

2、诸多多新新的的问问题题。尤尤其其是是高高职职学学生生,他他们们的的主主体体是是普普通通高高中中应应届届毕毕业业生生高高考考最最后后一一批批录录取取的的学学生生。这这些些学学生生在在学学习习意意识识、学学习习方方法法、学学习习能能力力及及学学习习动动力力上上比比较较欠欠缺缺,并并可能有较多常见的心理问题。可能有较多常见的心理问题。n大大部部分分学学生生没没有有养养成成良良好好的的学学习习习习惯惯。他他们们中中的的大大部部分分学学习习基基础础比比较较差差、自自制制力力也也比比较较弱弱,学学习习目目标标不不够够明明确确,缺缺乏乏刻刻苦苦钻钻研研精精神神。很很多多学学生生就就读读离离职职并并不不是是因

3、因为为自自身身渴渴望望学学习习, ,而而是是无无可可奈何或出于应付家长的要求。奈何或出于应付家长的要求。n他他们们对对所所学学的的专专业业并并没没有有太太多多了了解解,因因此此学学习习目目标标不不够够明明确确同同时时,他他们们还还对对社社会会对对其其的的容容纳纳有有一一种种怀怀疑疑,这这种种怀怀疑疑直直接接导导致致了了自自信信心心的的不不足足,由由此此也也影影响响到到学学生生学学习习的的动动力力。此此外外,由由于于这这批批学学生生普普遍遍没没有有养养成成良良好好的的学学习习习习惯惯,叉叉影影响响了了良良好好学学习习氛氛围的营造,不良的学习氛围又反过来影响学生的学习动力。围的营造,不良的学习氛围

4、又反过来影响学生的学习动力。n教教师师迫迫切切地地需需要要科科学学地地研研究究高高职职教教学学各各个个环环节节中中的的大大量量的的数数据据信息,从中获取知识,继而科学地指导教学。信息,从中获取知识,继而科学地指导教学。2021/8/143选题目的和意义选题目的和意义n二二十十世世纪纪,数数据据库库技技术术取取得得了了决决定定性性的的成成果果并并且且得得到到广广泛泛应应用用。大大量量信信息息在在给给人人们们带带来来方便的同时也带来了一大堆难题:方便的同时也带来了一大堆难题:n第一是信息过量,难以消化;第一是信息过量,难以消化;n第二是信息真假难以辨识:第二是信息真假难以辨识:n第三是信息安全难以

5、保证;第三是信息安全难以保证;n第四是信息形式不一致,难以统一处理。第四是信息形式不一致,难以统一处理。2021/8/144选题目的和意义选题目的和意义n数数据据挖挖掘掘技技术术(Data (Data Mining)Mining)被被称称为为未未来来信信息息处处理理的的骨骨干干技技术术之之一一,是是一一个个多多学学科科交交叉叉研研究究领领域域,融融合合了了数数据据库库,人人工工智智能能、机机器器学学习习,统统计计学学,知知识识工工程程、面面向向对对象象方方法法、信信息息检检索索,高高性性能能计计算算以以及及数据可视化等多项最新技术数据可视化等多项最新技术n数数据据挖挖掘掘技技术术从从8080年

6、年代代末末开开始始出出现现。短短短短二二十十多多年年它它的的发发展展速速度度很很快快。目目前前数数据据挖挖掘掘技技术术在在零零售售业业的的购购物物篮篮分分析析、金金融融风风险险预预测测、产产品品质质量量分分析析、通通讯讯及及医医疗疗服服务务、基基因因工工程程研研究究等等许许多多领领域域得得到到了了成成功功的的应应用用。很很多多专专题题会会议议也也把把数数据据挖挖掘掘和和知知识识发发现现列列为议题之一。为议题之一。2021/8/145选题目的和意义选题目的和意义n虽虽然然目目前前数数据据挖挖掘掘技技术术主主要要在在商商业业领领域域中中得得到到广广泛泛发发展展,但但它它面面向向应应用用的的本本质质

7、决决定定了了在在任何需要的领域都会发挥它的价值。任何需要的领域都会发挥它的价值。n在在高高校校教教育育教教学学及及管管理理中中有有大大量量直直接接或或间间接接的的数数据据,关关系系到到教教师师评评价价、人人才才管管理理及及学学生生选选课课指指导导、学学生生成成绩绩分分析析等等内内容容。把把数数据据挖挖掘掘技技术术应应用用于于高高等等学学校校的的教教学学与与管管理理中中,是是数据挖掘技术在又一个领域的应用。数据挖掘技术在又一个领域的应用。2021/8/146选题目的和意义选题目的和意义n高高等等学学校校多多年年来来的的教教学学和和管管理理工工作作积积累累了了大大量量的的数数据据,目目前前,鉴鉴于

8、于社社会会对对高高等等学学校校发发展展的的需需求求和和高高校校数数据据管管理理的的现现状状,利利用用这这些些数数据据理理性性的的分分析析学学校校各各方方面面工工作作的的成成效效以以及及教教师师发发展展状状况况,对对高高校校教教学学管管理理决决策策支支持持系系统统的影响变得十分重要。的影响变得十分重要。n利利用用数数据据挖挖掘掘技技术术从从数数据据仓仓库库中中获获取取高高质质量量的的信信息息,可可以以检检验验教教学学效效果果,调调节节课课程程设设置置。合合理理安安排排师师资资,正正确确评评价价教教师师的的年年度度工工作作,及及辅辅助助调调整整招招生生计计划划、分分析析预预测测就就业业趋趋势势等等

9、等。等。2021/8/147选题目的和意义选题目的和意义n以以学学生生成成绩绩为为例例,教教师师对对学学生生成成绩绩的的分分析析处处理理一一般般仅仅仅仅是是统统计计成成绩绩处处在在优优、一一般般、差差级级别别的的人人数数,对对于于学学生生取取得得这这些些成成绩绩的的原原因因往往往往无无法法了了解解。如如果果教教师师能能够够找找到到有有关关影影响响学学生生学学习习成成绩绩的的因因素素,必必然然对对教教学学质质量量的的提提高高起起到到积极的作用。积极的作用。2021/8/148国内外研究动态国内外研究动态 n自自19891989年年第第1111届届国国际际联联合合人人工工智智能能学学术术会会议议上

10、上首首次次提提出出KDDKDD这这一一概概念念以以来来,数数据据挖挖掘掘日日益益受受到到人人们们的的关关注注。并并已已经经成成为为当当前前计计算算机机领领域域的的一一大大热热点点,其其研研究究的的重重点点也也逐逐渐渐从从发发现现方方法法转转移移到到系系统统应应用用,并并且且注注重重多多种种发发现现策策略略和和技技术术的的集集成成,以以及及多多学学科科之之间间的的相相互互渗透。渗透。n从从总总体体上上,国国外外在在数数据据挖挖掘掘领领域域中中的的研研究究内内容容十十分分广广泛泛,从从挖挖掘掘知知识识的的种种类类看看,己己经经取取得了明显的成果。得了明显的成果。2021/8/149国内外研究动态国

11、内外研究动态 n1 1、关关联联规规则则的的研研究究。近近几几年年对对关关联联规规则则的的研研究究内内容容较较多多。现现在在,关关联联规规则则的的挖挖掘掘已已经经从从单单一一概概念念层层次次关关联联规规则则的的发发现现发发展展到到多多概概念念层层次次关关联联规规则则的的发发现现,并并把把研研究究的的重重点点放放在在提提高高算算法法的的效效率率和和规规模模可可收收缩缩性性上上。目目前前,人人们们对对于于定定量量关关联联规规则则以以及及其其他他种种类类的的关关联联规规则则的的发发现现研研究究较较为为深深入入,提提出出了了关关联联规规则则的的兴兴趣趣性性的的概概念念。与与此此同时,在提高挖掘过程的效

12、率方面也作了不少的研究。同时,在提高挖掘过程的效率方面也作了不少的研究。n2 2、数数据据分分类类技技术术研研究究。基基于于决决策策树树的的分分类类方方法法在在大大规规模模数数据据库库条条件件下下的的应应用用研研究究;在在较较高高的的抽抽象象层层次次分分类类中中,M MMehteMehte等等人人针针对对大大型型数数据据库库提提出出了了一一种种快快速速分分类类算算法法,称称为为QUESTQUEST中中的的超超级级学学习习算算法法,SLIQSLIQ:分分类类与与回回归归的管状领域研究、最近邻分类方法的改进等等。的管状领域研究、最近邻分类方法的改进等等。2021/8/1410国内外研究动态国内外研

13、究动态 n3 3、聚聚类类规规则则研研究究。近近年年,聚聚类类开开始始在在大大型型数数据据库库中中得得到到研研究究,R RNgNg和和1 1HanHan基基于于随随机机搜搜索索以以及及统统计计学学中中的的两两个个聚聚类类算算法法PAMPAM和和CLARACLARA,给给出出了了一一个个适适用用于于大大型型应应用用的的聚聚类类算算法法:CLARANSCLARANS。M MEsteEste等等人人针针对对CLARANSCLARANS算算法法的的缺缺点点,提提出出了了改改进进技技术术。T TZhangZhang等人则提出了另一种聚类算法:等人则提出了另一种聚类算法:BIRCHBIRCH。n4 4、泛

14、泛化化、简简约约和和特特征征提提取取研研究究。利利用用数数据据可可视视化化大大大大扩扩展展了了数数据据的的表表达达和和理理解解能能力力,这这是是数数据据简简约约的一种非常重要的技术,它正受到广泛的重视。的一种非常重要的技术,它正受到广泛的重视。2021/8/1411国内外研究动态国内外研究动态 n与与国国外外相相比比,国国内内对对数数据据挖挖掘掘与与知知识识发发现现(MDKD)(MDKD)的的研研究究稍稍晚晚,19931993年年国国家家自自然然科科学学基基金金首首次次支支持持对对该该领领域域的的研研究究项项目目。目目前前,清清华华大大学学、中中科科院院计计算算技技术术研研究究所所、空空军军第

15、第三三研研究究所所、海海军军装装备备论论证证中中心心等等竞竞相相开开展展数数据据挖挖掘掘的的基基本本理理论及其应用研究。论及其应用研究。n其其中中,北北京京系系统统工工程程研研究究所所对对模模糊糊方方法法在在知知识识发发现现中中的的应应用用进进行行了了较较深深入入的的研研究究,北北京京大大学学也也在在开开展展对对数数据据立立方方体体代代数数的的研研究究;华华中中理理工工大大学学、复复旦旦大大学学、浙浙江江大大学学、中中国国科科技技大大学学、中中科科院院数数学学研研究究所所、吉吉林林大大学学等等单单位位开开展展了了对对关关联联规规则则开开采采算算法法的的优优化化和和改改造造;南南京京大大学学、四

16、四川川联联合合大大学学山山东东师师范范大大学学硕硕士士学学位位论论文文上上海海交交通通大大学学等等单单位位探探讨讨,研究了非结构化数据的知识发现以及研究了非结构化数据的知识发现以及WebWeb数据挖掘。数据挖掘。 n数数据据挖挖掘掘最最先先应应用用于于金金融融和和商商业业领领域域,在在教教育育层层面面上上还还只只能算是新生事物,处于发展的初级阶段。能算是新生事物,处于发展的初级阶段。2021/8/1412国内外研究动态国内外研究动态 n国国内内高高校校目目前前在在校校园园信信息息网网中中开开展展数数据据挖挖掘掘的的研研究究并并不不广广泛泛。浙浙江江大大学学使使用用关关联联规规则则发发现现技技术

17、术对对高高校校的的人人事事信信息息库库进进行行挖挖掘掘,试试图图找找到到影影响响学学科科发发展展的的因因素素,发发现现如如何何评评价价一一个个学学科科,以以及及影影响响学学科科发发展展的各个要素之间的关系。的各个要素之间的关系。n在在教教育育信信息息化化的的大大趋趋势势下下,将将数数据据挖挖掘掘技技术术应应用用于于教教育育领领域域内内的的学学生生招招募募、市市场场细细分分、学学生生来来源源分分析析、课课程程相相关关性性、学学习习评评价价度度量量、学学生生生生涯涯规规划划、远远程程开开放放教教育育的的个个性性化化服服务务等等方方面面,必必然然有有十十分分广广阔阔的的前景。前景。2021/8/14

18、13研究的主要内容研究的主要内容 n本本文文主主要要研研究究在在高高校校扩扩招招、师师生生比比过过大大的的教教学学条条件件下下,教教师师如如何何利利用用丰丰富富的的信信息息资资源源,采采用用数数据据挖挖掘掘技技术术,获获得得辅辅助助决决策策知知识识,指指导导教教学学,从而进一步提高教学质量。从而进一步提高教学质量。n数数据据挖挖掘掘技技术术主主要要介介绍绍数数据据挖挖掘掘的的基基本本知知识识,包包括括数数掘掘挖挖掘掘的的过过程程、数数据据挖挖掘掘的的任任务务、数数掘掘挖挖掘掘的的分分类类以以及及数数据据挖挖掘掘的的常常用用技技术术和和方方法法。 探探索索数数据据挖挖掘掘技技术术在在高高校校教教

19、学学中中的的应应用用,提提出出数据挖掘技术在高校教学应用中的实施方案。数据挖掘技术在高校教学应用中的实施方案。 2021/8/1414实验设计方案实验设计方案 n第第一一步步,确确定定挖挖掘掘对对象象、目目标标。清清晰晰地地定定义义出出问问题题,认认清清数数据据挖挖掘掘的的目目的的是是数数据据挖挖掘掘的的重重要要一一步步。挖挖掘掘的的最最后后结结果果是是不不可可预预测测的的,但但要要探探索索的的问问题题应应是是有有预见的。预见的。n第第二二步步,数数据据采采集集。这这是是一一个个工工作作量量较较大大,占占据据时时问问较较多多的的一一个个阶阶段段。教教师师需需要要在在以以往往的的教教学学实实践践

20、中中,注注意意收收集集数数据据信信息息,有有些些数数据据的的产产生生可可以以直直接接获获得得,有些数据需要对学生进行调查获得。有些数据需要对学生进行调查获得。n第第三三步步,数数据据转转换换。这这一一步步是是将将教教师师收收集集到到的的不不同同的的数数据据信信息息集集成成并并转转换换为为一一个个分分析析数数据据模模型型,这这一一数数掘掘模模型型是是针针对对算算法法而而准准备备的的不不同同的的算算法法可可能能需需要不同的分析数据模型。要不同的分析数据模型。2021/8/1415实验设计方案实验设计方案 n第第四四步步,数数据据分分类类挖挖掘掘。分分类类挖挖掘掘的的目目的的是是为为了了建建立立一一

21、个个分分类类模模型型。首首先先要要选选择择合合适适的的挖挖掘掘算算法法,并并使使用用合合适适的的程程序序设设计计软软件件实实现现这这一一算算法法:接接着着对对所所得到的经过转换的数据进行挖掘。得到的经过转换的数据进行挖掘。n第第五五步步,分分类类规规则则结结果果分分析析。这这一一步步主主要要解解释释和和评评估分类结果。估分类结果。n第第六六步步。知知识识的的应应用用。这这一一步步是是将将分分析析所所得得到到的的知知识识集集成成到到教教师师的的教教学学环环节节中中去去,教教师师可可利利用用所所得得知知识改进教学策略,指导下一步教学。识改进教学策略,指导下一步教学。 2021/8/1416准备工作

22、情况和主要工作措施准备工作情况和主要工作措施 n利利用用学学院院的的教教务务管管理理系系统统,获获得得学学生生的的成成绩绩信信息息。设设计计学学生生信信息息调调查查表表,由由学学生生填填写写,内内容容包包括括学学生生对对计计算算机机公公共共基基础础课课程程的的感感兴兴趣趣程程度度、课课堂堂学学习习效效果果、对对本本课课程程的的认认识识和和教师的教学方法等。教师的教学方法等。n利利用用数数据据挖挖掘掘算算法法对对数数据据进进行行处处理理,建建立立决决策树,得出推动计算机课程教学的规则。策树,得出推动计算机课程教学的规则。 2021/8/1417论文进度安排及预期达到研究结果论文进度安排及预期达到

23、研究结果 n2010.4-2010.9 2010.4-2010.9 资料查询、确定论文主题资料查询、确定论文主题n2010.9-2010.11 2010.9-2010.11 数据挖掘的理论研究数据挖掘的理论研究n2010.11-2010.122010.11-2010.12数据挖掘的应用研究数据挖掘的应用研究n2011.1-2011.3 2011.1-2011.3 撰写论文撰写论文n2011.4-2011.5 2011.4-2011.5 论文修改论文修改2021/8/1418谢谢!谢谢!请老师和同学们批评指正请老师和同学们批评指正2021/8/1419部分资料从网络收集整理而来,供大家参考,感谢您的关注!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号