数据仓库与数据挖掘课程设计高校选修课关联分析

上传人:206****923 文档编号:40527222 上传时间:2018-05-26 格式:DOC 页数:12 大小:299.50KB
返回 下载 相关 举报
数据仓库与数据挖掘课程设计高校选修课关联分析_第1页
第1页 / 共12页
数据仓库与数据挖掘课程设计高校选修课关联分析_第2页
第2页 / 共12页
数据仓库与数据挖掘课程设计高校选修课关联分析_第3页
第3页 / 共12页
数据仓库与数据挖掘课程设计高校选修课关联分析_第4页
第4页 / 共12页
数据仓库与数据挖掘课程设计高校选修课关联分析_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《数据仓库与数据挖掘课程设计高校选修课关联分析》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘课程设计高校选修课关联分析(12页珍藏版)》请在金锄头文库上搜索。

1、数据仓库与数据挖掘数据仓库与数据挖掘课程设计报告课程设计报告班班 级:级: 信管 091 学学 号:号: 3090561012 姓姓 名:名: 李国祥 指导教师:指导教师: 王建仁/段刚龙 日日 期:期: 2011.12 高校选修课关联分析1 1 需求分析与数据理解需求分析与数据理解1.11.1 需求分析需求分析在当前的大学教育中,教育体制正趋向于人性化与科学化,越来越多的高校都采取学分制作为最主要的教学方式,为学生们开设了各种选修课供不同专业的学生选择。学生在选修课程时,根据其自身的兴趣爱好及专业要求,也有不同的选择,且在选择课程时,对一些相关的课程表现出关联性,本次高校选修课关联分析利用数

2、据挖掘技术,通过分析学生选课时的关联性,希望从学生的选课信息中找出选修热度高的课程,并提取出关联规则,找出相关程度高的课程,以供高校在为学生安排选修课时做出决策支持。1.21.2 数据理解数据理解本次关联分析主要需要的信息为学生的选课信息,即每个学生所选择的课程。通过从选课信息中提取频繁项集与关联规则,得出结果。2 2 挖掘数据准备挖掘数据准备本次分析主要采用西安理工大学经济与管理学院部分学生的选修课结果为源数据,且选取具有代表性的数据,在此数据的基础上分析关联规则。需要挖掘的数据为选课信息,主要涉及到两个表目。学生信息:学号,姓名,班级,学院(主键为:学号)选课信息:学号,课程,任课教师,上

3、课时间(主键为:学号、课程,外键学号参照学生信息表的学号项)主要数据如下:3 3 数据挖掘过程数据挖掘过程 3.13.1 挖掘算法与挖掘软件选择挖掘算法与挖掘软件选择数据挖掘所采用的软件为 Microsoft SQL Server Business Intelligence Development Studio。采用的算法为 Microsoft 关联规则算法。该算法生成的规则描述哪些项最有可能在事务中出现在一起。借助这些规则,可以根据其他项在事务中的出现情况,来预测某一项的出现情况。3.23.2 数据预处理数据预处理数据与处理的最主要工作为属性值的统一,使表之间相关联的属性的数据类型一致,满足

4、以下约束:3.33.3 挖掘过程说明挖掘过程说明(1)在 Microsoft SQL Server Business Intelligence Development Studio中创建一个名称为“选修课关联分析”的项目,并定义数据源、定义数据源视图。(2)在已定义的数据源视图基础上,创建“选修课关联分析”关联挖掘结构。并选择挖掘技术为 Microsoft 关联规则算法。(3)设置数据挖掘向导中的指定项。指定事例表为学生信息,嵌套表为选课信息,以及定型数据。(4)完成挖掘结构的建立。并部署选修课关联分析项目。4 4 结果展示与评价结果展示与评价(1)设置算法参数。将项集中允许的最大项数设为 1

5、,同时指定包含该项集的最小事例数为 3,查看单项课程中,选修率比较高的课程。结果显示,以上课程被选修的热度比较高,对于这些课程,学校在作出决策时可以考虑适当地增加开班数目,以尽可能的满足更多学生的需求。(2)调整最小项集为 2,提取出所有的相关课程。(2)调整最低支持度为 2,从上面已抽取的相关课程项集中,提取出频繁项集,已找出同时被选修可能性大的课程。结果显示,以上课程被同时选修的概率较大,学校在安排选修课时,可以考虑将这些相关课程的上课时间错开处理,这样可以让学生们根据其需要同时选修,减少学生选课时的冲突现象。比如将“经济法”与“物流经济学”上课时间错开。(3)查看所有具有关联性的课程的置

6、信度及其概率。(4)在上一步的基础上,调整置信度为 0.68,查看关联规则比较大的项集。结果显示,以上课程具有比较大的关联度,学校在作出决策时,需考虑它们的关联性,在开设某一门选修课之前,先开设其基础课程,以便于学生打好基础。比如在开设“高级财务会计”之前,先开设“初级财务会计”课程。(5)调整置信度为 100%,查看结果。该结果表明“JAVA 程序设计”与“网站开发与管理”这两门课具有绝对的关联性,这时学校可以考虑将两门课程合并为一门课程,以便于学生更好地掌握课程所要教授的技术。(6)查看依赖关系网络。在依赖关系网络图中,通过选择某一个节点,可以查看其双向预测节点、预测它的节点以及该节点所预

7、测的节点,利用网络图的形式可以更明确地查看课程之间的规则及依赖关系。比如:选定国际贸易课程时,可以看到世界经济概论与贸易英语是预测它的节点,这就为学校做出选修课安排决策时提供了明了的参考信息,根据关系做出合理的时间安排,即课程的“先开与后开”问题。5 5 总结总结5.15.1 设计中遇到的主要问题及解决方法设计中遇到的主要问题及解决方法(1)在设计学生信息管理,来访登记和新生注册界面时,如果每建一个控件都分别设置使其与需要数据表的字段绑定,太过繁杂。可以在表单处先单击鼠标右键,在弹出选项中选择数据环境,然后添加需要的数据库和表,拖放表中相应的字段在表单上释放鼠标,即可在表单上得到与数据表绑定的

8、各个控件。在表单运行时,对记录的修改将直接使绑定数据表的相关信息发生变化。(2)在建立多表查询的时候,代码比较复杂,自己编写代码往往一个小小的标点会使程序不能运行。可以通过建立本地视图,对需要的多个表建立关联,然后选择需要的字段,填写筛选条件。运行视图,结果符合需求时,查看 VF 自动生成的视图代码,对其稍加修改就可以作为查询的代码(3)在解决多表查询问题时,将需要的字段生成虚拟表,将其设置为表单GRID 控件的数据源即可。5.25.2 设计方案的主要优点及不足设计方案的主要优点及不足5.35.3 收获及建议收获及建议这次的实验要回顾上学期的数据库的相关知识,因此我们在学习中要不断回顾过去学过的内容,温故而知新。实验时首先要建库,先建立一个超市购物的数据集市,才能进行分析,建库的时候一定要注意主键约束,还有事实表与维表之间的关系。建好库之后根据步骤一步不进行挖掘得到最终结果。参考文献参考文献参照下面格式写:1 陈志泊等数据仓库与数据挖掘北京:清华大学出版社,20092 朱德利SQL Server2005 数据仓库与商业智能完全解决方案北京:电子工业出版社,2007

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号