《决策支持及商务智能》课程实验指导书

上传人:第*** 文档编号:61908820 上传时间:2018-12-14 格式:DOCX 页数:12 大小:26.03KB
返回 下载 相关 举报
《决策支持及商务智能》课程实验指导书_第1页
第1页 / 共12页
《决策支持及商务智能》课程实验指导书_第2页
第2页 / 共12页
《决策支持及商务智能》课程实验指导书_第3页
第3页 / 共12页
《决策支持及商务智能》课程实验指导书_第4页
第4页 / 共12页
《决策支持及商务智能》课程实验指导书_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《《决策支持及商务智能》课程实验指导书》由会员分享,可在线阅读,更多相关《《决策支持及商务智能》课程实验指导书(12页珍藏版)》请在金锄头文库上搜索。

1、决策支持与商务智能课程实验指导书实验学时:课内实验16学时、课外实践0学时实验类型:综合性实验要求:必修适用对象:信息管理与信息系统、计算机科学与技术、软件工程实验一:熟悉Python语法和掌握数据特征及相似性度量方法,2学时一、实验目的1. 熟悉Python基本语法和常用函数;2. 熟悉Numpy、Scipy、Matplotlib、Pandas等常用技术包;3. 学会使用WinPython开发平台;4. 熟练掌握数据统计特征的分析方法,五树概况,中位数、均值、众数等。5. 熟练使用常用数据相似性度量方法,例如,曼哈顿距离、欧式距离、闵考斯福基距离、余弦等。二、实验内容1. 数据统计特征的分析

2、方法,五树概况,中位数、均值、众数等。2. 数据之间相似性度量方法,包括曼哈顿距离、欧式距离、闵考斯福基距离、余弦。三、实验原理、方法和手段1. 实验原理:l WinPython开发平台是目前Python源程序开发中比较重要的工具,使用它基本上可以完成数据分析所有的操作,如关联规则分析、分类分析、聚类分析等。l 数据统计特征是数据分析的基础。l 数据之间的相似性是许多数据分析任务常用的技巧,如聚类分析中簇之间聚类的度量。2. 方法与手段:先由教师讲解并演示,然后学生根据实验报告进行实验。四、实验环境、条件若干台装有WinPython开发平台的计算机。五、实验组织运行要求本实验是演示性+综合性实

3、验,采用集中授课形式组织教学,先由教师讲解并演示,然后学生根据实验报告进行实验。六、实验步骤1. 随机生成长度为奇数或者偶数长度的整数序列,编程求出五数概况、中位数、均值、众数;2. 给定my_list1 = 5, 0, 3, 0, 2, 0, 0, 2, 0, 0,my_list2 = 3, 0, 2, 0, 1, 1, 0, 1, 0, 1,分别利用哈顿距离、欧式距离、闵考斯福基距离、余弦计算二者之间的相似性。七、实验报告河南财经政法大学计算机与信息工程学院实验报告实验项目名称熟悉Python语法和掌握数据特征及相似性度量方法 课程名称 决策支持与商务智能 成绩评定 实验类型:验证型综合型

4、设计型 实验日期 指导教师 学生姓名 学号 专业班级 一、实验项目训练方案小组合作:是 否小组成员:实验目的:1. 熟悉Python基本语法和常用函数;2. 熟悉Numpy、Scipy、Matplotlib、Pandas等常用技术包;3. 学会使用WinPython开发平台;4. 熟练掌握数据统计特征的分析方法,五树概况,中位数、均值、众数等;5. 熟练使用常用数据相似性度量方法,例如,曼哈顿距离、欧式距离、闵考斯福基距离、余弦等。实验场地及仪器、设备和材料:若干台装有WinPython开发平台的计算机。实验训练内容(包括实验原理和操作步骤):1. 实验原理:WinPython开发平台是目前P

5、ython源程序开发中比较重要的工具,使用它基本上可以完成数据分析所有的操作,如关联规则分析、分类分析、聚类分析等;数据统计特征是数据分析的基础;数据之间的相似性是许多数据分析任务常用的技巧,如聚类分析中簇之间聚类的度量。数据统计特征的分析方法,五树概况,中位数、均值、众数等;数据之间相似性度量方法,包括曼哈顿距离、欧式距离、闵考斯福基距离、余弦2. 实验步骤:(1)随机生成长度为奇数或者偶数长度的整数序列,编程求出五数概况、中位数、均值、众数;(2)给定my_list1 = 5, 0, 3, 0, 2, 0, 0, 2, 0, 0,my_list2 = 3, 0, 2, 0, 1, 1, 0

6、, 1, 0, 1,分别利用哈顿距离、欧式距离、闵考斯福基距离、余弦计算二者之间的相似性。二、实验总结与评价实验总结(包括实验数据分析、实验结果、实验过程中出现的问题及解决方法等):(如留存空白不足,可附A4纸)对实验的自我评价:指导教师评语:实验成绩评定: 指导教师(签名): 日期: 年 月 日实验二:频繁模式与关联规则挖掘,6学时一、实验目的1. 了解关联规则、频繁模式、支持度、可信度的基本原理和计算方法;2. 熟练掌握频繁模式挖掘算法;3. 熟练使用Python编写APRIORI、FP-Growth以及基于APRIORI的提升算法;4. 学会利用频繁模式生成关联规则。二、实验内容1. 频

7、繁模式挖掘算法APRIORI及其提升算法的实现。三、实验原理、方法和手段1. 实验原理:利用候选集之间的连接与剪枝操作生成频繁模式、利用抽样与散列技术提升挖掘效率。2. 方法与手段:先由教师讲解并演示,然后学生根据实验报告进行实验。四、实验环境、条件若干台装有WinPython开发平台的计算机。五、实验组织运行要求本实验是综合性实验,采用集中授课形式组织教学,先由教师讲解并演示,然后学生根据实验报告进行实验。六、实验步骤1. 给定亚马逊销售数据集retail.txt,最小支持度参数min_sup=0.5,最小可信度min_con=0.5。2. 利用APRIORI算法寻找retail数据集中所有

8、的频繁模式,寻找出top-100的频繁模式。根据得到的频繁模式寻找出所有满足条件的关联规则。3. 利用抽样技术来提高APRIORI算法的效率,减少数据库的扫描遍数。具体操作要求:选取retail数据集中的一个样本,使用Apriori 算法在样本中挖掘频繁模式。扫描一次数据库, 验证在样本中发现的频繁模式。4. 利用散列技术提高APRIORI算法的效率,进而压缩存储空间。散列项集到对应的桶中,一个其hash桶的计数小于阈值的k-itemset不可能是频繁的。具体操作要求:首先利用APRIORI算法生成频繁1-项集,基于频繁1-项集产生候选2-项集。然后,设计合理的hash函数(或者直接利用MD5

9、实现hash效果),把候选2-项集压缩到相应的hash桶中。再根据min-sup=0.5寻找频繁2-项集。根据上述过程,寻找出所有频繁项集和关联规则。七、实验报告河南财经政法大学计算机与信息工程学院实验报告实验项目名称 频繁模式与关联规则挖掘 课程名称 决策支持与商务智能 成绩评定 实验类型:验证型综合型设计型 实验日期 指导教师 学生姓名 学号 专业班级 一、实验项目训练方案小组合作:是 否小组成员:实验目的:1. 了解关联规则、频繁模式、支持度、可信度的基本原理和计算方法;2. 熟练掌握频繁模式挖掘算法;3. 熟练使用Python编写APRIORI、FP-Growth以及基于APRIORI

10、的提升算法;4. 学会利用频繁模式生成关联规则。实验场地及仪器、设备和材料:若干台装有WinPython开发平台的计算机。实验训练内容(包括实验原理和操作步骤):1. 实验原理:利用候选集之间的连接与剪枝操作生成频繁模式、利用抽样与散列技术提升挖掘效率。2. 实验步骤(1)给定亚马逊销售数据集retail.txt,最小支持度参数min_sup=0.5,最小可信度min_con=0.5;(2)利用APRIORI算法寻找retail数据集中所有的频繁模式,寻找出top-100的频繁模式。根据得到的频繁模式寻找出所有满足条件的关联规则,给出相应的核心代码和实验结果截屏;(3)利用抽样技术来提高APR

11、IORI算法的效率,减少数据库的扫描遍数。具体操作要求:选取retail数据集中的一个样本,使用Apriori 算法在样本中挖掘频繁模式。扫描一次数据库,验证在样本中发现的频繁模式,给出相应的核心代码和实验结果截屏;(4)利用散列技术提高APRIORI算法的效率,进而压缩存储空间。散列项集到对应的桶中,一个其hash桶的计数小于阈值的k-itemset不可能是频繁的。具体操作要求:首先利用APRIORI算法生成频繁1-项集,基于频繁1-项集产生候选2-项集。然后,设计合理的hash函数(或者直接利用MD5实现hash效果),把候选2-项集压缩到相应的hash桶中。再根据min-sup=0.5寻

12、找频繁2-项集。根据上述过程,寻找出所有频繁项集和关联规则,给出相应的核心代码和实验结果截屏。二、实验总结与评价实验总结(包括实验数据分析、实验结果、实验过程中出现的问题及解决方法等):(如留存空白不足,可附A4纸)对实验的自我评价:指导教师评语:实验成绩评定: 指导教师(签名): 日期: 年 月 日实验三:分类算法实现,4学时一、实验目的1. 了解ID3、C4.5、朴实贝叶斯、SVM等常用分类算法的核心思想;2. 熟练掌握ID3、C4.5以及算法朴实贝叶斯分类算法;3. 熟练掌握sklearn工具包的应用技巧4. 熟练使用Python编写ID3与朴实贝叶斯分类算法;二、实验内容1. ID3与

13、朴实贝叶斯分类算法的实现。三、实验原理、方法和手段1. 实验原理:利用信息论中的信息熵、信息增益、信息增益率来度量ID3算法的分割结点;利用贝叶斯定理实现朴实贝叶斯分类算法中类别的判断。2. 方法与手段:先由教师讲解并演示,然后学生根据实验报告进行实验。四、实验环境、条件若干台装有WinPython开发平台的计算机。五、实验组织运行要求本实验是综合性实验,采用集中授课形式组织教学,先由教师讲解并演示,然后学生根据实验报告进行实验。六、实验步骤1. 给定一个训练集Training-data.txt,构建ID3(构建决策树时,采用信息增益分裂相应结点)和朴实贝叶斯分类器,并对如下测试用例作出推断:(1)X1 = (age =30, Income = medium, Student = yes, Credit_rating = Fair)(2)X2 = (30= age 40, Income = medium, Student = no, Credit_rating = Fair)2. 给出相应的核心代码和实验结果截屏。七、实验报告河南财经政法大学计算机与信息工程学院实验报告实验项目名称 分类算法实现 课程名称 决策支持与商务智能 成绩评定 实验类型:验证型综合型设计型 实验日期 指导教师 学生姓名 学号 专业班级 一

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号