数据仓库与数据挖掘考试试题

上传人:飞*** 文档编号:31189656 上传时间:2018-02-05 格式:DOC 页数:4 大小:35KB
返回 下载 相关 举报
数据仓库与数据挖掘考试试题_第1页
第1页 / 共4页
数据仓库与数据挖掘考试试题_第2页
第2页 / 共4页
数据仓库与数据挖掘考试试题_第3页
第3页 / 共4页
数据仓库与数据挖掘考试试题_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据仓库与数据挖掘考试试题》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘考试试题(4页珍藏版)》请在金锄头文库上搜索。

1、中国矿业大学银川学院期末考试试题2010 至 2011 学年第 2 学期考试科目 数据仓库与数据挖掘 学分 2 年级 2008 系 机电动力与信息工程系 专业 计算机 一、 填空题(15 分)1.数据仓库的特点分别是 、 、 、反映历史变化。2.元数据是描述数据仓库内数据的结构和建立方法的数据。根据元数据用途的不同可将元数据分为 元数据和 元数据两类。3.OLAP 技术多维分析过程中,多维分析操作包括 、 、 、 等。4.基于依赖型数据集市和操作型数据存储的数据仓库体系结构常常被称为“ ”架构,其中 是中心,源数据系统和数据集市在输入和输出范围的两端。5.ODS 实际上是一个集成的、 、 、

2、、详细的数据库,也叫运营数据存储。二、 多项选择题(10 分)6.在数据挖掘的分析方法中,直接数据挖掘包括( )A 分类 B 关联 C 估值 D 预言7.数据仓库的数据 ETL 过程中,ETL 软件的主要功能包括( )A 数据抽取 B 数据转换 C 数据加载 D 数据稽核8.数据分类的评价准则包括( )A 精确度 B 查全率和查准率 C F-Measure D 几何均值9.层次聚类方法包括( )A 划分聚类方法 B 凝聚型层次聚类方法 C 分解型层次聚类方法 D 基于密度聚类方法10.贝叶斯网络由两部分组成,分别是( )A 网络结构 B 先验概率 C 后验概率 D 条件概率表三、 计算题(30

3、 分)11.一个食品连锁店每周的事务记录如下表所示,其中每一条事务表示在一项收款机业务中卖出的项目,假定supmin=20%,conf min=40%,使用 Apriori 算法计算生成的关联规则,标明每趟数据库扫描时的候选集和大项目集。 (15 分)事务 项目 事务 项目 T1T2 T3面包、果冻、花生酱面包、花生酱面包、牛奶、花生酱T4T5啤酒、面包啤酒、牛奶12.给定以下数据集(2 ,4,10,12,15,3,21,11,18,25,30) ,进行 K-Means 聚类,设定聚类数为 2 个,相似度按照欧式距离计算。(15 分)四设计题(45 分)13.按照题目给定的 3 个数据文件,任选一个建立数据流图,要求至少包括记录选项、字段选项、图形结点各一个。任选关联规则Apriori 算法、贝叶斯网络、K-Means 聚类、决策树 C5.0(C4.5)算法、神经网络中的一个进行挖掘,并给出数据流图。 (10 分)14.对以上数据流图中使用的每个结点做一简短说明。 (10 分)15.给出以上数据流图中模型的执行结果(生成模型完全展开后的数据) ,对于执行结果太多的,可节选部分结果。 (10 分)16.对以上模型生成的结果做一简要的分析,包括算法采用的基本原理、数学模型、算法步骤等。(15 分)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号