数据库应用技术(1)

上传人:m**** 文档编号:544481727 上传时间:2023-10-25 格式:DOCX 页数:3 大小:14.26KB
返回 下载 相关 举报
数据库应用技术(1)_第1页
第1页 / 共3页
数据库应用技术(1)_第2页
第2页 / 共3页
数据库应用技术(1)_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据库应用技术(1)》由会员分享,可在线阅读,更多相关《数据库应用技术(1)(3页珍藏版)》请在金锄头文库上搜索。

1、数据库应用技术(数据仓库与数据挖掘复习提纲)说明:考试形式:闭卷 考试题型:填空、选择、判断、名词解释、简答题、综合题。(由于试题是 随机从试题库中抽取,有可能抽取的试题中不会全部包含上述的所有题型)另外:本提纲仅针对试题中的名词解释、简答题和综合题提供复习参考,不 包括填空、选择、判断等其它题型的参考。一:名词解释数据仓库、数据挖掘、OLAP、ODS (操作数据存储)、商业智能二简答题1试述数据仓库系统与数据库系统的区别与相似之处。2试述数据仓库设计的步骤以及每一步所完成的工作。3OLAP 与 OLTP 的区别有哪些?它们适合于运行在同一个服务器上吗?为什 么?4在数据挖掘前,为什么要对数据

2、进行预处理,数据预处理的有哪些主要的处 理方法?5在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题 的各种方法。6.对于类特征化,基于数据立方体的实现与诸如面向属性归纳的关系实现之间的 主要不同是什么?讨论哪种方法最有效,在什么条件下最有效。7数据仓库和数据集市的区别是什么?数据仓库的体系环境具有什么特点?有 哪些建立数据仓库体系化环境的方法?它们各有何优劣?8. 为了提高数据仓库的性能,可以在哪些方面作一些努力?在各个方面分别采 用什么样的技术?这些技术易于实现吗?9. 数据仓库中的数据是数据库中数据的简单堆积吗?它有哪些常用的数据组织 方式?10. 一般来说,数据仓库采用

3、什么样的数据模型?与OLTP的数据库模型相比, 这些模型有什么特点?11. 数据仓库的设计包括哪些内容?12. 在内容和使用者方面,数据仓库环境中的元数据与操作型环境中的元数据有 何异同?13. 请解释OLAP中维、维层次与维成员的概念,并举例说明。14.OLAP提供哪些基本操作?15.OLAP服务器有哪些实现方法?它们的优劣是什么?16. 为什么不能依靠传统的业务处理系统进行决策分析?17. 自然演化体系结构中存在的问题?18. 试述建立多维数据仓库的过程。 19数据挖掘的主要方法。20. 数据挖掘中的数据分类是个两步的过程,简述每步过程。21. 试述商业智能系统的演化过程。22. 操作数据

4、存储与 DW 的区别?23.操作数据存储的作用?24.ODS 在 DBODSDW 三层体系结构中的作用是什么?25.概念分层最常用的两种类型是什么?26.试述维层次和类的概念有什么不同?三综合题 第一类:给定一个表的结构及数据,计算每个决策属性的信息增益(请同学们 掌握该方法,不同的试题中给定的表结构及数据是不同的)例一:假设有如下的“雇员基本信息”表的结构及数据,其中属性“工资”为类 别标识属性,属性“部门”、“职位”、“年龄”作为决策属性集,请计算每个决策 属性“部门”、“职位”、“年龄”的信息增益。部门*职位*年龄*工资销售部高级314041K55K C2销售部初级213026K40K

5、C3销售部初级314026K40K C3系统部初级213041K55K C2系统部高级314056K70K C1系统部初级213041K55K C2系统部高级415056K70K C1市场部高级314041K55K C2市场部初级314041K55K C2秘书处高级415026K40K C3秘书处初级213026K40K C3第二类:利用Apriori算法寻找事务集中的频繁项集,并由找到的频繁项集产生强关联规则。(请同学们掌握该方法,不同的试题中给定的事务集是不同的) 例一:假设现有如下表所示的一个事务数据库,数据库中有10个事务,即IDI=10。 假定最小支持度minsup=20%,最小置信

6、度minsup=65%,利用Apriori算法寻找D 中的频繁项集,并由找到的频繁项集产生强关联规则。TID项列表T11,2,5T21,2T32,4T41,2,4T51,3T61, 2, 3, 5T71,2,3T82,5T92,3,4T103,4第三类:利用简单贝叶斯分类对数据进行分类(请同学们掌握该方法,不同的试题中给定的表结构及数据是不同的)例一:假设有如下的“雇员基本信息”表的结构及数据,其中属性“工资”为类 别标识属性,类别标识有3个取值(Cl、C2、C3),属性“部门” “职位”、“年 龄”作为决策属性集,请利用贝叶斯简单分类方法对未知数据:X=(部门=系统部职位=高级年龄=2130)进行分类。部门*职位*年龄*工资销售部高级314041K55K C2销售部初级213026K40K C3销售部初级314026K40K C3系统部初级213041K55K C2系统部高级314056K70K C1系统部初级213041K55K C2系统部高级415056K70K C1市场部高级314041K55K C2市场部初级314041K55K C2秘书处高级415026K40K C3秘书处初级213026K40K C3

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号