数据仓库与数据挖掘(串讲)

上传人:清晨86****784 文档编号:185460705 上传时间:2021-07-08 格式:DOC 页数:1 大小:51KB
返回 下载 相关 举报
数据仓库与数据挖掘(串讲)_第1页
第1页 / 共1页
亲,该文档总共1页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据仓库与数据挖掘(串讲)》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘(串讲)(1页珍藏版)》请在金锄头文库上搜索。

1、数据仓库与数据挖掘1以下不属于数据仓库基本操作的是( B )。A基本聚集函数 B查询操作C立方体操作 D上卷和下探操作2以下对OLAP体系结构描述正确的是( B )。A二层C/S结构 B三层C/S结构C四层C/S结构 D不属于C/S结构3以下属于数据仓库基本数据模式的是( C )。A集中模式 B分散模式C星型模式 D分层模式4OLAP的数据组织模式包括( AB )。AMD-OLAP的综合数据组织模式BROLAP的综合数据组织模式CDOLAP的综合数据组织模式DSM-OLAP的综合数据组织模式5以下属于OLAP实现的关键技术的有( ABCD )。A实视图及其维护 B立方体计算C查询优化与并行处理

2、 D数据集成6以下属于数据仓库基本操作的是( ABCD )。A基本聚集函数 B查询操作C立方体操作 D上卷和下探操作7传统数据库的主要任务是进行事务处理,而在数据的分析处理方面,则存在着诸的不足,下面哪些是传统数据库的不足( ABC )。A集成性的缺乏 B主题不明确C分析处理效率低 D数据处理复杂8下面那些是数据集市的类型( AB )。A独立型数据集市 B从属型数据集市(Dependent Data Mart)C功能型数据集市 D分析型数据集市9数据仓库在逻辑上可以分为三个层次,以下属于这三个层次的是( ABC )。A数据获取管理层 B数据存储层C数据分析应用层 D数据抽取层10数据仓库中保存

3、的业务数据内容来自多个数据源,以保证系统的正常运行,这些都是数据获取管理层所应完成的任务。归纳起来,该层主要负责以下工作( ACD )。A数据仓库的定义与修改 B数据整理C数据仓库系统的管理 D数据的获取11数仓库系统的数据分析应用层,面向系统的一般用户,满足用户的查询需要,并以适当方式向用户展示查询、分析的结果。数据分析应用层的主要包括以下功能( ACD )。A查询统计服务 B数据分析服务COLAP服务 D数据挖掘服务12构造一个完善的数据仓库,是一个十分复杂的过程。一般而言,数据仓库的构造模式包括( ABCD )。A自顶向下模式 B自底向上模式C平行开发模式 D改进的开发模式13数据仓库是

4、面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理层的决策过程,那么数据仓库的重要特点是( ABCD )。A面向主题 B数据的集成性C数据的非易失性 D数据的时变性14数据分割的依据和粒度,应随数据仓库所在行的特点而变。常用的分割依据包括( ABCD )A发生时间 B地理位置C量单位 D数据额度15数据仓库中的数据组织形式包括( BCD )A顺序文件B简单直接文件C连续文件D定期综合文件16在数据仓库开发过程中需要使用的模型包括( ABC )A概念模型(Concept Model) B逻辑模型(Logical Model)C物理模型(Physical Model) D机器模型(C

5、omputer Model)17为了将用E-R图描述的企业模型方便地映射为数据仓库的数据模型,可以采取措施对传统的E-R图方法进行改进,即引入以下概念( ACD )。A事实实体(Fact Entity) B数据实体(Data Entity)C维度实体(Dimension Entity) D引用实体(Quotation Entity)18建立起企业模型之后,必须实现从企业模型到概念数据模型的映射,从而为构建数据仓库的逻辑模型做好准备。目前,常用的概念数据模型有以下( ACD )。A星形模型 B树状模型C雪花模型 D事实星座模型19数据仓库的物理模型设计,必须依据以下要点进行。物理模型设计的主要内

6、容,包括以下哪几个方面( ABCD )A数据存储结构的确定。B索引策略的确定。 C数据存放位置的确定。D存储分配参数的确定。20事实表是星形模型的核心,其内容可以分为( AC )A键 B关系C详细指标 D维度21表的存储空间,除了数据存储空间外,还包含索引存储空间。22数据挖掘可以针对任何类型的数据库进行,既包括传统的关系数据库,也包括非数据库组织的文本数据源、Web数据源以及复杂的多媒体数据源等1关系数据库2数据仓库3文本数据库4.复杂类型数据库23元数据按其所描述的内容,可以分为三类。(1)关于基本数据的元数据。(2)关于数据处理的元数据。(3)关于企业组织的元数据。24根据用户对数据仓库

7、的认识和使用目的,从用户的角度分类可将数据仓库划分为两大类( )。(1)技术元数据(Technical Metadata)。(2)业务元数据(Business Metadata)。25元数据定义了数据从被抽取,到清洗、转换,再到导入数据仓库的全部过程。元数据在数据抽取转换中的作用如下。 (1)确定数据的来源。 (2)保证数据仓库内容的质量。 (3)实现属性间的映射与转换。26元数据的收集的方法有哪些( )。 (1)数据源中元数据的收集。 (2)数据模型中元数据的收集。 (3)映射关系元数据的收集。 (4)数据仓库应用元数据的收集。27按使用目的的不同,数据仓库的使用者可分为开发人员、维护人员和

8、最终用户三类28时间维在几乎所有的MDDB或数据仓库中,都是最要的一个维,使用最为普遍。时间维有以下两个特点。(1)周期特征。时间维中包含许多周期(时间单位),如日、周、月、季、年等。这些周期之间,存在着固定的转换规则。 (2)行业特征。不同的行业,其工作日各有特点。一般是每周5个工作日,但也有许例外,如交通运输、零售等行业全年无休息日。 29数据挖掘项目是一项系统工程,它作为从数据库中自动发现知识的过程,仍然需要来自不同领域专家共同参与知识发现的全部过程。其中,发挥着主要作用的专家包括主题领域专家、数据专家、数据分析专家和数据挖掘专家30数值型数据概念分层的方法主要有分箱、聚类分析、基于熵的

9、离散化。31数据泛化的方法很多,较为常用和有效的方法有数据立方体、面向属性的归纳等方法。32从不同的角度考察,关联规则有多种分类。(1)根据项对应属性的数据类型,关联规则可以分为布尔型和数值型。(2)根据规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。(3)根据规则中涉及到的数据的维数,关联规则可以分为单维的和多维的。(4)关联并不一定意味着相关或因果,有时需要识别不同的项是否相关,是否存在因果关系。根据关联规则的各种扩展,可分为相关分析、最大模式和频繁闭项集、添加约束等类型。33多层、多维的数量型关联规则是前三种规则的复合体,挖掘的难度比较大。最简单的关联规则是单维、单层的布尔关联

10、规则。34对于给定的任务相关的数据集,使用数据库挖掘可以从中挖掘出大量的规则。在这些规则中,有许多对用户并没有什么意义。为了尽可能使挖掘出来的规则有意义,可以使挖掘过程在用户提供的各种约束的指导下进行。这就是基于约束的数据库挖掘。在数据库挖掘中经常使用下列几种约束。(1)知识类型约束。(2)数据约束。(3)维或层次约束。(4)兴趣度约束。(5)规则约束。35规则约束可以分为反单调的、单调的、简洁的、可转变的和不可转变的五种类型。36分类是数据挖掘的基本功能之一,它的目标是从数据集中提取出能够描述数据类基本特征的模型,并利用这些模型把数据集中的每个对象都归入到其中某个已知的数据类中。分类方法可分

11、为有监督(也称指导)学习和无监督学习两种。通常,人们所说的分类专指有监督学习的分类,而无监督学习的分类被称为聚类。本37聚类分析的数据源可以分为两种类型,即结构化的数据和非结构化的数据。38Web挖掘过程的主要步骤与数据挖掘相同,不同之处在于处理对象和采用的技术方法等。数据取样的过程有哪些( )AWeb数据采样。AWeb数据分析。AWeb数据调整。Web数据转换39数据预处理就是将来自不同数据源的各类数据,组织成为模式挖掘所必需的数据结构。数据预处理的过程有哪些( )(1)数据清洗。(2)数据集成。(3)数据转换。(4)数据约简。40自动摘录方法的突出优点是不受领域的限制。自动摘录方法的不足之

12、处在于(1)文章的书写是否规范对摘录效果的影响很大。(2)主题析出难以全面。(3)易产生冗余句。(4)缺乏连贯。数据仓库和数据库有何不同?它们有那些相似之处?数据仓库与传统数据库的关系数据抽取数据清洗元数据数据仓库中数据的非易失性粒度模型粒度数据单元多维数组维成员维维的层次维表事实表空间数据库时序数据库关联分析分类数据挖掘中分类和回归的不同聚类数据挖掘中聚类与分类分析方法的不同信息摘要信息抽取元数据挖掘数据立方体聚类事实表是星形模型的核心,其内容可以分为那些部分?作用是什么?元数据的收集的作用项项集事务对于建立企业模型而言,E-R图法具有简便直观的优点,而且在建立传统数据库时,也往往采用这一方法构造数据库。但E-R图法很难直接用于开发数据仓库,这是因为该方法存在着不足。目前采用的解决方法是什么?数据仓库的反规范化处理的意义?逻辑模型中,包括4种基本的结构元素。说明逻辑模型4种基本结构间的关系?MOLAP与ROLAP的比较竞争情报系统概念数据挖掘应用

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号