数据仓库与数据挖掘教程(第2版)-陈文伟版课后习题答案(非常全)

上传人:m**** 文档编号:519707122 上传时间:2023-01-30 格式:DOCX 页数:38 大小:1.09MB
返回 下载 相关 举报
数据仓库与数据挖掘教程(第2版)-陈文伟版课后习题答案(非常全)_第1页
第1页 / 共38页
数据仓库与数据挖掘教程(第2版)-陈文伟版课后习题答案(非常全)_第2页
第2页 / 共38页
数据仓库与数据挖掘教程(第2版)-陈文伟版课后习题答案(非常全)_第3页
第3页 / 共38页
数据仓库与数据挖掘教程(第2版)-陈文伟版课后习题答案(非常全)_第4页
第4页 / 共38页
数据仓库与数据挖掘教程(第2版)-陈文伟版课后习题答案(非常全)_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《数据仓库与数据挖掘教程(第2版)-陈文伟版课后习题答案(非常全)》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘教程(第2版)-陈文伟版课后习题答案(非常全)(38页珍藏版)》请在金锄头文库上搜索。

1、第一章作业1 数据库与数据仓库的本质差别是什么?书P2(1)数据库用于事务解决,数据仓库用于决策分析。()数据库保持事物解决的目前状态,数据仓库即保存过去的数据又保存目前的数据。()数据仓库的数据是大量数据库的集成。(4)对数据库的操作比较明确,操作数量较小。对数据仓库操作不明确,操作数据量大。2从数据库发展到数据仓库的因素是什么?书1()数据库数据太多,信息贫乏。如何将大量的数据转化为辅助决策信息成为了研究热点。(2)异构环境数据的转换和共享。随着各类数据库产品的增长,异构环境的数据也逐渐增长,如何实现这些异构环境数据的转换的共享也成了研究热点。()运用数据进行事物解决转变为运用数据支持决策

2、。举例阐明数据库与数据仓库的不同。例如,银行中储蓄业务要建立储蓄数据库,信用卡要建立信用卡数据库,贷款业务要建立贷款数据库,这些数据库以便了银行的事务解决。但是要对这些独立数据库进行决策分析就很复杂了。因此可以把这些数据库中的数据存储转化到数据仓库中,以便进行决策。.L(OnLi Tranatn Procsin,联机事物解决)是在网络环境下的事务解决工作,以迅速的响应和频繁的数据修改为特性,使顾客运用数据库可以迅速地解决具体的业务。OLAP(OnLine Analytl Pocssin,联机分析解决)是使用多维数据库和多维分析的措施,对多种关系数据库共同进行大量的综合计算来得到成果的措施。5O

3、TP是顾客的数据可以立即传送到计算中心进行解决,并在很短的时间内给出解决成果。6OLTLP细节性数据综合性数据目前数据历史数据常常更新不更新,但周期性刷新一次性解决的数据量小一次解决的数据量大对响应时间规定高响应时间合理面向应用,事务驱动面向分析,分析驱动7.涉及数据项、数据构造、数据流、数据存储和解决过程五个部分。8.定义为有关数据的数据,描述数据仓库中数据及其环境的数据。9. 元数据不仅仅是数据仓库的字典,并且还是数据仓库自身功能的阐明数据,是整个数据仓库的核心。数据字典是有关数据库中数据的描述,而不是数据自身,数据字典是数据库的元数据。10 .数据仓库的定义是什么? 答:(1)W.Inn

4、对数据仓库的定义:数据仓库是面向主题的,集成的、稳定的、不同步间的数据集合,用于支持经营管理中决策制定过程。 (2)SS软件研究所的观点:数据仓库是一种管理技术,旨在通过畅通、合理、全面的信息管理,达到有限的决策支持。 从数据仓库定义可以看出,数据仓库是明确为决策支持服务的,而数据库是为事务解决服务的。11数据仓库的特点有哪些? 答:数据仓库的特点有一下几种:(1) 数据仓库是面向主题的(2) 数据仓库是集成的(3) 数据仓库是稳定的(4) 数据仓库是随时间变化的(5) 数据仓库中的数据量很大(6) 数据仓库的软硬件规定较高1、阐明机器学习如何形成人工智能的学科方向。答:机器学习是研究使计算机

5、模拟或实现人类的学习行为,即让计算机自动获取知识。20世纪80年代,机器学习获得了较大成果,如AQ11系统、ID3决策树措施等,让机器学习上了一种新的台阶,机器学习便成为人工智能的一种重要学科方向。13、阐明数据挖掘的含义。答:数据挖掘就是从数据库中的所有数据记录中归纳总结出知识,让人们从抽象复杂的数据中看到客观规律,以便做出决策。4、LA多维分析如何辅助决策?举例阐明。答:OLA是在多维数据构造上进行数据分析的,一般在多维数据上切片、切块成简朴数据来进行分析,或是上钻、下钻来分析。OLAP要查询大量的平常商业信息,以及大量的商业活动变化状况,如每周购买量的变化值,经理通过查询变化值来做决策。

6、例如经理看到利润不不小于估计值是,就会去进一步到各地区去查看产品利润状况,这样她会发现某些比较异常的数据。通过进一步的分析和追踪查询可以发现问题并解决。15 OAP是在带层次的维度和跨维度进行多维数据分析的。数据挖掘则不同,它是以变量和记录为基本进行分析的。16例如对超市的所有的购物账单中成对浮现的商品的记录,可以有助于超市商品的合理摆放。17()常用记录(2)有关分析()回归分析(4)假设检查(5)聚类分析(6)鉴别分析(7)主成分分析18、记录学与数据挖掘的不同。记录学重要是对数量数据或持续值数据进行数值计算的定量分析,得到数量信息。数据挖掘重要对离散数据进行定性分析,得到规则知识。在记录

7、学中有聚类分析和鉴别分析,它们与数据挖掘中的聚类和分类相似。但是,采用的原则不同样,记录学的聚类采用的“距离”是欧式距离,即两点间的坐标(数值)距离。而数据挖掘的聚类采用的“距离”是海明距离,即属性取值与否相似,相似者距离为,不相似者距离为1。总之,记录学与数据挖掘是有区别的,但是,它们之间是互相补充的。不少数据挖掘的著作中均把记录学的不少措施引入到数据挖掘中,与将机器学习中不少措施引入到数据挖掘中同样,作为从数据获取知识的一大类措施。19、阐明数据仓库与数据挖掘的不同。数据仓库是在数据库的基本上发展起来的。它将大量的数据库的数据按决策需求进行重新组织,以数据仓库的形式进行存储,将为顾客提供辅

8、助决策的随机查询、综合信息以及随时间变化的趋势分析信息等。数据仓库是一种存储技术,其数据存储量是一般数据库的0倍,涉及大量的历史数据、目前的具体数据以及综合数据。它能适应不同顾客对不同决策需要提供所需的数据和信息。数据挖掘是从人工智能机器学习中发展起来的。它研究多种措施和技术,从大量的数据中挖掘出有用的信息和知识。最常用的数据挖掘措施是记录分析措施、神经网络措施和机器学习中研究的措施。数据挖掘中采用机器学习的措施有归纳学习措施(如覆盖正例排斥反例措施,如AQ系列算法、决策树措施等)、遗传算法、发现学习算法(如公式发现系统BAN)等。运用数据挖掘的措施和技术从数据仓库中挖掘的信息和知识,反映了数

9、据仓库中数据的规律性。顾客运用这些信息和知识来指引和协助决策。例如,运用分类规则来预测未知实体的类别。0、数据挖掘应用于数据库与数据挖掘应用与数据仓库有什么不同。数据挖掘兴起是针对数据库的,随着数据仓库的兴起和发展,由于数据仓库不同于数据库,数据挖掘也随之发生变化。 (1)数据存储方式的不同数据库的数据存储是按照管理业务中事物解决项目的规定而寄存的。 数据仓库的数据存储是按决策分析需求而寄存的。这种需求是以决策主题为对象的,典型的主题是客户。这样,在数据仓库中客户数据需要从多种数据库集成而来,如银行数据仓库需要从储蓄、信用卡、贷款等不同数据库中,对同一客户的数据抽取并集成在一起,以便完毕对该客

10、户的分析。 (2)数据存储的数据量的不同数据库的数据存储量相对数据仓库的数据存储量小得多。从上面的例子可以看出,以客户主题建立数据仓库的数据量是储蓄、信用卡、贷款个数据库的数据量的总和。按一般的记录,数据仓库的数据量是数据库数据量的10倍。数据仓库的数据量比数据库的数据量大这样多在于:数据仓库中的数据(近期基本数据)是数据库中数据按决策主题重新组织并集成而来;数据仓库中数据还需要保存大量的历史数据,用于预测分析;数据仓库为了给不同级别管理者提供多种决策分析的数据,需要对近期基本数据进行轻度综合和高度综合,这些综合数据在数据仓库中占据了不小的比重。近期基本数据、历史数据、综合数据三者的数据相加,

11、使数据仓库的数据量远远不小于数据库中的数据量。()数据存储的构造不同由于数据仓库的数据量远不小于数据库的存储量,数据库的关系型二维(平面)存储格式不能适应数据仓库。数据仓库的数据存储构造采用多维的超立方体构造形式。数据仓库的数据存储构造采用星型模型或者多维立体数据库形式。1:答:数据仓库实在数据库的基本上发展起来的,它将大量的数据库的数据按决策需求进行重新组织,以数据仓库的形式进行存储。数据挖掘是从人工智能机器学习中发展起来的,它研究多种措施和技术,从大量的数据挖掘出有用的信息和知识。数据挖掘应用于数据仓库后,能挖掘更深层次上的信息,如:哪些商品一起销售更好?高价值客户的共同点是什么?等。2:

12、答:数据仓库为数据挖掘提出的新规定为:1,数据挖掘需要可扩展性。,数据挖掘措施需要能挖掘多维知识。23:答:数据仓库视为辅助决策而建立的,单依托数据仓库达到辅助决策的能力是有限的,综合信息和预测信息是数据仓库所获得的辅助决策信息。数据仓库中增长联机分析解决和数据挖掘等分析工具,能较大的提高辅助决策能力。数据仓库和联机分析解决几数据挖掘结合的决策支持系统,是以数据仓库为基本的,称为基于数据仓库的决策支持系统。概括地说:基于数据仓库的决策支持系统是从数据仓库的数据中获取辅助决策信息和知识,为决策提供支持。4基于数据仓库的决策支持系统的构成是什么?答:基于数据仓库的决策支持系统由三个部件构成:数据仓

13、库技术,联机分析解决技术和数据挖掘技术,其中数据仓库技术是系统的核心。2画出基于数据仓库的决策支持系统构造图。如图:26阐明基于数据仓库的决策支持系统与老式决策支持系统有什么区别。答:数据仓库技术将老式数据库中的数据及其她源数据进行了抽取、转换、装载等工作,使之成为统一、集中、稳定的数据,并在元数据库中保存了数据转换、映射等过程,就能为决策过程提供良好的数据基本。而老式的决策支持系统重要以关系数据库为基本,重要关注于对数据的操作,很难有效率地获取决策需要的信息。27. 商业智能描述了一系列的概念和措施,通过应用基于事实的支持系统来辅助商业决策的制定。商业智能技术提供使公司迅速分析数据的技术和措

14、施,涉及收集、管理和分析数据,将这些数据转化为有用的信息,然后分发到公司各处。28 可以觉得,商业智能是对商业信息的收集、管理和分析过程,目的是使公司的各级决策者获得知识或洞察力(insgh),促使她们做出对公司更有利的决策。商业智能一般由数据仓库、联机分析解决、数据挖掘、数据备份和恢复等部分构成。商业智能的实现波及到软件、硬件、征询服务及应用,其基本体系构造涉及数据仓库、联机分析解决和数据挖掘三个部分。2 信息共享, 实时反馈系统 ,鼓励顾客找出问题的主线因素,使用积极智能,实时智能等方面第二章作业周劼人13 郭朋- 王国梁-9 旦增群培0-1 刘洋12-14许赟昊-1 杜海洋18-20 徐

15、文松23 何金海4-25 陶汉6-271. 画出数据仓库的构造图,阐明各部分内容。P18目前基本数据是近来时期的业务数据,是数据仓库顾客最感爱好的部分数据量大。随着时间的推移,有数据仓库的时间控制机制转为历史数据,轻度综合数据是从目前基本数据中提取出来的,最高一层是高度综合数据层,这一层的数据十分精炼,是一种准决策数据。2. 阐明数据仓库构造图中涉及轻度综合层与高度综合数据层的作用。这些数据为什么不是临时计算出来的。P18-9数据仓库除了存储按主题组织起来的目前具体数据外,还需要存储综合数据,这是为了适应决策需求而增长的。在数据库中需要得到综合数据时,采用数据立方体的措施对具体数据进行综合。在数据仓库中并不采用临时计算的方式得到综合数据,而在顾客提出需要综合数据之前,就预先将也许的综合数据运用数据立方体计算好,存入综合数据层中,这种综合数据层在顾客查询时,能迅速提供应顾客。3. 阐明数据集市与数据仓库的区别和联系。20联系:数据集市是一种更小,更集中的数据仓库,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号