数据仓库之路FAQ

上传人:飞*** 文档编号:42285755 上传时间:2018-06-01 格式:DOC 页数:22 大小:467KB
返回 下载 相关 举报
数据仓库之路FAQ_第1页
第1页 / 共22页
数据仓库之路FAQ_第2页
第2页 / 共22页
数据仓库之路FAQ_第3页
第3页 / 共22页
数据仓库之路FAQ_第4页
第4页 / 共22页
数据仓库之路FAQ_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《数据仓库之路FAQ》由会员分享,可在线阅读,更多相关《数据仓库之路FAQ(22页珍藏版)》请在金锄头文库上搜索。

1、数据仓库之路 FAQFAQ 目录目录一、一、与数据仓库有关的几个概念与数据仓库有关的几个概念.21.1目录.2二、二、数据仓库产生的原因数据仓库产生的原因.6三、三、数据仓库体系结构图数据仓库体系结构图.7四、四、数据仓库设计数据仓库设计.84.1数据仓库的建模.84.2数据仓库建模的十条戒律:.9五、五、数据仓库开发过程数据仓库开发过程.95.1数据模型的内容.95.2数据模型转变到数据仓库.105.3数据仓库开发成功的关键.11六、六、数据仓库的数据采集数据仓库的数据采集.116.1后台处理.126.2中间处理.126.3前台处理.136.4数据仓库的技术体系结构.136.5数据的有效性检

2、查.156.6清除和转换数据.156.7简单变换.166.8清洁和刷洗.176.9集成.186.10聚集和概括.206.11移动数据.20七、七、如何建立数据仓库如何建立数据仓库.227.1数据仓库设计.227.2数据抽取模块.237.3数据维护模块.24一、一、 与数据仓库有关的几个概念与数据仓库有关的几个概念1.1目录目录DatawarehouseDatamartOLAPROLAPMOLAPClientOLAPDSSETLAdhocqueryEISBPRBIDataminingCRMMetaDataData warehouse本世纪 80 年代中期,“数据仓库之父”William H.In

3、mon 先生在其建立数据仓库一书中定义了数据仓库的概念, 随后又给出了更为精确的定义:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数 据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分 析的过程。而不是一种可以购买的产品。Data mart即数据集市,或者叫做“小数据仓库”。如果说数据仓库是建立在企业级的数据模型之上的话。那么数据集市就是企 业级数据仓库的一个子集,他主要面向部门级业务,并且只面向某个特定的主题。数据集市可以在一定程度上缓解访 问数据仓库的瓶颈。OLAP联机分析处理(OLAP)的概念最早是由关系数据

4、库之父 E.F.Codd 于 1993 年提出的。当时,Codd 认为联机事务处理 (OLTP)已不能满足终端用户对数据库查询分析的需要,SQL 对大数据库进行的简单查询也不能满足用户分析的需求。 用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此 Codd 提出了多维数据库和多维分析的概念,即 OLAP。Codd 提出 OLAP 的 12 条准则来描述 OLAP 系统:准则 1 OLAP 模型必须提供多维概念视图准则 2 透明性准则准则 3 存取能力推测准则 4 稳定的报表能力准则 5 客户/服务器体系结构准则 6 维的等同性准则准则 7 动

5、态的稀疏矩阵处理准则准则 8 多用户支持能力准则准则 9 非受限的跨维操作准则 10 直观的数据操纵准则 11 灵活的报表生成准则 12 不受限的维与聚集层次ROLAP基于 Codd 的 12 条准则,各个软件开发厂家见仁见智,其中一个流派,认为可以沿用关系型数据库来存储多维数据, 于是,基于稀疏矩阵表示方法的星型结构(starschema)就出现了。后来又演化出雪花结构。为了与多维数据库相区别, 则把基于关系型数据库的 OLAP 称为 Relational OLAP,简称 ROLAP。代表产品有 Informix Metacube、Microsoft SQL ServerOLAP Servi

6、ces.MOLAP严格遵照 Codd 的定义,自行建立了多维数据库,来存放联机分析系统数据的 Arbor Software,开创了多维数据存储的先 河,后来的很多家公司纷纷采用多维数据存储。被人们称为 MuiltDimension OLAP,简称 MOLAP,代表产品有 Hyperion(原 Arbor software) Essbase、Showcase STRATEGY 等。Client OLAP相对于 Server OLAP 而言。部分分析工具厂家建议把部分数据下载到本地,为用户提供本地的多维分析。代表产品有 Brio Designer, Business Object.DSS决策支持系统(Decision Support system),相当于基于数据仓库的应用。决策支持就是在收集所有有关数据和信息, 经过加工整理,来为企业决策管理层提供信息,为决策者的决策提供依据。ETL数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。构建数据仓库的重要一环,用 户从数据源抽取出所需的数据,经过数据清洗,最终

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号