MySQL_数据仓库指南

上传人:博****1 文档编号:507886824 上传时间:2022-08-13 格式:DOCX 页数:310 大小:661.41KB
返回 下载 相关 举报
MySQL_数据仓库指南_第1页
第1页 / 共310页
MySQL_数据仓库指南_第2页
第2页 / 共310页
MySQL_数据仓库指南_第3页
第3页 / 共310页
MySQL_数据仓库指南_第4页
第4页 / 共310页
MySQL_数据仓库指南_第5页
第5页 / 共310页
点击查看更多>>
资源描述

《MySQL_数据仓库指南》由会员分享,可在线阅读,更多相关《MySQL_数据仓库指南(310页珍藏版)》请在金锄头文库上搜索。

1、MySQL数据仓库指南前言欢迎使用 mysql多维数据仓库指南。数据仓库可以以通过集成各各种多样的数数据实现信息息的统一,这这些数据来源源包括现行的的事务操作和和管理信息系系统,以及外外部各种信息息源。这些源源数据将被整整合,清洗,转转换,如果需需要直接从这这些数据来源源读取数据的的话,该数据据将会在数据据仓库中以更更有利于操作作的方式存储储。数据仓库的数数据构造方式式使你可以存存储当前和历历史的数据。当当前数据是实实际事务操作作活动必要的的,一般是定定期的硬拷贝贝(比如打印印出的报表)或或者是联机报报表。而历史史数据,往往往不是那么容容易利用,可可以提供基于于时间点分析析的商业信息息,比如:

2、追追踪、推论分分析,以及对对比,这些对对于长期计划划和战略性的的市场决策都都是很重要的的。如 何从多个个信息源整合合信息,定期期积聚存储,有有效的需求设设计和发展技技术,所有这这些都和事务务型管理信息息系统所应用用的技术有很很大的不同。本本书都是关于于数据仓库的的设 计和开发技技术,它涵盖盖了大部分建建立数据仓库库所涉及到的的大部分技术术问题。更为为重要的是,本本书提供了一一个易懂的操操作指南,便便于开发一个个实际的数据据仓库。本书的适用范围围mysql多维维数据仓库指指南是一个实实战的书籍。你你将使用myysql数据据库,但该书书不是关于mmysql的的。本书不涉涉及任何硬件件架构方面的的问

3、题。本书主要关心数数据仓库的设设计和开发技技术。它不涉涉及开发项目目的管理,理理论,以及如如何领导开发发等相关的技技术问题。本书用一个数数据仓库开发发的例子来展展示技术如何何应用。提供供数据模型和和sql脚本,将将能够适用于于实际的数据据仓库开发。这这些脚本已经经在Winddows xxp proofessiional sp2 平平台上用myysql 55。0。21 版本测测试通过。另外,本书不不再对以下的的几个主题进进行特别的论论述: 数据仓仓库的概念 Sqll MySSQL数据库库适合阅读本书的的人:数据仓库应用用于各种组织织和商业机构构,从政府部部门,非盈利利组织到学校校,从制造业业到零

4、售店,从从金融机构到到医疗机构,从从传统公司到到互联网商家家。本书首先面向数数据仓库开发发人员。但是是,it 经经理和其他iit职业,特特别是那些对对mis(经经营报告)和和dss(决决策支撑应用用)感兴趣的的人将发现本本书同样有用用。总的说来来,本书是给给那些为分析析应用准备数数据工作相关关的人,以及及那些需要递递交信息的人人,比如打印印报表,联机机报表。本书同样适用用于那些数据据仓库初学者者。它将直接接快速的为那那些正在准备备开发他们第第一个数据仓仓库的人提供供帮助。教师和学生可可以将该书作作为教科书,以以便于明确他他们对于数据据仓库原理,概念的理解解。大部分章章节可以被定定制用于实验验练

5、习。预备的技能本书不是面向iit新人,为为了更有效的的利用本书,读读者必须有一一些系统开发发经验。但是是,不要求先先有数据仓库库的建设经验验。需要实践操作本本书例子的人人需要有rddbms(关关系数据库管管理系统)和和sql的实实际操作技能能。你可以从本书得得到你将可以仅仅用用一个示例,一一个最先存储储商业销售相相关数据的数数据仓库,并并且进行实践践操作,就可可以磨练你的的数据仓库知知识和实际技技能。该示例例是一个精简简版的实际数数据仓库,可可以在很多种种商业类型中中找到它的原原型。你将基于myssql数据库库用本书介绍绍的技术一步步步的开发该该示例中销售售相关数据仓仓库。这些技技术是在通常常

6、数据仓库开开发中将碰到到的问题的分分解技巧。通通过完成本文文的学习并且且完成所有的的练习,你将将获得相关工工作经验并可可以为负责第第一个实际数数据仓库项目目做好准备。章节总览本书包含25个个章节和一个个附录。所有有章节组织为为四个部分。第第一部分涵盖盖数据仓库基基础。第二部部分描述从原原始数据到数数据仓库的迁迁移。第三部部分讨论如何何控制数据仓仓库的发展演演化。第四部部分涉及到一一些高级的多多维技术。接接下来的部分分将给出每个个章节的预览览。第一篇 基本原原理第一篇,涵盖多多维数据仓库库的基础原理理,有四个章章节。第1章,“基本本组成”,介介绍星型模式式(一种数据据库模式,有有一个事实表表,周

7、围围绕绕着多个维表表)以及解释释该模式的基基本组成。第2章,”维度度历史“ 介介绍用代理健健来维护维成成员的历史记记录。第3章,“度量量可加性”,包包含维度数据据仓库中最重重要的特性之之一,也就是是存储在数据据仓库事实表表中的度量的的可加性。第4章,“维度度查询”,介介绍最适合应应用于星型模模式的一种ssql查询,维维度查询可以以用来证明一一个维度数据据仓库是否具具备两个最基基本的设计指指标:简单和和高效。第二篇: 提取取、转换和加加载该篇的所有55个章节涉及及了数据集成成,事实表,维维表。第5章,“源数数据提取”介介绍了不同类类型数据的提提取。第6章“导入时时间维”涵盖盖了三种最通通用的加载

8、时时间维的技术术。第7章 “初始始化导入“和和第8章,“定定期导入”涉涉及到两种类类型的导入技技术,初始化化和周期性。第9章,“周期期导入计划”,作作为第二篇的的总结,提供供一个进阶式式的指导,关关于如何利用用Windoows的任务务管理器实现现定期导入计计划。第三篇:成长第三篇介绍了不不同的处理技技术,这些技技术主要处理理一个成功的的多维数据仓仓库成长过程程中碰到的相相关问题。该该部分有十个个章节。第10章,“增增加字段”讨讨论关于向现现有数据仓库库中的表增加加一个字段的的技术问题。第11章,“按按需载入”涉涉及按需载入入的技术。第12章,“维维表子集”,介介绍相关技术术以帮助用户户处理维表

9、子子集问题。第13章,“维维度角色扮演演”,关于在在一个事实表表中多次使用用同一个维度度的问题。第14章,“快快照”让你在在需要作出汇汇总数据的时时候,能提供供快速性能的的查询。第15章,“唯唯度层次”和和第16章“多多路径和不齐齐整的维度层层次”是关于于简单和多路路径维度技术术,相应的,这这些技术帮助助人们进行汇汇聚和钻取分分析。第17章,“维维度退化”,展展示了如何用用维度退化技技术去减少一一个数据仓库库模式的复杂杂性。第18章,“垃垃圾维”,是是关于垃圾维维的技术,即即将表面上不不相关的但是是经常会被用用户进行要求求分析的数据据,用维的方方式组织起来来。第19章,“多多星型模式”展展示了

10、如何在在模式中增加加多个星型模模式。第四篇:高级技技术包含六个章节节。第20章,“不不齐整数据源源”,介绍如如何在数据仓仓库中处理那那些结构无法法直接映射到到目标表的数数据源。第21章,“无无事实的事实实表”,帮助助你为客户建建立一种可供供分析的辅助助数据,一种种无事实字段段的事实表,该该数据无法从从数据源直接接取得度量。第22章,“迟迟来的事实”,包包含一个技术术,用于处理理当数据源中中某个特殊的的事实没有在在计划载入时时间之前产生生的情况。第23章,“外外部数据源和和维度合并“,包包括两个主题题:处理外部部数据源和如如何将多个维维中分散的属属性合并到一一个维的技术术。第24章,“累累积度量

11、”,讨讨论两个相关关的问题:计计算度量和累累积度量的不不可相加性。第25章,“分分段维度”,阐阐述一种技术术,可以帮助助使用者针对对那些有连续续值的属性进进行数据分析析。附录附录a,“格格式文件数据据源”,介绍绍如何使用本本书例子中的的格式文件数数据源。源代码下载可以从htttp:/.上上面下载本书书的示例的程程序脚本。=Dimensiional Data Warehhousinng witth MySSQL: AA TutoorialbbyDjonni DarrmawikkartaBBrainyy Softtware Corp. 20077 (4322 pagees)ISBBN:978809

12、7522128200Compuuter pprograammerss who need to buuild aa dataa wareehousee willl findd releevant exampples aand innformaation writtten inn a thhorouggh, eaasy-too-folllow sttyle iin thiis steep-by-step tutorrial.封底 Backk Coveer将Mysqll这个最流行行的开源数据据库软件进行行数据仓库应应用,在本书书之前还从来来没有被在创创建多维数据据仓库方面用用这种入门指指南的方式进进

13、行介绍。主主题包括 星星型模式建模模,数据载入入(数据的提提取、转换和和加载:ettl),测试试检验,以及及多维查询。本本书由始至终终应用一个可可实践,相对对精简的真实实的项目。其其全面,易于于接受的写作作形式使得那那些需要建立立数据仓库的的程序员可以以得到相关的的示例和资料料。关于作者Djoni DDarmawwikartta 曾就职职于ibm,现现在是一个加加拿大保险公公司的数据仓仓库、商业智智能团队中的的技术专家。目目前生活在TTorontto, Onntarioo。第一篇基本原理理章节列表:第1章:基本组组成第2章:维度历历史第3章:维度可可加性第4章:维度查查询本篇概述你将运用关系系

14、数据库来实实施一个维度度数据仓库。事事实表和维表表这两种类型型的关系表构构成了一个数数据仓库模式式的基本部分分,在本书的的第一部分,你你将用myssql数据库库建立这些基基本部分。第1章:基本组组成概述本章将了解两两个重要的主主题:星型模模式和代理键键。星型模式式是一种维度度数据仓库的的数据结构。代代理键是在数数据仓库中添添加到事实表表以作为主键键的字段。在本章你将开开始一个关于于建立真实数数据仓库的漫漫长旅程。一一些任务需要要在本章完成成:n 建立一个个数据库用户户。n 建立两个个关系数据库库,一个作为为数据仓库,另另外一个作为为源数据库。n 为数据仓仓库建立数据据库表。n 产生代理理键:你

15、需要建立一个个源数据库是是因为你的数数据仓库还没没有源数据。实实际应用中这这一步并不是是必要的,因因为你的数据据仓库很有可可能是基于已已有的数据源源建立的。你你将在本书的的第二篇开始始使用这个源源数据库。第1节 星型模模式一个好的维度度数据仓库需需要有简洁的的数据结构。从从技术角度看看,一个简洁洁的结构将意意味着更快速速的查询。在在一个维度数数据仓库,关关系数据库的的实施中有两两种类型的表表,事实表和和维度表。事事实表包含商商业事实数据据(或者称为为度量值)。维维度表包含查查询该数据库库的种类。注意 在看完完本书前面两两个章节后,你你对事实表和和维度表将有有更好的理解解。这些表在数据据仓库中的联联系模式看起起来象星星状状,因此该模模式的术语就就称为星型模模式。注意 除了星星型模式外,雪雪花模式也会会用于数据仓仓库中。但是是较之星型结结构,其建模模更为困难。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 市场营销

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号