数据仓库系统的设计与开发

上传人:豆浆 文档编号:50726883 上传时间:2018-08-10 格式:PPT 页数:32 大小:357.50KB
返回 下载 相关 举报
数据仓库系统的设计与开发_第1页
第1页 / 共32页
数据仓库系统的设计与开发_第2页
第2页 / 共32页
数据仓库系统的设计与开发_第3页
第3页 / 共32页
数据仓库系统的设计与开发_第4页
第4页 / 共32页
数据仓库系统的设计与开发_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《数据仓库系统的设计与开发》由会员分享,可在线阅读,更多相关《数据仓库系统的设计与开发(32页珍藏版)》请在金锄头文库上搜索。

1、第3章 数据仓库 系统的设计与开发 通过对数据仓库的概念、体系结构与存储结构、ETL过程等内容了解以后,如何建立数据仓库系统呢?*1数据仓库与数据挖掘3.1 数据仓库系统的设计与开发概述 l建立一个数据仓库系统的参考步骤 l数据仓库系统的生命周期 l创建数据仓库系统的两种思维模式 l数据仓库数据库的设计步骤 Date2数据仓库与数据挖掘建立一个数据仓库系统的参考步骤数据仓库系统的建立是一个复杂而漫长的过程。涉及到:l源数据库系统l数据仓库对应的数据库系统l数据分析与报表工具lDate3数据仓库与数据挖掘建立一个数据仓库系统的参考步骤l收集和分析业务需求步骤 l建立数据模型和数据仓库的物理设计

2、l定义数据源 l选择数据仓库技术和平台 l从操作型数据库中抽取、清洗及转换数据到 数据仓库 l选择访问和报表工具,选择数据库连接软件 ,选择数据分析和数据展示软件 l更新数据仓库 Date4数据仓库与数据挖掘数据仓库系统的生命开发周期 l数据仓库系统的开发与设计是一个动态的反 馈和循环过程。l一个数据仓库系统包括:数据仓库数据库数据分析应用系统Date5数据仓库与数据挖掘数据仓库系统的生命开发周期 Date6数据仓库与数据挖掘建立数据仓库系统的两种思维模式 l自顶向下(Top-down) 将数据通过ETL汇集到数据仓库中,然后再把 数据通过复制的方式存入各个数据集市中。l自底向上(Bottom

3、-Up) 通过ETL将数据汇集到数据集市中,再将数据汇集到数据仓库中。Date7数据仓库与数据挖掘数据仓库数据库的设计步骤 Date8数据仓库与数据挖掘3.2 基于SQL Server的数据仓库数 据库设计过程详解 lSQL Server 2005介绍集成了三个服务。lSQL Server 2005的数据仓库架构Date9数据仓库与数据挖掘MS SQL Server 2005的数据仓库架构 Date10数据仓库与数据挖掘3.2 基于SQL Server的数据仓库数 据库设计过程详解 包括以下步骤:l分析组织的业务状况及数据源结构 l组织需求调研,收集业务需求 l采用信息包图法进行数据仓库的概念

4、模 型设计 l利用星形图进行数据仓库的逻辑模型设 计 l数据仓库的物理模型设计 Date11数据仓库与数据挖掘分析组织的业务状况及数据源结构以SQL Server 2005实例数据库 Adventure Works DW中所描述Adventure Works Cycles公司的用户需求为例。公司概况业务系统流程介绍 对数据源结构的分析与理解Date12数据仓库与数据挖掘组织需求调研,收集业务需求坚持数据驱动+用户(需求)驱动的设 计理体念,因此需要充分了解用户的需求, 进而对需求进行分析。l关于用户需求的调研(确定主题域)l对用户需求调研结果的分析(确定度量 指标和维度)Date13数据仓库与

5、数据挖掘物理模型星型、雪花模型物理数据模型概念模型逻辑模型面向用户的需求细 化 层 次更详细的 技术细节信息包图采用信息包图法进行概念模型设计 Date14数据仓库与数据挖掘 信息包图:是数据仓库的数据模型的第一层信息包图:是数据仓库的数据模型的第一层 或最高层。由于大多数商务数据是多维的,或最高层。由于大多数商务数据是多维的, 但传统的数据模型表示三维以上的数据有一但传统的数据模型表示三维以上的数据有一 定困难。而信息包图简化了这一过程并且允定困难。而信息包图简化了这一过程并且允 许用户设计多维信息包并与开发者和其他用许用户设计多维信息包并与开发者和其他用 户建立联系。这种模型集中在用户对信

6、息包户建立联系。这种模型集中在用户对信息包 的需要,信息包提供了分析人员思维模式的的需要,信息包提供了分析人员思维模式的 可视化表示。可视化表示。l信息包图法简介 Date15数据仓库与数据挖掘 工作:工作: 确定系统边界:决策类型、需要的信息、原确定系统边界:决策类型、需要的信息、原 始信息始信息 确定主题域及其内容:主题域的公共键码、确定主题域及其内容:主题域的公共键码、 联系、属性组联系、属性组 确定维度:如时间维、销售位置维、产品维确定维度:如时间维、销售位置维、产品维 、组别维等、组别维等 确定类别:相应维的详细类别确定类别:相应维的详细类别 确定指标和事实:用于进行分析的数值化信确

7、定指标和事实:用于进行分析的数值化信 息息 Date16数据仓库与数据挖掘l信息包图的建立 信息包:信息包: 维度维度类别类别空白信息包图样式空白信息包图样式指标和事实Date17数据仓库与数据挖掘例例试画出销售分析的信息包图。试画出销售分析的信息包图。 解:首先根据销售分析的实际需求,确定信息包的解:首先根据销售分析的实际需求,确定信息包的 维度、类别和指标与事实:维度、类别和指标与事实: (1 1)维度:包括日期维、区域维、产品维、客户维)维度:包括日期维、区域维、产品维、客户维 、广告维(待用)等。、广告维(待用)等。 (2 2)类别:确定各维的详细类别,如:日期维包括)类别:确定各维的

8、详细类别,如:日期维包括 年(年(5 5)、季度()、季度(2020)、月()、月(6060)、日()、日(18001800),), 括号中的数字分别指出各类别的数量;区域维包括括号中的数字分别指出各类别的数量;区域维包括 国家(国家(1010)、省州()、省州(100100)、城市()、城市(500500)、销售点)、销售点 (80008000),括号中的数字同样分别指出各类别的数),括号中的数字同样分别指出各类别的数 量;类似地,可以确定量;类似地,可以确定产品维、客户维、广告维产品维、客户维、广告维等等 的详细类别。的详细类别。 (3 3)指标和事实:确定用于进行分析的数值化信息)指标和

9、事实:确定用于进行分析的数值化信息 ,包括实际销售额、计划销售额和计划完成率。,包括实际销售额、计划销售额和计划完成率。 Date18数据仓库与数据挖掘销售分析的信息包图销售分析的信息包图日期维区域维产品维客户维广告维( 待用) 年度(5)国家(10)产品类别(500)年龄分组(7)广告费分组 (2) 季度(20)省州(100)产品名称 (9000)收入分组(8 ) 月(60)城市(500)信用组(2)日(1800 )销售点(8000)指标和事实:实际销 售额、计划销售额、计划完成率信息包: 销售分析 维度类别Date19数据仓库与数据挖掘l设计基于主题域的概念模型 供应商 ID相关 信息有关

10、信息商品信息供应商供应商主题顾客顾客ID顾客主题商品商品ID商品主题Date20数据仓库与数据挖掘利用星形图进行数据仓库的逻辑模 型设计 l根据分析需求与信息包图制作星形图销售分析客户广告区域时间产品Date21数据仓库与数据挖掘l根据分析需求与信息包图制作雪花图 销售分析客户广告区域时间产品产品类 别雪花模型对星型模型的维度表进一步标准化,对星型 模型中的维度表进行了规范化处理。 Date22数据仓库与数据挖掘l确定主题的属性组 主题名公共键 码属性组商品商品号基本信息:商品号、商品名、类型和颜色等 采购信息:商品号、供应商号、供应价、供应日期 和供应量等 库存信息:商品号、库房号、库存量和

11、日期等 销售销售单号基本信息:销售单号、销售地址等 销售信息:客户号、商品号、销售价、销售量和销 售时间 等 客户客户号Date23数据仓库与数据挖掘l事实表及其特征度量是客户发生事件或动作的事实记录,如客 户打电话,可能选择的度量有通话时长、通话次数 和通话费用等。客户购买商品,可能选择的度量有 购买的次数、购买商品的金额和购买商品的数量等 。事实表则是在星型模型或雪花模型中用来记录 业务事实,并作相应指标统计的表。事实表的特征有:记录数量情况维度表情况Date24数据仓库与数据挖掘l事实表的类型与设计 事实是一种度量,所以事实表中的这种指标往往 需要具有数值化和可加性的特征。即:要考虑决策

12、分析的需要(必要的数据)要考虑系统运行的需要(派生的数据)Date25数据仓库与数据挖掘l粒度的选择与设计步骤 根据需求和系统运行情况确定粒度:粒度的不同选择导致逻辑模型的差异粒度的不同选择导致数据存储容量的差异粒度的设计步骤:粗略估计数据量确定粒度的级别粒度设计实例:Date26数据仓库与数据挖掘l关于数据仓库的聚合模型l数据的分割处理 l星形图中的维度表简介 l常用维度的设计模式 Date27数据仓库与数据挖掘l事实表及其特征l事实表的类型与设计 l粒度的选择与设计步骤 l关于数据仓库的聚合模型与数据的分割处 理 l星形图中的维度表简介 l常用维度的设计模式 Date28数据仓库与数据挖掘

13、数据仓库的物理模型设计 l物理模型设计的主要工作l物理存储结构设计的原则 l数据仓库索引设计的特殊性 l存储优化与存储策略 Date29数据仓库与数据挖掘3.3 使用SQL Server 2005建立多 维数据模型 lSQL Server 2005示例数据仓库环 境的配置与使用 l基于SQL Server 2005示例数据库 的多维数据模型的建立与应用 。Date30数据仓库与数据挖掘3.3 使用SQL Server 2005建立多 维数据模型l在SQL Server 2005数据库环境中安 装数据仓库组件、示例和工具 l利用示例数据仓库( AdventureWorks DW)环境及帮助系 统学习 Date31数据仓库与数据挖掘3.3 使用SQL Server 2005建立多维 数据模型l创建一个新的数据仓库分析项目 l定义数据源 l定义数据源视图 l定义多维数据集 l部署“销售分析示例”项目 l浏览已部署的多维数据集 l提高多维数据集的可用性和易用性 Date32数据仓库与数据挖掘

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号