中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版

上传人:bin****86 文档编号:57904851 上传时间:2018-10-25 格式:PPT 页数:30 大小:334.50KB
返回 下载 相关 举报
中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版_第1页
第1页 / 共30页
中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版_第2页
第2页 / 共30页
中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版_第3页
第3页 / 共30页
中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版_第4页
第4页 / 共30页
中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版》由会员分享,可在线阅读,更多相关《中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版(30页珍藏版)》请在金锄头文库上搜索。

1、数据仓库建模,总述,项目管理(方法论, 维持元数据),定义数据仓库 的 概念及术语,规划成功的 数据仓库,分析用户 查询需求,选择处理体系,建模 数据仓库,计划仓库存储,ETT (构建仓库),满足业务 需求,支持终端 用户访问,管理数据仓库,目标,在完成这次课后,你应该做到以下几点: 能够列出数据仓库建模的主要阶段 能够列出数据仓库模型的组成部分 确定可用于数据仓库建模的工具,数据仓库数据库设计阶段,1. 定义业务模型 (概念模型) 2. 创建多维模型 (逻辑模型) 3. 概要建模 4. 创建物理模型,1,2, 3,4,操作策略分析,操作策略分析创建业务(概念)模型,阶段 1: 定义业务模型,

2、建立业务模型,操作策略分析建立业务(概念)模型 定义业务需求 确定业务尺度 确定维数 确定粒度 确定业务定义及规则 检验数据来源,阶段 1: 定义业务模型,业务需求驱动设计过程,现有的元数据,产品 ERD 模型,业务需求,研究,主要的输入,其它的输入,非关系型遗留系统,确定数据量和维数,平衡 单元体 成本 销售,属性被视为连续的或离散的值:,属性不断变化:,数据量,维数,描述 位置 颜色 大小,决定粒度,年?,季度?,月?,周?,天?,确定业务规则,产品 类型 监视器 状态 PC 15 inch New Server 17 inch Rebuilt19 inch CustomNone,位置 物

3、理距离 0 - 1 米 1 - 5 米 5 米,存储 存储 地区 区域,时间 月 季度 年,创建多维模型,阶段 2: 创建多维(逻辑)模型,确定事实表 将业务操作转化成事实表 通过分析源系统信息确定额外操作 确定基本操作和衍生操作 辅助文档确定维表连接事实表和维表创建用户视图,维表,维表有以下特征: 包含代表业务属性的文本信息 包含相关的静态数据 通过外键关联事实表,事实表,事实表有以下特性: 包含业务的数值变量 可能包含综合(汇总)的数据 可能包含打上时间戳的数据 有典型的叠加性(如果事实表相关的维度很高,则事实表的字段数也会比较多) 除了数值变量,其他字段都是同维表中的关键字 通过外键连接

4、维表 ,相关的主键在维表中,多维模型 (星型结构),维表,事实表,星型结构建模,中心事实表 周围的维表 非结构化的模型,Store Table Store_id District_id .,Item Table Item_id Item_desc .,Time Table Day_id Month_id Period_id Year_id,Product Table Product_id Product_desc ,Sales Fact Table Product_id Store_id Item_id Day_id Sales_dollars Sales_units .,星型结构建模,用户容

5、易理解 快速响应查询 简单的元数据 由许多前端工具支持 可变性不强 构建较慢 不支持历史,雪花结构建模,Time Table Week_id Period_id Year_id,Dept Table Dept_id Dept_desc Mgr_id,Mgr Table Dept_id Mgr_id Mgr_name,Product Table Product_id Product_desc,Item Table Item_id Item_desc Dept_id,Sales Fact Table Item_id Store_id Sales_dollars Sales_units,Store

6、Table Store_id Store_desc District_id,District Table District_id District_desc,雪花结构建模,直接利用一些工具 更灵活的改变 提供更快捷的数据装载机制 可能变得更庞大从而不易于管理 降低了查询性能 更加复杂的元数据,国家,州,县,城市,采用概要数据,可更快速地访问已经计算好的数据 减少I/O, CPU和 存储器的使用 从原系统以及预先计算好的概要中提取 通常存在于汇总的事实表中,阶段 3:概要建模,设计汇总表,Units Sales($) Store,Product ATotal Product BTotal Pro

7、duct CTotal,平均 最大值,总计 百分比,汇总表实例,SALES FACTS Sales$ Region Month 10,000 North Jan 99 12,000 South Feb 99 11,000 North Jan 99 15,000 West Mar 99 18,000 South Feb 99 20,000 North Jan 99 10,000 East Jan 99 2,000 West Mar 99,SALES BY MONTH/REGION Month Region Tot_Sales$ Jan 99 North 41,000 Jan 99 East 10

8、,000 Feb 99 South 40,000 Mar 99 West 17,000,SALES BY MONTH Month Tot_Sales Jan 99 51,000 Feb 99 40,000 Mar 99 17,000,Oracle8i中的概要管理,产品,区域,时间,销售概要,城市,销售,国家,数据仓库中的时间利用,时间维,时间元素将被存储在哪里?,时间尺度,销售事实,对于数据仓库,时间是关键因素。 时间的一致性表示对于扩展是必须的。,创建物理模型,阶段 4: 创建物理模型,空间设计转换到实际执行的物理模型 定义表及索引的存储策略 规划数据库大小 定义初始索引策略 定义分割策略

9、通过物理信息更新元数据文件,物理模型设计任务,定义命名和数据库标准 规划数据库大小 设计表空间 开发初始索引策略 开发数据划分策略 定义存储参数 设置初始化参数 使用并行处理技术,通过GUI 定义,建模,报告 避免由以下原因导致混乱的建模: 开发压力 开发者缺少理论知识 无策略 决定策略 正规地撰写和发布文档 做可用的、电子化的文档资料,使用数据建模工具,GUI 工具界面,总结,这次课讨论了以下几个问题: 创建业务模型 创建多维模型 概要建模 创建物理模型,业务模型,物理模型,多维模型,实践 7-1 总述,这次实践包含以下几项主题: 证明一连串结论的正确与否 完成一系列语句的正确判断 练习识别简单的业务模型,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号