企业数据仓库概要设计说明书

上传人:夏** 文档编号:493828649 上传时间:2023-09-21 格式:DOC 页数:20 大小:286KB
返回 下载 相关 举报
企业数据仓库概要设计说明书_第1页
第1页 / 共20页
企业数据仓库概要设计说明书_第2页
第2页 / 共20页
企业数据仓库概要设计说明书_第3页
第3页 / 共20页
企业数据仓库概要设计说明书_第4页
第4页 / 共20页
企业数据仓库概要设计说明书_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《企业数据仓库概要设计说明书》由会员分享,可在线阅读,更多相关《企业数据仓库概要设计说明书(20页珍藏版)》请在金锄头文库上搜索。

1、XXXX企业数据仓库概要设计说明书(文档编码:OM-BIDW-C001)(版本01.00.000)未经许可,不得以任何形式抄袭XXXX企业版权所有,翻板必究XXXX企业数据组2009年3月文档变更历史日期版本作者修改内容评审号变更控制号发布日期2009-03-1601.00.000黄浩初始版本2009-03-16目录1 前言32 术语33 系统环境及功能44 系统数据流65 系统内部功能框架75.1 数据源层(DataSource)85.1.1 描述85.1.2 目标85.2 数据装载层(ETL)85.2.1 描述85.2.2 目标85.3 假定与约束95.4 数据仓库层(ODS、EDS、DM

2、)95.4.1 描述95.4.2 目标95.4.3 假定与约束105.4.4 系统模块(SystemBuildBlocks)115.5 前端展现层(ClientAccess)125.5.1 描述125.5.2 目标125.5.3 假定与约束125.5.4 需要的技能125.5.5 待确定问题135.6 元数据管理(MetaDataManagement)135.6.1 描述135.6.2 目标135.6.3 假定与约束145.6.4 需要的技能145.7 调度监控系统(DispatchSupervisorSystem)145.7.1 描述145.7.2 目标145.7.3 假定与约束155.7.

3、4 需要技能15、/4.1刖百本文档根据上次短彩部和互联网部的会议内容,从整个系统的高度形成公司基于短彩及技术部的数据仓库总体概念框架,对整个系统架构设计所需的功能模块进行明确划分,明确各功能模块的职责范围。2术语OM(OPENMOBILE):XXXX企业科技有限公司DW(DataWarehouse!):数据仓库,数据仓库是一个面向主题的(SubjectOriented)、集成的(Integrated)相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合ETL(Extraction-Transformation-Loading):数据抽取、转换和加载ODS(

4、OperationalDataStore):运营数据存储EDS(EnterpriseDataStore):企业数据存储DM(DataMarket):数据集市DSS(DispatchSupervisorSystem):调度监控系统MetaDataManagement:元数据管理3系统环境及功能系统环境及功能如下图所示:短彩系统上、下行数据WAP系统(二应用下载系统(二期)/WEB页面点击下载数据其他外围系统(二期)理人员KPI浏览,报表浏览浏览,报表浏览多维分析报表浏览,公司其他系统数据数据库性能监控/元数据管理,录入数据修正一数据恢复*数据库管理员系统监控系统管理员系统参数设置,权限设置,应用

5、安装数据管理员数据质量分新加载拒绝数据系统整体构架从图中看到本系统目前的关联系统有:短彩部系统:主要为上下行及report数据WA陈统:考虑二期接入应用下载系统:考虑二期接入其他外围系统:暂时没有,作为后期扩展而设计OMR据仓库的主要用户角色有:高层管理人员;该类用户主要是公司相关领导,通过0濒据仓库作出相应的决策,该类用户往往浏览0微据仓库的企业KPI指标及相关报表。业务/经理人员;该类用户主要是各部门领导如产品部、商务部、财务部等相关部门领导等,主要使用OM敷据仓库查看部门KPI指标,浏览相关报表,进行多维分析等工作;业务分析员;这类用户主要是资深的分析人员,通过OMK据仓库浏览报表并进行

6、多维分析等工作系统管理人员;该类用户对OM激据仓库进行系统的监控及维护等工作,并为其他用户提供支持;OMK据仓库应提供给用户如下的功能:多维分析:多维数据分析是针对特定的分析主题进行多维数据模型的建模,使管理决策人员在多维数据模型的基础上进行快速、稳定和交互性的访问,通过切片、切块、旋转等操作进行各种复杂的分析和预测工作。专题分析:专题分析模块利用各类主流的数理统计方法,通过不同分析工具(或模型)为专业分析人员(SuperUser)提供灵活、专业分析的工具,解决一些跨越主题的统计分析需求。本部分列举了一些较为复杂的分析模型,例如:客户流失预警分析、客户消费行为分析、客户发展分析、高额/欺诈分析

7、、大客户异动分析、客户消费模型分析、业务推出对其它业务的影响分析的测算分析等等。指标展示与告警:系统对用户非常关心的关键指标进行多种方式的展示,如展现企业每天经营的整体运营情况,主要包括一些实时性的业务关键指标如每天更新的客户数、活动客户数、总上行量、总下行量、下行成功量、收入、每天新增客户数、流失客户数等指标;对于相关指标可设置告警值,若指标值超出告警上下限则进行告警;系统管理功能:为保证OMK据仓库能够稳定和安全的运行,系统应提供充分的系统管理功能,以对整个数据仓库系统的运行进行管理、协调及监控、系统备份和数据备份等等。4系统数据流按照数据仓库的设计思路及功能,系统的数据流框架如下图所示:

8、外部数据源数据接口文件一一区一Loew,调度子流程-数据访问子流程数据流框架5系统内部功能框架系统的内部功能模块如下:DataSourceClinetAccess系统功能模块图从上图可以看到系统包括数据源层(DataSource)、数据装载层(ETL)、数据仓库层(StageODSEDSDM)、前端展示层(ClientAccess)、系统管理层(SystemManagement)、元数据管理层(MetaDataManagement)及调度监控层(DispatchSupervisorSystem)等。数据源层(DataSource)描述OMt据仓库的数据来自于MSSQL#部数据源,数据平台相对单

9、一。目标由于用户常常需要访问以不同形式存放且处于不同平台上的业务数据及其他外部数据,因此需把这些外部数据经过数据抽取和转换等操作以标准一致且易于理解的方式存储在STAG叶数据装载层(ETL)寸苗述数据在进入数据仓库前,先存储在STAG*储区,这部分数据是直接将数据源层的数据加载得到的,不做任何的逻辑处理。数据装载层对业务数据及其他外部源数据经过数据抽取、清洗、转换等操作形成标准一致、清洗后的数据,并存放在数据仓库系统中STAG嗷据库中。目标数据装载层定义了数据从数据源系统存储到数据仓库中所进行的数据转换及数据清洗规则。它负责从源数据系统抽取数据并经各种转换操作后加载数据进入数据仓库系统中。从数

10、据源系统进行数据抽取、数据转换和数据加载时应该要迅速并尽量减小对数据源系统、网络和数据仓库环境的影响。假定与约束公司业务系统环境相对简单;基于ETL方法公司的数据转换规则相对简单;临时空间对于数据获取层来说可以单独开发。为了简化和优化ETL处理过程,临时空间中存储的数据可以是持续存储的;数据处理过程中的统计信息可以存放在临时空间中,但临时空间的数据对于前端用户来说应该是不可见的,临时空间的数据既可以是关系型的也可以以文件的形式存在。目前的假设是数据获取层和数据处理层的临时空间可以共享,它们在物理上并不分开;数据仓库层(ODS、EDS、DM)才苗述数据仓库层是整个数据仓库系统的核心,进入数据仓库

11、的所有数据都是在STAGE?储区经过一定的业务逻冷?进行处理过的数据。ODS-EDS-DMJ设计模式,体现了数据仓库设计的两个基本点:粒度和维度。从ODS-EDS-DM数据的粒度依次递增,也就是OD话储的是接近于原始数据源的明细数据,到DM莫式,数据已经是经过深度汇总的;另一方面,ODS#储的是运营数据,基本上体现不了主题,而当数据经过深度汇总到DM模式,每个模式基本上就是一个主题,而主题的两个基本内容就是维度和计算值,因此在DM是根据一定维度进行深度汇总得到的面向主题的数据,也是直接面向业务部门不同用户的数据。目标将数据粒度化,通过具体的业务模型进行规范,使得数据在模型上规范化。数据预处理:

12、充分利用数据仓库中数据静态化的特点,将数据预处理,生成不同粒度的处理数据;数据复用:数据仓库最核心的元素是数据,数据的复用度是数据仓库设计优劣的一个标准。数据的复用可以减少重复调度带来的系统负荷及数据不一致性问题;数据结构优化:通过适度的粒度和维度设计,可以达到结构优化的目的。即将不同主题和粒度的数据存放在不同的物理表中。假定与约束临时空间对于数据提升层来说可以单独开发。为了简化和优化ETL处理过程临时空间中存储的数据可以是持续存储的;数据处理过程中的统计信息可以存放在临时空间中,但临时空间的数据对于前端用户来说应该是不可见的,临时空间的数据既可以是关系型的也可以以文件的形式存在。目前的假设是

13、数据获取层和数据传送层的临时空间在物理上不分开并且可共享;5.4.4系统模块(SystemBuildBlocks)数据仓库层可以进一步分解如下:STAGE莫式,该模式的数据是直接从外部数据源中(文本文件)导入,不做任何的处理。据数始原-一N据数始原(-一ODS(OperationalDataStore)模式,主要功能有:1、横向合并,将STAGE莫式日数据合并为月数据2、纵向合并,对STAGE莫式进行表连接,将经常进行联合查询的表进行预处理3-1据数并合向WroN据数并合向EDS(EnterpriseDataStore)模式,主要功能:1、横向切片,从ODS数据中按照一定的业务规则抽取数据2、

14、初步聚集,从STAG或OD嗷据中按一定的业务规则对数据进行初步汇总1据数片切向BwquN据数集聚步DM(DataMarket)模式,主要功能:1、深度聚集,从EDS初步聚集数据中进行深度汇总1据数集聚度N据数集聚度二从上面的图中可以看出从最原始的数据STAGE最终的统计分析数据,在数据仓库中共分4个层次,即数据按照粗细分成4种粒度,STAG株式的粒度最大,对应的数据的细节也是最细的;而粒度最小的DM莫式的数据的细节是最粗的。而从最大粒度的STAGE最小粒度的DM莫式,都需要业务驱动,既数据每个粒度的处理都是根据业务来进行前端展现层(ClientAccess)才苗述用户与数据仓库的所有的交互需要在在前端展现层实现。在前端展现层需要实现应用信息的读取,一是元数据管理。应用信息读取模块提供工具让用户可以快速方便的得到他们想需要的信息。这个模块可以让用户通过读取数据仓库中不同层的数据存储来查阅报表进行分析,如同自己拥有一个信息系统。目标该层的主要目标是让用户从纷繁的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 演讲稿/致辞

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号