ibm数据管理解决方案-元鼎时代.doc

上传人:F****n 文档编号:90851693 上传时间:2019-06-19 格式:DOCX 页数:25 大小:39.97KB
返回 下载 相关 举报
ibm数据管理解决方案-元鼎时代.doc_第1页
第1页 / 共25页
ibm数据管理解决方案-元鼎时代.doc_第2页
第2页 / 共25页
ibm数据管理解决方案-元鼎时代.doc_第3页
第3页 / 共25页
ibm数据管理解决方案-元鼎时代.doc_第4页
第4页 / 共25页
ibm数据管理解决方案-元鼎时代.doc_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《ibm数据管理解决方案-元鼎时代.doc》由会员分享,可在线阅读,更多相关《ibm数据管理解决方案-元鼎时代.doc(25页珍藏版)》请在金锄头文库上搜索。

1、ibm数据管理解决方案|元鼎时代篇一:IBM数据仓库解决方案 技术架构设计成功地实施一个仓库项目,通常需要很长的时间。如果仅仅着眼于短期成果,缺乏整体考虑,采用一种不健全的体系结构,不仅会增加系统开发和维护成本,而且必将对发挥数据仓库的作用造成不利的影响。因此一个综合,清晰的远景规划及技术实施蓝图将在整个项目的实施过程中起到重要作用。技术架构必须具有高度先进性和可扩展性,以满足业务需求的不断变化。一个完整的数据仓库系统包括数据源、数据转换区、数据仓库、数据集市、和数据展现层,通过数据仓库不同层次之间的加工过程,实现财政从数据资产向信息资产的转化过程。在不同层次之间的数据加工过程需要通过ETL技

2、术实现,并对整个过程进行有效的元数据管理。基于对需求的理解,基于财政部的信息系统框架模型基础之上的财政决策支持系统技术架构如下图所示:如上图所示意,通过搭建灵活的、可扩展技术架构,在保持数据集市稳定性的同时,可以不断增加数据源,增加应用数据层、增加应用层,满足不断增加的业务分析应用需求。采用DW+ODS的数据仓库体系结构,使用全新的ETL模式对ODS进程每日数据更新,按周或月周期对数据仓库执行ETL过程。使用COGNOS BI做为前端的查询分析和数据挖掘工具,可满足各种日常数据处理操作,从即时简单报表查询到多维多级数据分析和挖掘,都能够在统一COGNOS BI平台上完成。 数据源和数据接口数据

3、源指存储于财政各个业务系统的业务数据,以及未来的财政监管和外部数据。数据仓库系统将整合来自于这些系统的数据,形成财政统一的、一致的基础数据集,并提供给不同的应用主题形成数据集市。各个系统在体系架构、开发平台、数据定义、接口标准都会存在不同程度的差异;另外由于业务的不断变化,历史数据与当前数据之间的含义也可能存在不同,因此数据整合必须充分考虑源系统在技术和数据方面存在的差异。数据仓库系统将采用文本文件的方式从源系统获取数据。每个源系统会就与数据仓库之间就传输数据接口文件(IFF)的格式和方法制定标准,称之为接口规范。每个数据源会首先通过各自的数据导出程序(Extractor)生成接口文件存储在各

4、自的文件缓冲区内。这个Extractor负责各自范围内导出数据的完备性和一致性,包括:1) 依照各自的业务规则确定增量数据的导出方法2) 保证导出文件的格式符合接口规范的要求3) 保证导出文件的传输时间的及时性4) 保证接口文件的数据质量,不错数、不丢数、不多数 财政数据仓库财政数据仓库(EDW),存储和管理来自源数据系统的数据,按照数据模型分主题进行组织和存放,包括当期的和较长时间的历史数据。数据仓库的核心是企业级数据模型的规划和设计,是所有应用的基础。接下来我们分别对EDW每个数据区域做详细介绍。1) 接口文件区接口文件区是存储和处理接口文件的区域,如前面章节所述,接口文件区在系统下按照特

5、定的目录结构组织起来。用一些系统命令和工具来管理。对每个目录按照其特定的用途设定对不同用户的访问权限,比如谁能读,谁能写,谁能改等。2) 细节数据暂存区SSA(SOR Staging Area)SSA的主要目的是支持把接口文件的装载到数据库,对其进行验证和处理,然后把数据整合到SOR内。验证的方法主要是将新的数据与SOR内已有的数据进行查找和比较。SSA内数据结构的设计原则是最大限度的利用接口文件的数据结构,尽量降低实体的个数,同时很好的支持后续的ETL过程。3) 细节数据SOR(System Of Record)SOR是基于模型开发的一套符合3NF范式规范的表结构。SOR存储了数据仓库内最细

6、节层次的数据,按照不同的主题域进一步分分类组织。此模型是整个数据仓库数据模型的核心,其设计为具有足够的灵活性,以能够应对添加更多的数据源,支持更多分析需求,同时也能够支持进一步升级和更新。为了能够在数据仓库内记录数据的变化以支持历史趋势和变化分析,SOR在一些 关键的属性值上会跟踪变化(比如客户的信用度、状态等)。跟踪变化的常见方法就是利用渐变维的Type 2方法来处理记录,在表内增加一条记录变化数据的新记录。同时为了降低不必要的存储空间的浪费(相同数据的重复存储),我们可以把实体中动态变化的属性与静态不变或只需覆盖不需跟踪变化的属性分开。比如对用户,我们可以用一张表存放不变化的用户静态属性,

7、用另一张表存放经常变化的用户行为属性,当跟踪用户行为的变化时我们只需在用户行为表内添加记录就行了,没必要把没有发生变化的用户静态表内的数据也复制一份。4) 汇总数据区Summary汇总数据区是为了方便查询和后续多维数据的更新,创建一些常用的中间汇总表,以提高性能和降低后续ETL工作的复杂性。由于SOR是高度规范化的数据,因此要完成一个查询需要大量的关联操作;同时数据集市中的数据粒度往往要比SOR高很多,对要成生数据集市所需数据也需要大量的汇总计算,因此如果我们把常用的数据预先关联和汇总好,并让其尽量多在多个数据集市的计算中共享,就能大幅度的提高整个ETL工作和数据仓库查询的性能。5) 反馈数据

8、区(Feedback Area)反馈数据区主要记录的是数据仓库自身生成的结果。比如用户对营销活动的反馈等。数据仓库的特性决定了用户在原则上不能直接修改数据仓库中的数据,因此用户的修改数据和其它生成数据必须单独记录,以便于追踪历史和进行比较。6) 元数据存储MDR(Meta Data Repository)元数据存储用来保存关于数据仓库中的过程、数据的信息(日志、数据词典、配置信息等)。由于各个工具和系统都会生成自己的元数据,同时我们还利用元数据管理工具把这些元数据尽可能的集中存储到数据仓库中的MDR内,因此MDR总的来说只是一个共享元数据供用户集中访问的地方,真正元数据的维护地还是在生成这些元

9、数据的系统或工具内。 数据集市数据集市设计用途是要满足特定的目的,同时具有查询、多维分析、报表和数据挖掘功能。这与企业数据仓库截然不同,设计时企业数据仓库在信息内容与结构方面尽可能拥有开放性与灵活性。数据集市有以下特征:为特定用途而设计数据集市设计的目的,是支持特定用户对数据子集的特定范围的查询。它以用户所要求的方式提供企业数据仓库的细节汇总。优化数据集市为了支持特定工具的访问而优化。根据工具、根据企业数据仓库提供的信息子集来设计数据集市,而不是让用户直接访问企业数据仓库中的大型数据库,这可以改善数据集市的性能。虚拟或物理数据集市数据集市可以是物理的实现,也可以是企业数据仓库表的各种视图。使用

10、视图(虚拟数据集市)可以避免存储数据的多个副本,简化了数据管理。数据集市,即Data Mart,指面向专项应用领域的分析主题。Data Mart即是通过OLAP技术或者数据挖掘技术,利用数据仓库的数据根据用户需求建立的数据集市模型,大大提高了前端查询访问的效率,用户能方便地实现灵活、动态、快速、多角度、多层次地分析企业数据。同时,也可以通过定制灵活的OLTP查询来了解明细数据。 数据的抽取、转换、加载(ETL)数据仓库的数据于业务处理系统,但是数据仓库的数据并不是对源系统数据的简单叠加,它需要按照数据仓库的逻辑模型和物理模型,在源系统数据分析的基础上,按照源系统数据和数据仓库数据之间的映射关系

11、,经过数据的抽取、转换 和加载等环节方可进入数据仓库,这个过程简称为ETL处理。数据经过数据抽取、转换和加载处理进入数据仓库的整个过程可以简称为ETL过程。ETL是搭建数据仓库数据平台的基础,也是保证数据仓库的数据质量的具体实现。根据基于数据仓库项目开发的经验,在大多数据仓库的实施过程当中,ETL都是一个非常复杂、耗时的过程,其工作量约占整个数据仓库项目的40-50%,占数据仓库设计阶段工作量的70-80%,有许多原因影响这一阶段的时间和进度。比如对原有业务系统和旧的操作环境的了解有限,原系统文档不全等。因为这些原因,使ETL任务花了许多时间在了解旧的业务应用以及如何抽取数据上。ETL实施困难

12、另一个原因是原有的系统平台没有足够的容量/系统资源来支持数据抽取处理,系统资源不足可能表现为:CPU、磁盘空间、I/O带宽或没有一个有效的窗口去运行抽取、转换程序。ETL过程不仅工作量大,而且还受到很多时间窗口的限制,它不仅需要在不同的特定(非确定)的时间抽取数据,而且还必须要在特定的时间范围内把数据加载到数据仓库。由于ETL过程是数据仓库应用系统每天都要进行的工作, ETL设计的科学性和效率性是非常重要的,关系到数据仓库项目的成败。篇二:IBM DB2信息管理解决方案概览IBM DB2信息管理解决方案概览目 录IBM DB2及信息管理市场概况 2IBM DB2在数据库及信息管理发展史中的重大

13、贡献 2IBM继续保持全球第一数据库管理软件供应商地位 3IBM交付世界最快的数据库 4IBM DB2信息管理产品和解决方案 5DB2 通用数据库 5产品概述和特点 5成功案例 7DB2 商业智能解决方案 7产品概述和特点 7成功案例 11DB2 内容管理解决方案 12产品概述和特点 12成功案例 14DB2信息集成软件 15产品概述和特点 15DB2 数据库工具 17产品概述和特点 17专题文章: IBM DB2降低企业TCO 18IBM及信息管理市场概况IBM的信息管理软件 DB2自1983年发布至今已经走过了20个年头,自发布以来,DB2已经成为支持主机关键业务应用的黄金标准,而上一个十

14、年中,我们已将DB2的领先地位扩展至开放系统平台。如今世界各地已有400,000多家公司在DB2上运行其商务应用。今天,IBM提出了“随需所取”电子商务的概念,而信息管理对于“随需所取”电子商务的重要性正如IBM的CEO Sam Palmisano所言:“客户对于基础架构的最基本的要求是能够集成跨越他们整个组织结构的数据 一个能够让客户获取整合信息的基础架构。如果公司不能获取随需应变的信息的话,它们无法成为随需所取电子商务”。此时的我们正在见证信息管理技术的一次重大的革新,即从支持单一对象,面向记录的数据库转向综合信息基础架构以传递“随需应变”的信息。IBM 信息管理团队致力于信息管理创新30

15、余载,为了满足“随需所取”电子商务时代对基础架构“整合,开放,虚拟化以及自主化”的新特点,为我们带来了新的DB2 信息管理软件: DB2不再只是一个数据库 它集成了基于开放系统,跨越多平台的数据库服务器; 扩展了为各种数据类型信息提供整合访问通道的内容管理软件; 帮助客户从以上各种数据中分析提取有价值信息的商业智能软件; 整合异构环境中的分布式信息的信息集成软件; 以及降低客户管理维护成本的自主化工具软件。新DB2为我们带来的是整合信息资源,实现随需应变的开放,智能,全面的信息管理解决方案。IBM 在信息管理发展史中的重大贡献IBM公司在计算机科学的发展史上扮演了重要的角色。而数据库管理系统,尤其是关系型数据库,更是与IBM有着不可分割的关系。关系型数据库发展史可以按时间分为以下几个阶段: 70年代关系型数据库模式的提出和SQL语言的发明、关系型数据库的发展,商业智能和e-Business的数据平台。三十多年来从理论研究到具体的系统实现,IBM研究人员对数据库管理系统的发展作出了极大的贡献。IBM在信息管理领域的专利超过260项,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 事务文书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号