数据质量平台V200产品规划精编版

上传人:ahu****ng1 文档编号:144668445 上传时间:2020-09-13 格式:PPTX 页数:68 大小:2.40MB
返回 下载 相关 举报
数据质量平台V200产品规划精编版_第1页
第1页 / 共68页
数据质量平台V200产品规划精编版_第2页
第2页 / 共68页
数据质量平台V200产品规划精编版_第3页
第3页 / 共68页
数据质量平台V200产品规划精编版_第4页
第4页 / 共68页
数据质量平台V200产品规划精编版_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《数据质量平台V200产品规划精编版》由会员分享,可在线阅读,更多相关《数据质量平台V200产品规划精编版(68页珍藏版)》请在金锄头文库上搜索。

1、数据质量管理平台 V2.0.0产品规划(版本V0.8),2010年08月,目录,核心概念分析 产品目标 产品定位 业务架构 数据架构 应用架构 集成架构 演进思路 工作量估算 技术架构 基础平台要求,核心概念分析,核心概念分析,目录,核心概念分析 产品目标 产品定位 业务架构 数据架构 应用架构 集成架构 演进思路 工作量估算 技术架构 基础平台要求,产品目标,远 景 目 标,业务目标: 在数据质量监控界面上集成元数据信息,实现拓扑呈现功能,提供经营分析系统数据处理状态和质量状况的全局视图; 进一步完善数据质量管理知识库,可由数据质量知识库自动产生检查规则的优化建议、自动产生数据质量问题的处理

2、建议; 进一步完善数据质量评估的应用,结合元数据信息,实现数据质量评分体系; 进一步完善数据质量对外服务功能,实现数据质量管理子系统对经营分析系统的全面技术支撑。,技术目标: 云计算特性实现:分布式、动态负载、云部署和监控; 数据质量知识库关联案例搜索,模糊查询与知识挖掘技术应用。,产品目标,近 期 目 标,业务目标: 在经营分析系统数据处理主要阶段设置数据质量检测点,支持对经营分析数据质量的全程监控,建立有效的数据质量监控机制,提供全面及时的数据质量报告,预防和控制错误范围的扩大; 完善数据质量管理知识库,积累数据质量问题及其处理过程的相关知识,为相同或相近问题的处理提供参考; 初步建立数据

3、质量评估的应用,通过评估发现数据质量潜在的问题和规律; 建立数据质量问题处理机制,有效协助处理经分域数据质量问题; 开发数据质量对外服务功能,提高数据质量管理子系统对经营分析系统的技术支撑力度。,技术目标: 模块化与组件化改造; 任务调度与业务过程解藕,复用统一的调度构件; 采集程序分布式部署。 配置数据库与数据仓库分离,采用文件数据库。,目录,核心概念分析 产品目标 产品定位 业务架构 数据架构 应用架构 集成架构 演进思路 工作量估算 技术架构 基础平台要求,在公司产品规划中定位,目录,核心概念分析 产品目标 产品定位 业务架构 数据架构 应用架构 集成架构 演进思路 工作量估算 技术架构

4、 基础平台要求,业务过程列表,实体列表,上下文图,0级DFD图,1级DFD-P1规则配置,1级DFD-P2信息采集,1级DFD-P3检查稽核,1级DFD-P4监控告警,1级DFD-P5问题处理,1级DFD-P6知识库,1级DFD-P7质量评估,1级DFD-P9对外服务,2级DFD-P1.1采集规则配置,2级DFD-P1.2稽核规则配置,2级DFD-P1.3告警规则配置,2级DFD-P3.1实体稽核,2级DFD-P3.2业务源数据稽核,2级DFD-P3.3处理过程检查,2级DFD-P3.5指标稽核,2级DFD-P4.6告警管理,2级DFD-P7.2数据质量问题状态评估,2级DFD-P7.3数据源

5、接口质量评估,目录,核心概念分析 产品目标 产品定位 业务架构 数据架构 概念模型 逻辑模型 应用架构 集成架构 演进思路 工作量估算 技术架构 基础平台要求,概念模型设计:0级E-R,概念模型设计:1级E-R,概念模型设计:2级E-R,逻辑模型图,功能数据控制关系,数据库应用分布关系,目录,核心概念分析 产品目标 产品定位 业务架构 数据架构 应用架构 集成架构 演进思路 工作量估算 技术架构 基础平台要求,数据质量管理功能结构图,数据质量管理功能层次,核心业务功能描述,规则配置:数据采集,数据稽核和告警监控,质量评估会根据预先用户配置的规则进行相应的采集、稽核、告警和相应的评估。规则定制分

6、为采集规则配置,稽核规则配置、告警规则配置,评估规则配置。 采集规则配置:采集规则配置作为采集程序执行的依据。指定采集的数据库,采集方式等,分为指标采集规则,实体采集规则,业务源数据采集规则,处理过程采集规则,核心业务功能描述,稽核规则配置:依据数据仓库、数据集市等系统的模型约束、实体属性、实体关系和实体业务特征等角度来制定相应稽核规则。作为数据稽核的依据,分为指标稽核规则,实体稽核规则,业务源数据稽核,处理过程稽核规则 告警规则配置:据数据仓库模型约束以及关系、具体业务约束指定相应的告警规则。依据告警规则发出相应的告警。分为指标告警规则,实体告警规则,业务源数据告警规则,处理过程告警规则,核

7、心业务功能描述,评估规则配置:数据质量问题状况评估是对数据质量问题及其处理情况的阶段性汇总与总结,评估过程中生成相应的数据质量问题状况评估报告供经营分析系统管理人员和维护人员分析与使用,数据质量人员根据数据质量问题状况和业务经验指定相应的评估规则,作为相应的指导。 信息采集:数据质量采集到的信息作为后续数据质量检查环节的输入,是数据质量监控的基础。信息采集分为指标信息采集,实体信息采集,业务信息采集,核心业务功能描述,指标信息采集:根据指标采集规则采集相应的指标值,这个指标含有指标账期,业务库等相关信息,数据稽核会根据采集结果是否满足稽核规则来报告异常。 实体信息采集: 根据实体信息采集规则采

8、集需要稽核的实体信息和属性信息,稽核会对实体进行主键检查,外键检查,值域检查,完整性检查,合法性检查这些操作。 业务过程信息采集:根据业务信息采集规则采集相应业务信息,从而检查分析系统各数据处理环节处理的完成情况,处理情况等信息。,核心业务功能描述,检查稽核:检查稽核部分根据预先配置的规则、算法和质量检查度量,对数据的正确性、合理性等多个角度进行检查,及时发现数据质量问题。主要包含以下内容:实体稽核、指标稽核、业务源数据稽核和处理过程检查。 监控告警:数据质量稽核完成后,数据稽核结果信息根据告警规则进行数据质量的告警,并产生相应的工单信息,对数据质量问题进行处理。,核心管理功能描述,知识库:用

9、来收集和积累有关数据及过程问题的处理经验总结,这些知识可作为今后数据质量问题解决方法和问题分析的参考。 问题处理:数据质量稽核发现问题时,能够对问题处理,生成相应的问题工单进行处理,同时能够将相关信息进行对外提供。 数据质量评估:数据质量评估是对数据质量日常管理中阶段性累积的各种信息进行汇总、梳理、统计和分析,并输出评估报告的过程。通过数据质量评估可以发现一些潜在的数据质量问题和变化规律,如指标关联波动规律和同类问题的发生规律等。数据质量评估也可能会触发相关的后续处理,例如监控规则优化和问题处理等。,目录,核心概念分析 产品目标 产品定位 业务架构 数据架构 应用架构 集成架构 演进思路 工作

10、量估算 技术架构 基础平台要求,集成关系图,集成列表,目录,核心概念分析 产品目标 产品定位 业务架构 数据架构 应用架构 集成架构 演进思路 工作量估算 技术架构 基础平台要求,演进思路,目录,核心概念分析 产品目标 产品定位 业务架构 数据架构 应用架构 集成架构 演进思路 工作量估算 技术架构 基础平台要求,工作量估算-总结,需求分析: 1 人月 系统设计: 1.8 人月 开发实现: 5 人月 测 试: 2 人月 部署实施: 0.1 人月 合 计: 8.9 人月,工作量估算需求分析,工作量估算系统设计,工作量估算开发实现,工作量估算测试,工作量估算部署实施,目录,核心概念分析 产品目标

11、产品定位 业务架构 数据架构 应用架构 集成架构 演进思路 工作量估算 技术架构 基础平台要求,技术中立架构,外部 系统,展现层,应用层,数据层,信息采集,检查稽核,监控告警,任务调度,持久化工具,规则信息,采集信息,稽核信息,告警信息,评估信息,问题处理信息,知识库信息,日志信息,规则配置,质量问题处理,质量知识库,采集结果查询,稽核结果查询,质量评估报告,数据质量咨询,数据质量交互,经分门户,元数据平台,数据集成 平台,数据仓库,业务源系统,界面 集成,数据 集成,JVM,Web Server,JVM,技术特定架构,外部 系统,展现层,应用层,数据层,信息采集,检查稽核,监控告警,任务调度

12、,Hibernate、iBatis,规则信息,采集信息,稽核信息,告警信息,评估信息,问题处理信息,知识库信息,日志信息,规则配置,质量问题处理,质量知识库,采集结果查询,稽核结果查询,质量评估报告,数据质量查询,数据质量交互,经分门户,元数据平台,数据集成 平台,数据仓库,业务源系统,界面 集成,数据 集成,JVM,WebLogic/Tomcat,JVM,Html、jQuery、Struts、Osgi、SpringDM,Osgi、SpringDM,平台架构图,数据层,逻辑层,接入层,主配置库,Web容器,规则配置,采集、检查、告警结果展示,问题处理,数据质量案例库管理,质量评估,JVM,数据

13、采集,监控告警,检查稽核,对外服务,数据采集,数据采集,详细信息存储库 (可选),技术要求,支持常用主流数据库(至少包括oracle、DB2、Teradata)的数据实体属性的采集。 支持组件化的开发与部署。 采集程序支持分布式部署。 支持采集以下多种类型的数据:文件日志、系统日志、数据库库表、通过执行脚本或系统命令获取的数据(如CPU信息和内存信息)。 问题总结过程和数据质量评估过程中输出的文档支持Text、CVS、PPT、Excel或Word等格式。 界面风格要求一致(如用统一的CSS)、界面直观易懂、易操作和人性化。,目录,核心概念分析 产品目标 产品定位 业务架构 数据架构 应用架构

14、集成架构 演进思路 工作量估算 技术架构 基础平台要求,基础平台要求,非功能指标 系统容量指标 :单JVM支持10W采集点和1W稽核规则。 系统性能指标 :略。 网络拓朴图 (略) 硬件运行环境 主机:小型机、刀片机、PC Server,至少1G内存、2CPU。 存储:取决于采集数据量,一般不超过10G。 软件运行环境 操作系统:主流unixlinuxwindows操作系统。 Web服务器:weblogic9以上或tomcat5.5以上。 JVM1.5以上。,1、有时候读书是一种巧妙地避开思考的方法。20.9.1320.9.13Sunday, September 13, 2020 2、阅读一切

15、好书如同和过去最杰出的人谈话。00:40:3100:40:3100:409/13/2020 12:40:31 AM 3、越是没有本领的就越加自命不凡。20.9.1300:40:3100:40Sep-2013-Sep-20 4、越是无能的人,越喜欢挑剔别人的错儿。00:40:3100:40:3100:40Sunday, September 13, 2020 5、知人者智,自知者明。胜人者有力,自胜者强。20.9.1320.9.1300:40:3100:40:31September 13, 2020 6、意志坚强的人能把世界放在手中像泥块一样任意揉捏。2020年9月13日星期日上午12时40分31

16、秒00:40:3120.9.13 7、最具挑战性的挑战莫过于提升自我。2020年9月上午12时40分20.9.1300:40September 13, 2020 8、业余生活要有意义,不要越轨。2020年9月13日星期日12时40分31秒00:40:3113 September 2020 9、一个人即使已登上顶峰,也仍要自强不息。上午12时40分31秒上午12时40分00:40:3120.9.13 10、你要做多大的事情,就该承受多大的压力。9/13/2020 12:40:31 AM00:40:312020/9/13 11、自己要先看得起自己,别人才会看得起你。9/13/2020 12:40 AM9/13/2020 12:40 AM20.9.1320.9.13 12、这一秒不放弃,下一秒就会有希望。13-Sep-2013 September 202020.9.13 13、无论才能知识多么卓著,如果缺乏热情,则无异纸上画饼充饥,无补于事。S

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号