数据中台的通用体系架构方案

上传人:cl****1 文档编号:432596036 上传时间:2023-10-10 格式:DOCX 页数:11 大小:45.30KB
返回 下载 相关 举报
数据中台的通用体系架构方案_第1页
第1页 / 共11页
数据中台的通用体系架构方案_第2页
第2页 / 共11页
数据中台的通用体系架构方案_第3页
第3页 / 共11页
数据中台的通用体系架构方案_第4页
第4页 / 共11页
数据中台的通用体系架构方案_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《数据中台的通用体系架构方案》由会员分享,可在线阅读,更多相关《数据中台的通用体系架构方案(11页珍藏版)》请在金锄头文库上搜索。

1、数据中台的通用体系架构方案从数据中台的建设、运营角度出发,对数据中台在企业数据应用中的作用进行了分析,把数据中台定位为多个数据应用的共享数据平台。从数据应用及数据治理两个维度分析了数据中台的建设要素,提出了模块化、解耦的数据中台体系架构。数据中台体系架构包含数据存储框架、数据采集框架、数据处理框架。数据治理框架、数据安全框架及数据运营模块,可按照企业应用需求进行组合,能够对单个模块进行扩充,能满足大多数企业数据中台建设的需求。内容目录:0引言1数据中台系统定位2数据中台通用体系架构2.1数据存储框架2.2数据采集框架2.3数据处理框架2.4数据治理框架2.5数据安全框架2.6数据运营框架3结语

2、0、引言进入信息时代,随着数据产业的蓬勃发展,数字化建设如火如茶。“数字中国”“互联网+”等国家战略项目已在资源、可持续发展、环境、行政办公等领域取得了良好的效果。数据是资产、资源,但如何把数据资产、数据资源转化为社会收益和企业利润,还需要多方探索。当前,机构和企业不再建设从源数据采集到分析应用的烟囱式系统,更倾向于数据集中采集、存储,并应用分层建设。这种方式一方面有利于应用系统的快速部署,另一方面也保证了数据的集中管理与运营,体现数据的资产、资源属性。数据中台的出现补充了数据开发和应用开发之间因为开发速度不匹配而出现的响应力不足等缺陷问题。数据中台是国内学者提出的概念,起始于阿里的“大中台、

3、小前台”概念。阿里的中台是从管理的角度出发,以中台事业部集中数据搜索,技术及产品,数据共享等多个部门的功能。其他组织或企业建设数据中台不一定需要成立中台事业部,但是数据集中治理与提升数据价值转换效率的思路是一致的。有学者提出了一种基于数据中台的数据治理系统,他认为数据中台是一种大数据架构,用来完成数据治理。也有学者认为数据中台并非指大数据平台,数据中台完成数据治理后会形成标准数据,再对数据进行存储,进而形成大数据资产,能够为用户提供高效的优质服务。数据中台的作用已经在生产实践中得到普遍认可。阿里的线上商城离不开数据中台,运营商的项目投资建设、销售品管理及用户管理离不开数据中台,家谱管理也用到了

4、数据中台,但迄今为止没有一个通用的数据中台体系架构能指导各行业的数据中台建设。本文从数据中台建设、管理、维护的角度出发分析数据中台的核心要素,梳理出一个通用的数据中台体系架构,提高数据共享能力,减少各子系统的功能耦合度,增加功能复用率,减少软件功能的重复开发与投资。1、数据中台系统定位数据中台(DataCentral-Platform)能够用来进行数据治理,利用数据中台实现业务数据的流转,数据流向的梳理,数据质量的清洗,数据提供的能力。根据数据治理协会(theDataGovernanceInstitute,DGI)的定义,数据治理指的是对数据相关事宜的决策制定与权力控制。数据治理的目标是提高数

5、据的质量(准确性、及时性、完整性、唯一性、一致性、有效性),确保数据的安全性(保密性、完整性及可用性),实现数据资源在各组织机构部门的共享,推进数据资源的整合、服务和共享,从而提升企事业单位信息化水平,充分发挥数据资产作用。技术上,数据中台是一种大数据架构,用来完成数据治理,进而支撑线上应用系统建设,挖掘数据隐含价值。本文认为数据中台是一个物理存在的系统,是企业或机构需要建设的位于数据源与数据应用系统之间的一个中间平台。数据中台链接数据后台和数据前后,将无质量的后台数据汇集在一起,形成大数据,通过数据治理,梳理出有效的数据。数据中台是数据三层结构中的中间层,主要功能是负责数据汇集,数据治理和提

6、供数据能力三方面,为应用服务提供个性化数据服务。这里的数据中台并非指大数据平台,而是指通过数据技术对海量的数据进行采集、计算、存储和加工,并统一标准和口径。数据中台完成数据统一后会形成标准数据,然后再对数据进行存储,进而形成大数据资产层,为用户提供高效的优质服务。数据中台是众多数据应用系统中可集中建设与维护的一个共享数据平台,它是数据生产系统中的一环。数据中台一定具有大数据平台的功能,但大数据平台不需要具备数据中台的功能。数据治理是数据中台及大数据平台不可或缺的核心功能,数据中台需要专门的数据治理子系统。以通信运营商为例,其数据中台定位如下图所示。数据应用系统经营分析系统 验证系统 产品销售数

7、据中台数据治理系统数据源上网日志大数据平台信令监测办公系统图1数据中台的系统定位2、数据中台通用体系架构数据需求千人千面,企业数据应用不断更新迭代,企业的中台系统也需要不断变化,因而,有些学者认为无法创建统一、规范的数据中台模板供其他企业借鉴与使用,企业需根据自身业务的需要,构建适合于本企业发展的数据中台。但是从数字系统的核心任务分析,数据中台一方面对大量上层数据应用系统公共数据处理的部分功能集中建设,另一方面对数据进行治理,利用算法挖掘数据中的隐藏价值,提升数据质量并开放给其他数据应用系统,所以一个通用的数据中台至少应满足数据应用的中间处理与数据治理。从数据处理与数据治理两个维度出发,本文设

8、计了一个解耦的数据中台体系架构。该数据中台体系架构具有一定的柔性,可按照企业应用需求进行组合,或者对单个模块进行扩充,能满足大多数企业数据中台建设的需求。数据中台的通用体系架构如图2所示。该中台体系架构以减少功能冗余和提高功能复用为原则,把数据中台解耦为6个能够分别独立建设、演进的功能子系统。数据结构与数据处理子系统是数据中台体系架构的核心,数据治理是提升数据价值的重要手段。该数据中台体系架构的通用性表现在以下几点:(1)该数据中台体系架构综合考虑了数据中台的各种要素,参考这个架构进行建设能够有效提升数据资产价值,提供数据及服务的共享。(2)参考这个数据中台体系架构,企业能够一次规划、分步实施

9、,首先建设处理子系统及数据存储子系统,然后根据业务发展需求,逐步补充数据采集、数据安全及数据治理子系统。(3)该数据中台由6个解耦的子系统组成,企业在立项建设时能够灵活组合,每个子系统单独招标建设,也能够把多个子系统合并招标建设。数据安全 安全门卢安全态势安全能力计装数据处理 数据架构日志收集 日志理点任务调度流程监控 任务管理 异常处理处理工具处理流程数照抽取AI分析数据转换批姓理散据装线源经理消显风列数据查询酒息堆积数据交换密码管理数据清洗密匙管理加解密算法APT报入采集用户权限接口权网数据定级数据配载数据治理 据 且数据开放运营管理数据库采集流式果集日志告警民虫采集认证策略TP 采华日志

10、管理运营图2数据中台体系架构示例数据中台通用体系架构包含数据存储框架、数据采集框架、数据处理框架,数据治理框架、数据安全框架及数据运营框架等六大多数。2.1数据存储框架数据中台的核心是数据,数据通过采集系统获取,然后数据经过处理框架加工,并接受数据治理框架的管理,同时也要接受数据安全管理框架的管理,最后开放的价值数据将通过数据运营框架对外提供数据服务。数据中台的数据架构应该独立规划,并采用合理的技术架构对不同类型的数据进行存储。数据存储框架中,无论数据采用对象存储、块存储还是数据库存储技术,各种中台数据可按照上图所示分类管理,对于不同数据的存储技术本文不再讨论。源数据主要由采集框架进行管理,数

11、据治理框架按照数据特征把数据简单分为结构化和非结构化数据两大类,而规范化分域数据则是数据治理框架对全量数据的规范化分域整理。宽表数据是数据关联的结果,利用宽表数据能够对人、事、地、物、组等对象进行完整的数据画像,同时宽表数据也能够作为上层模型数据的中间层数据。元数据和标签数据都是对数据的描述,其中元数据用来对数据的客观属性进行表示,标签数据更倾向于管理者对数据的主观表述及等级划分,比如质量等级标签、安全标签、属性标签等。主数据需要在各系统间频繁更新、交换,且需要独立的存储空间进行维护管理。2.2数据采集框架数据中台的采集框架应对纳入数据中台的各种源数据进行统一采集管理。数据采集框架中应提供多种

12、数据采集方式,如文件传输协议(FileTransferProtocol,FTP)采集、数据库采集、接口应用程序(ApplicationProgrammingInterface,API)接入采集、流式采集及网络爬虫采集。同时采集框架应按照数据采集规范对源数据进行预处理,从而去除明显不需要的数据及多余数据,并对采集过程进行管理。虽然数据中台的体系架构没有统一模板,但各企业数据采集框架基本一致。2.3数据处理框架数据处理是每个数据应用的基本环节之一,经典的数据抽取、转换和加载(ExtractTransformLoad,ETL)处理流程在数据采集预处理、数据整合、数据建模等多个地方均要使用。单独建设数

13、据处理框架有利于数据处理工具组件的集中开发与管理,也有利于数据中台数据处理任务的协调与调度。数据处理框架专门负责数据处理相关的任务,包括批处理、流处理、人工智能(ArtificialIntelligence,AI)分析、数据清洗、数据交换及查询,此外数据处理的相关工具组件可在处理框架中配置。任务调度模块在数据处理框架中处于居中指挥的作用,并对运行的数据处理任务进行监控及异常处理等操作。2.4数据治理框架广义的数据治理不但包含提升数据价值的内容,如数据管理、数据目录、数据质量等,也包含数据安全管理及数据共享服务。数据安全管理与数据价值提升是一个矛盾体,如果由一个厂商或开发团队进行数据安全管理及数

14、据价值提升相关软件的开发,则开发者的操作难免有所偏向,而且矛盾不容易公开,少了冲突也就少了优质的解决方案。另外,数据共享与数据治理的其他内容也存在相同的问题。所以,本文建议数据中台的数据治理框架中不包含数据安全与共享的相关内容。数据治理框架包含数据目录、数据管理、模型管理、数据质量等4个模块。数据地图、数据资产目录、知识图谱及数据血缘的主要作用是为展示数据的属性及相互关系,所以都纳入数据目录模块。数据模型能提高数据中台对外部应用需求的反应能力,固化的中间模型数据需要专门管理。模型管理包括模型目录、模型血缘及模型地图等。数据管理又能够细分为元数据管理、主数据管理、标签数据管理及源数据管理。数据质

15、量管理模块按照制定的数据标准及数据稽核规则对数据中台中的数据进行质量管理。2.5数据安全框架数据已经成为数据资产,数据安全框架是数据中台必不可少的组成部分。数据安全叠加在数据中台其他功能框架之上,数据采集、处理、交换、共享等每个环节均必须实施安全控制策略。安全框架能够分为日志管理、用户认证、权限管理及加解密等几个功能模块,此外安全全门户也能够对外提供安全能力封装,展示数据中台的安全态势及安全视图。2.6数据运营框架数据中台的核心功能是综合众多数据应用的数据处理及数据治理功能,集中建设、集中管理、减少冗余、增加复用。数据中台的最终目的还是为其他应用或开发者提供数据服务,而对外数据服务功能将直接面向不确定的外部对象,所以单独建设数据运营,一方面有利于针对外部用户提供针对性功能;另一方面,数据运营模块作为用户与数据中台核心数据服务之间的中间层,能够有效隔离外部用户直接控制、接触核心数据及应用,可保护数据中台的安全性及内部功能的稳定性。综合以上因素,数据运营应配置运营门户、能力开放、数据开放及运营监控等功能。(1)运营门户:对数据中台管理者提供管理门户,对开发者提供开

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题 > 初中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号