数据脱敏大数据架构设计

上传人:公**** 文档编号:460735630 上传时间:2023-07-22 格式:DOCX 页数:4 大小:127.27KB
返回 下载 相关 举报
数据脱敏大数据架构设计_第1页
第1页 / 共4页
数据脱敏大数据架构设计_第2页
第2页 / 共4页
数据脱敏大数据架构设计_第3页
第3页 / 共4页
数据脱敏大数据架构设计_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《数据脱敏大数据架构设计》由会员分享,可在线阅读,更多相关《数据脱敏大数据架构设计(4页珍藏版)》请在金锄头文库上搜索。

1、数据脱敏大数据架构设计紫金新闻 发布于 2019-03-28需求背景系统有数据识别、数据脱敏逻辑,支持可配置规则,自定义等,需要进行异构数据同步,大 数据量。现在针对以下几个需求进行讲解1、支持冗余设计2、支持任务自动分发,支持自动负载均衡3、支持随时扩容节点而无需关停原有的系统和业务架构和模块架构图谥取韻抠同岁曲务罂指版进戦数据同歩阪劳逗行培興握吿脱敏扩展性架构图五核心模块及其主要功能 调度平台 使用 Nginx 方式来调用数据中心,通过注册中心获取数据中心的服务列表 可以合理的根据数据同步的情况,去调用服务;比如数据同步可能存在的顺序性,执行延时; 读取控制台 DB 的配置信息,定时执行数

2、据同步任务 对数据同步的调用,可以按照简单的轮询方式,也可以根据数据同步服务器的性能情况,进 行负载均衡 数据同步负责执行数据库异构数据同步任务,可支持增量,全量模式,用DataX框架来实现 服务于调度平台的调用 会存储数据同步的执行结果,供控制台进行展示会上报服务器的性能指标到数据同步DB,以供调度平台参考 控制台配置管理界面,服务于用户进行数据同步任务的配置信息,并存储到控制台DB中; 数据识别 负责针对数据库的数据进行数据识别任务 数据脱敏 按照内置规则、自定义配置,负责脱敏数据 可提前进行数据脱敏,以供数据同步转换环节调用三个辅助服务发现模块 注册中心 用于服务发现和注册 数据同步注册

3、实例并定期报心跳 可以用 zookeerper 来实现 调度平台通过域名访问注册中心获取数据同步的地址列表 Nginx 和域名系统配合,协助调度平台访问注册中心获取数据同步地址列表 和域名系统配合,协助用户访问控制台进行配置管理可用性分析高可用通过Nginx、注册中心来实现,可以支持动态扩容。每个主要模块都是以 无状态集群方式部署的,各自模块都可以通过注册中心来实现服务注册,模块之 间的调用服务发现来获取,并以域名方式实现。考虑到扩展,所以设想的方案是尽可能的做到每个服务职责单一。这样的拆分,也是考量到每个环节的瓶颈都不一样,目前预估不是很精确,这样 可以为后续扩展提供方便性。数据脱敏、数据识

4、别需要单独独立出来,原因:本身的服务不在数据同步中,可 能提前预处理进行。通过集群部署方式,支持冗余设计。调度平台、Nginx集群通过数据同步性能情况,实现任务自动分发,支持自动负 载均衡。可用性分析可用性表格分析场景影响降级原因某台数据 同步下歩无影响教据冋步无状态调痘干甘重连其他的数据同步服努所有数据 同步T统调度平台无 法执行数据 同步任务控制台lh常运行;调度 平台把数据同步任务放 入执行钦列,等待执行某个Ngirrx 下尢影响多Ngiri工部書数据完全同步 注册中心、控制台域名iiiSSLB 自动切换到其他存活的NgiriJt控制台 DB宕机调度中心无 影响控制 台无法更新 配置调度平台开启配菁缓存 后(对配置的读取不受 数据库宕机影响某台数据 识别、数 据脱敏卞无影响数擔识剔、数据脱敏无状态”数 据同步重连其他的数据识别.数 据脱敏同步服务全部数据 识别、数 括脱敏下数据同步可执行 会彫响任务时长无彩晌结论 数据同步、控制台、调度平台、数据识别、数据脱敏是数据脱敏的几大核心微服 务模块,相互协作完成配置中心业务功能,Nginx、注册中心是辅助微服务之间 进行服务发现的模块。采用微服务架构设计,架构和部署(部署方式可以用容器思路来操作)都有一些 复杂,但是每个服务职责单一,易于扩展。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号