企业产品数据管理系统本地容灾的研究与实现

上传人:luoxia****01802 文档编号:56216569 上传时间:2018-10-10 格式:DOC 页数:3 大小:30.50KB
返回 下载 相关 举报
企业产品数据管理系统本地容灾的研究与实现_第1页
第1页 / 共3页
企业产品数据管理系统本地容灾的研究与实现_第2页
第2页 / 共3页
企业产品数据管理系统本地容灾的研究与实现_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《企业产品数据管理系统本地容灾的研究与实现》由会员分享,可在线阅读,更多相关《企业产品数据管理系统本地容灾的研究与实现(3页珍藏版)》请在金锄头文库上搜索。

1、企业产品数据管理系统本地容灾的研究与实现一、引言随着企业信息化建设的深人发展, 航空企业已基本建成了包括产品数据管理系统、 企业门户系统、ERP 等多种信息化应用平台, 作为研究所信息化建设的重要内容之一的 PDM 系统已经运行多年,PDM 系统用于管理全部产品数据,包括模型与图样、技术文件、 通知类文件等,同时管理产品结构信息、流程签署信息,支持厂所协同研制。目前,航空发动机行业已构建一个行业级的协同研制平台,支持各主要研究所和承 制厂的协同研制工作,研究所作为产品研制过程的上游单位,其产生的设计数据是制造的 源头,不仅与本单位相关,同时涉及到接收数据的其他承制厂,因此数据的安全性尤为重 要

2、。但信息系统的数据是没有绝对安全的, 数据安全建设是一个复杂的过程。如何保障 应用系统的高可用性是企业信息化的一项重要内容。在进行了本地备份系统建设之后,采 用以存储镜像和集群技术为核心的数据保护方案, 实现 PDM 系统应用级数据保护,达到 数据容灾的目的。1 容灾建设的基本概念容灾类型从对系统的保护程度来分,将容灾系统分为:数据容灾和应用容灾。数据容灾,指建立一个异地或同城的数据存储系统,该系统是本地关键数据的一个 复制。在本地数据及整个应用系统出现灾难时,系统至少在异地保存有一份可用的关键业 务的数据。该数据可以是与本地生产数据的完全实时复制。采用的主要技术是数据备份和 数据复制技术,按

3、照其实现的技术方式来说,主要可以分为同步传输方式和异步传输方式。 按照传输距离划分,数据容灾又可以分成远程数据容灾和近程数据容灾方式,目前,一些 厂商能够在在 50 公里内做到同步数据传输,超过 100 公里的异步传输方式必须借助存储路 由器进行协议转换实现数据传输。应用容灾,是在数据容灾的基础上,在异地或同城建立一套完整的与本地生产系统 相同的备份应用系统。这套备份系统需要考虑备用机房、网络链路、存储、数据库、主机、 DNS、IP 地址等资源,同时还要运用包括负载均衡、集群等技术。数据容灾是应用容灾的 基础,应用容灾是企业业务连续性的目标。容灾系统的分级建设标准按照国际标准化组织定义通用 S

4、hare78 标准,容灾建设方式按投资建设成本与恢复 所需时间的不同,划分为不同的等级。我国也出台了信息系统灾难恢复规范,表 1 为国标 与 SHARE78 在各层次上的对比关系。容灾系统的关键技术指标一般以数据丢失量和恢复服务时间作为标准对容灾系统进行评价,公认的评价标准 是 RTO 和 RPO 技术指标。RTO,Recovery Time Objective,即恢复时间点目标。它是指灾 难发生后,从 IT 系统当机导致业务停顿之时开始,到 IT 系统恢复至可以提供服务和运 营之时,此两点之间的时间段称为 RTO。RPO,Recovery Point Objective,即数据恢复点目标。是

5、对 IT 系统和应用数据而言, 要实现能够恢复至可以提供服务和运营之时,系统及生产数据应恢复到哪个时间点的数据 状态。这种数据状态可以是上一周的备份数据,也可以是上一次作业的实时数据。正常情况下,RPO 和 RTO 没有必然的关联性,RPO 针对的是丢失的数据量,RTO 针对的是丢失的服务时间。关于 RTO 与 RPO 指标的确定需要综合平衡分析,首先,几 分钟恢复业务服务和几天恢复业务服务的结果是完全不一样的,企业需要明确对恢复时间 的容忍底限是多少;再从容灾本身的目的来讲,是要能够尽快地从灾备造成的破坏中恢复生产,否则就失去建立容灾系统的意义了。RTO 对成本要求高,与回报不成正比。许多时

6、 候,最佳的容灾解决方案不一定是效益最好的。2 容灾的实现本文论述的是应用级的容灾系统的实现,因为公司在信息化顶层规划中明确了公司 层面的容灾架构,本文论述的是实现本地容灾建设的实施过程,图 1 为两地三中心容灾架 构图。网络系统容灾采用双链路网络冗余技术,以提高网络的带宽和可用性。两台核心主交换机通过虚 拟化技术虚拟为一台交换机,核心交换机负责路由,所有的 VLAN 建立在核心交换机上。 多台接入交换机通过堆叠技术扩展交换机端口,简化管理,接入层交换机有两条网络链路 分别上连到两台核心交换机,当一条路断开时,可自动切换到另一条链路。两台核心主交 换机之间通过四条万兆链路组成聚合链路,以实现链

7、路互备和负载平衡。通过对四个端口 进行捆绑,并分别负责特定端口的数据转发,可以防止由于单条链路转发速率过低而出现 丢包的现象,并且在其中一条链路出现故障时,可以快速地将流量转移到其它链路,以有 效避免链路拥塞现象。采用 VPC 技术实现大二层网络架构,夸两个交换机机箱进行端口捆 绑,实现双活数据中心网络设计。如图 2 所示。数据容灾PDM 系统的文件服务用于管理系统中的物理文件,包括产品数据文件、流程审计文 件等,是产品研制的最终结果。物理文件采用系统自定义的序列号命名,需通过数据库查 询对应的图文档号。数据容灾有多种方式,包括采用存储系统的数据镜像功能,操作系统 的硬盘双写功能以及第三方软件

8、实现的数据同步等。基于存储系统的数据同步技术 存储系统镜像容灾方式基于存储系统内部的固件或操作系统,通过 IP 网络或 FC 网络等传输媒介连结,将 数据从本地存储以同步或异步的方式复制到远端存储。目前利用存储镜像方式远程数据容 灾技术有 EMC 的 SRDF、HDS 的 TrueCopy、IBM 的 PPRC 等。存储系统镜像容灾方式的略势在于其昂贵的设备成本,企业用户必须在本地和远程 灾备端分别配置一套相同的存储系统,还要购买昂贵的容灾授权;而且未来的扩展性不强, 设备淘汰一次性投资巨大。当然,存储系统镜像容灾方式的优点也很明显,一是将数据容灾与信息系统运行分 开,避免了数据容灾对主机系统

9、硬件资源的影响;另外,由于是利用镜像技术对数据快照 进行远程复制,摆脱了对网络带宽的绝对依赖,提升了数据复制速度,两端的数据差异时 间点缩小,再加上存储系统本身具备一定的容错能力,使数据容灾具有更高的可靠性和效 率,其架构图如图 3。存储系统虚拟化容灾方式存储系统虚拟化容灾方式是另外一种借助存储网关实现数据容灾的容灾架构,其形 式是在前端应用服务器与后端存储系统之间架设一个存储网关,服务器的所有的 I/O 都交 由存储网关来控制管理,技术上说就是 I/O 重新定向。虚拟化远程容灾的优点是可以整合前端异构平台的服务器和后端不同品牌的存储设 备,本地和远程灾备端的设备无需成对配置,实现了对存储资源

10、的充分利用,节约了硬件 设备的资金投入;简化了存储的管理,存储管理员可以将注意力集中在规划存储空间使用, 而不必关心存储系统底层的技术参数和物理特性,其架构图如图 4。基于操作系统技术的数据同步技术操作系统自身功能实现容灾主要通过操作系统自身的硬盘管理功能实现对数据的远程复制。这种数据复制技术要求本地和远端主机的系统是同构的,其实现方式是基于主机的数据复制,容灾方式工作 在主机的硬盘管理功能。这种方式不依赖存储设备,具有较大的灵活性和低成本,缺点是 会占用服务器的 CPU 和内存资源,对主机的性能有一定的影响。PDM 系统的卷服务可以 稳定运行在 IBM 的 AIX 下,利用 IBM 的 HA

11、CMP/XD GLVM 实现卷服务的容灾,其架构 图如图 5。第三方软件实现容灾还有很多的第三方软件可以实现数据容灾。如 VERITAS?Volume?Manager 和 Rsync 等,这些软件就是通过安装在服务器端的应用程序提供数据复制服务,远端利用 TCP/IP 网络连接服务器,实现异地数据复制容灾。采用 Rsync 软件的优点是所需的成本较低,用户不需更换现有的系统架构,便于管 理和维护,也不用担心后端存储系统的兼容性问题,其实现的架构图如图 6。数据库系统容灾PDM 系统采用 ORACLE 数据库,用于管理所有产品数据基本信息、BOM 信息、流 程信息、数据间的关系等信息。Oracl

12、e 数据库备份的时间点必须与卷的备份时间点完全一 致。Oracle 数据库可以利用 DataGuard、GoldenGate、Veritas Storage Foundation for oracle 等几种方式实现应用级容灾。Oracle DataGuard 通过将归档日志或在线日志文件从原数据库传输到目标数据库,然 后在目标数据库上应用这些日志文件,从而使目标与源数据库保持同步,DataGuard 作为 灾备实现方式后期维护简单,稳定性好。Oracle GoldenGate 通过源数据库的在线日志或归 档日志获得数据的变化,再将这些变化应用到目标数据库上,实现源数据库与目标数据库 同步,源

13、和目标数据库是双活的,在源数据库故障后,目的数据库可实现立即接管。并且, GoldenGate 可以在不同类型和版本的数据库之间进行数据复制。DataGuard 和 GoldenGate 均可以实现一对多的模式。3 容灾方案实施验证采用 Rsync 工具对 PDM 卷数据进行主机间的远程镜像,依据网络条件和文件大小 确定数据同步时间。一般首次数据镜像需要时间较长。在一个万兆主干网络、POWER6 p620、IBM V700 存储、8Gb FC SAN 的环境下,Rsync 的数据同步速度如表 2。由表 2 可以看出,随着数据量的增加,同步的时间趋于稳定,在总数据为 10TB 量 级下,增量数据

14、同步基本能够达到 8MB/s,能够满足目前业务的的需求。验证过程如下:在生产中心机房,关闭核心交换机,将稳定运转生产环境下的卷服 务器和 ORACLE 服务器关闭,模拟成服务器和网络宕机。PDM 客户端立刻不能正常使用, 在容灾机房调整 DNS 服务器指向备用服务器 IP 后,客户端可正常连接到 PDM 服务器。 由于备用 Oracle 主机利用 GoldenGate 获得了实时业务数据,而 Rsync 只在特定的时间间隔 进行数据同步,因此 PDM 中该段时间间隔内的数据为错误状态,需要进行数据库回滚。 容灾方案总体达到容灾目的,数据恢复点目标时间需改善。4 结论本文提出了一种基于数据同步软件和 Oracle GoldenGate 的异步同城灾备系统的设计 方案,以 PDM 系统为应用对象进行了实施,基本实现了应用级容灾。该系统采用的异步 在线数据复制方式,充分的利用了万兆园区网的带宽,虽然 RTO 和 RPO 两项技术指标还 有待提升,但该系统对本地主机的 CPU 性能影响较小,且整个系统以纯软件方式实现,系 统实现简单,易于管理和维护,资金投入少。在后续的工作中,将在容灾系统的运行管理、 安全性、技术调优等方面作继续深入的研究,使容灾系统真正发挥作用。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号