某银行容灾系统建设方案v

上传人:shaoy****1971 文档编号:108050510 上传时间:2019-10-22 格式:DOC 页数:67 大小:6.54MB
返回 下载 相关 举报
某银行容灾系统建设方案v_第1页
第1页 / 共67页
某银行容灾系统建设方案v_第2页
第2页 / 共67页
某银行容灾系统建设方案v_第3页
第3页 / 共67页
某银行容灾系统建设方案v_第4页
第4页 / 共67页
某银行容灾系统建设方案v_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《某银行容灾系统建设方案v》由会员分享,可在线阅读,更多相关《某银行容灾系统建设方案v(67页珍藏版)》请在金锄头文库上搜索。

1、某银行应用级容灾方案一、容灾备份中心建设模式分析某银行现已在中心机房对现有重要业务及应用部署了HACMP集群,确保不会出现因本地软硬件或系统管理维护导致的失效而引起应用和数据对用户的不可用。但本地容灾方案无法解决因火灾、自然灾害(如洪水、地震)造成对系统及应用数据的破坏。对于某银行的信息系统建设,光有本地的设备冗余和数据备份是远远不够的,如果数据中心出现非计划停机(如停电、自然灾害等),那么其下辖的网点将无法正常开展工作,必须要防范区域性灾难对系统造成的重大影响。因此应该采用本地备份和异地应用容灾相结合的保护措施,确保数据中心即使遭遇整体性故障,应用容灾中心能在很短的时间内接管所有下辖网点和相

2、关部门的业务,确保业务的整体高可用性。1需考虑的因素容灾中心建设模式的确定主要考虑以下三方面因素:(1)灾难承受程度:明确数据中心需要承受的灾难类型,系统故障,通信故障,长时间断电甚至火灾等意外情况所采取的方案不尽相同;(2)业务影响程度:明确当数据中心发生意外无法工作时,导致业务停顿所造成的损失程度,即对于IT环境发生故障的最大容忍时间,它是容灾中心系统建设的重要指标;(3)数据保护程度:是否要求数据库可以恢复所提交的交易并且要求实时同步数据,即数据的连续性和一致性,决定了灾难恢复方案规模和复杂程度的重要数据。从上述分析可以看出,在对业务影响程度和数据的保护程度要求较高的前提下,如果距离不是

3、很远(在几十公里之内),那么采用“同步”的方式最为理想。因为业界现有的技术已经可以在这样的距离之内将线路铺设成本降至最低,同时提供最大的带宽;容灾技术对于业务性能的影响也可以降低到最低(5%之内)。某银行的容灾备份系统采用应用级的同城异地容灾系统,由于生产中心与容灾中心同在某市内,数据复制的距离不是很远(在十公里到三十公里之内),因此建议采用同步数据复制方式。只有这样才能够保证数据的零丢失。同时为了保证主要核心业务系统能最快的得到接管,在主数据中心,灾备中心和下辖网点之间采用高带宽TCP/IP网络连接方式。为了确保数据中心出现紧急事件(如大面积停电、自然灾害等)发生时,确保所有业务能第一时间切

4、换到容灾中心,必需确保数据中心和容灾中心的数据实时的同步,而且确保这些数据能被容灾中心的业务在很短的时间内使用,只有这样,切换到容灾中心的客户端连接才可以正常的处理业务,根据本原则,容灾中心主要由以下两部分组成。2容灾系统组成容灾中心系统包括如下的组成部分:(1)网络容灾某银行的容灾机房建设要充分考虑系统整体网络结构和配置的容错和容灾能力,通过采取全面的容灾部署,来满足业务系统的稳定性、有效性及不间断的需求。通过在数据中心配置路由器、交换机、防火墙,广域网采用与主数据中心同一个运营商的线路。(2)应用、数据级的容灾应用、数据及的容灾基于磁盘的数据复制技术来实现。磁盘的数据复制技术指的是主备系统

5、的磁盘系统通过磁盘镜像技术来做数据复制。系统需要把主中心的全部数据盘(包括各种数据库的文件和其它数据文件)复制到备份中心。一般来讲,物理级数据复制技术包括两种方式:同步方式以及异步方式。某银行的容灾机房采用 IBM公司的metro mirror(PPRC)技术来实现应用、数据级的容灾方案。metro mirror是一种基于磁盘的同步数据复制技术,其具有以下优点: 1、 系统可较好实现数据恢复目的,在同步方式下能够保证业务持续和保障数据安全和完整性。 2、 技术成熟,数据完整性、一致性能够得到良好保障。 3、 综合使用物理级数据恢复及快速拷贝技术,系统可以提供更多任务分担如磁带备份、业务测试、综

6、合查询等。 4、 系统可用性强,系统切换简单,减低了维护和操作风险。 5、 系统提供多级保护措施如硬件冗余、自动发现错误等保证了系统的可靠性。 6、 工程实施方便,业界有大量成功案例。 二、系统总体结构1、容灾中心的功能及拓扑对于某银行数据中心与容灾中心之间的数据复制链路,为了提高在数据同步时业务的稳定,建议采用两条裸光纤直接相连,主备中心之间采用高速TCP/IP网络连接方式,通过IBM的metro mirror(PPRC)技术,实现数据的同步复制。分析某银行现在的业务结构,可以划分为核心业务、信贷、网银、中间业务平台四大块。其中核心业务最为关键,又划分为数据库系统及应用系统两部分。核心业务现

7、部署在一台高端的IBM P690(8核)主机中,其他业务分别布置在其他中低端IBM主机中。下表统计了现有业务对CPU的不同需求。业务结构对CPU的需求核心业务数据库系统5应用系统3信贷系统1网银系统1中间业务平台6根据各业务对CPU的不同配置要求,在容灾中心使用两台8核(主频4.4GHz)的Power6 P570,将上述业务分布在两台P570上。中心机房与容灾中心之间的拓扑结构如下图所示。 如上图所示,中心机房与容灾机房间通过两根裸光纤相连,每对B24交换机之间级联一根裸光纤,第一对裸纤距离在20km左右,第二对裸纤距离在40公里左右。 考虑到兼容性,容灾机房的主存储选择了与中心机房相兼容的存

8、储产品(IBM DS8700),由于需要在两地实施同步镜像,故添加了metro mirror(PPRC)及PTC(Flash copy)的授权许可。由于在容灾机房的DS8700中的远程镜像卷无法直接给主机使用,若需要让主机识别,必须为此镜像卷创建Flash copy卷,操作系统能导入该镜像卷创建Flash copy卷,并使用其中的数据,故建议选购PTC授权许可。中心机房的DS8100存储也需要购买metro mirror(PPRC)的授权许可。 上图容灾机房的蓝色阴影部分为可选配置,可以在将来添加一台高容量带库,定期实施镜像数据的备份,这样更添一份保险。本案配置了两台Power6 P570主机

9、,皆配置了8路主频为4.4GHz的POWER6 CPU,及32GB的内存。由于P570小型机支持分区,故计划将四大业务(五套系统)安装在两台P570小型机中不同的分区内。资源划分如下表:第一台P570主机(8C32G)业务结构分区的CPU数量分区的内存容量双口光口网卡数量双口HBA卡数量核心业务(数据库系统)520G22核心业务(应用系统)312G22第二台P570主机(8C32G)业务结构分区的CPU数量分区的内存容量双口光口网卡数量双口HBA卡数量中间业务平台624G21信贷系统14G21网银系统14G21 第一台P570主机的每一个分区分配了两块双口光口网卡和两块双口HBA卡。第二台P5

10、70主机的每一个分区分配了两块双口光口网卡,但由于PCIe槽位数量有限,无法为每个分区配置两块HBA卡,考虑到此系统为容灾系统,且当前配置的HBA卡都是双口,故每分区分配一块HBA卡连接存储设备亦够用了。考虑到P570主机支持动态分区功能,故两台P570采用分离背板技术,将光驱独立出来。在Power 570CEC单元中配置fc#3651 + fc#5912 + fc#3679,这样CEC单元中的6块内置硬盘全部连接到fc#5912上,光驱仍然连接到内置的SAS控制器上,实现光驱和内置硬盘完全分离,光驱可以在不同分区之间切换。 由于第二台P570需划分3个分区,但8路CPU的P570最多只有2条

11、存储SAS总线,故需要分离P570的硬盘背板。Power 570 每个CEC单元支持分离背板(split backplane)功能的选件,它能够将6个硬盘槽位分成2组(每组3个硬盘), 两个硬盘组分别使用不同的硬盘控制器。一个板载集成的,一个占PCI槽位的硬盘控制器。使用fc#5911+fc#3679,那么它们连接的3块SAS盘(第4,5,6号盘)将分配给一个分区,而主板上的6Pack中的另外3块盘和光驱将会分配给另一个分区使用。 本容灾架构的建设可满足未来几年业务增长的需要,整个结构具有非常好的扩展能力以适应业务发展的需求。当业务增加、数据传输量增大、数据处理量增大、数据存储量增大,可以通过

12、增加相应的硬件设备来实现、分布服务、高性能运行和容错、容灾。2、中心机房新增设备中心机房新购设备为2台Power6 P570小型机,4台Power4 P550小型机。两台Power6 P570小型机主频为4.4GHz,配置了16路CPU及64G的内存。在这两台P570上各划分三个分区,两台主机上的分区间做三套HACMP集群。四台Power6 P550小型机中,两台主频为4.2GHz, 配置了8路CPU及32G的内存。另外两台主频为4.2GHz, 配置了4路CPU及16G的内存。相同配置的两台主机间配置HACMP集群,因此每台P550主机都配置了两块双口光口网卡、两块双口HBA卡及一块串口卡(做

13、双机间的心跳)。3、容灾中心的业务运行状态建设容灾中心的目的是:在主数据中心全部或部分设备出现故障,导致容灾中心不能对外提供服务时,所有的数据和业务能切换到容灾中心,容灾中心能在最短的时间内接管某银行下辖所有网点的业务和中心的相关应用,将业务中断时间缩短到最小。业务从数据中心到容灾中心的切换有两种方式:一种是手动,即当主中心出现停电、自然灾害等非计划停机时,人工启动应急预案,数据库系统、应用系统、网络系统执行手工启动,同时需要网络服务提供商配合进行网络路由切换;一种是自动切换,即部署高可用软件,容灾中心实时侦测数据中心的高可用性,当数据中心出现故障时,各个系统能自动的切换到容灾中心,此时客户端

14、将通过程序配置的备用IP(容灾中心对外提供的服务访问IP)连接到容灾中心进行业务交易和处理。根据实际情况考虑建议采用手动切换的方式。根据手动切换方式的工作机制,下表分别列出了当生产中心处于正常工作状况或全部宕机状态时(业务切换到容灾中心)容灾中心所有设备和平台系统软件的工作状态:序号容灾中心设备名称生产中心正常运行时当生产中心宕机时1应用服务器设备处于正常工作状态设备处于正常工作状态2数据库服务器设备处于正常工作状态设备处于正常工作状态3数据库数据库处于未加载状态(数据中心至灾备中心的数据磁盘在做实时同步),客户无法连接数据库,也无法进行读写操作。启动数据库对外连接服务,使客户端能正常连接到容

15、灾中心数据库进行正常交易。4光纤交换机设备处于正常工作状态设备处于正常工作状态5存储设备处于正常工作状态设备处于正常工作状态4、容灾中心需要添加的设备序号设备名称规格型号数量单位1数据库服务器/应用服务器IBM POWER6 P5702台2存储设备IBM DS87001台3SAN光纤交换机IBM B242台4相关软件Licensemetro mirrorExtended FabricPTC(Flash copy)221套三、相关设备及软件介绍1、IBM power570小型机:IBM System POWER6 570Power 570的模块化构建块对大中型交易处理工作负载来说,IBM Power 570 服务器能够提供卓越的性能、主机级可靠性、不中断业务运行的模块化增长及创新的虚拟化技术。这些特性集成在一起,可以帮助企业简化增长、复杂性和风险管理工作。对于大中型数据库服务来说,Power 570专门设计用于满足最苛刻的关键后端工作负载的要求。经证实,570服务器能够跨越多个

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号