容灾方案

上传人:人*** 文档编号:491650910 上传时间:2023-07-24 格式:DOC 页数:76 大小:1.75MB
返回 下载 相关 举报
容灾方案_第1页
第1页 / 共76页
容灾方案_第2页
第2页 / 共76页
容灾方案_第3页
第3页 / 共76页
容灾方案_第4页
第4页 / 共76页
容灾方案_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《容灾方案》由会员分享,可在线阅读,更多相关《容灾方案(76页珍藏版)》请在金锄头文库上搜索。

1、广东电信结算系统容灾方案维尔软件有限公司广州办事处创建日期:2006年2月21日最后修改:2006年2月23日版 本:1.0 广东电信结算系统容灾方案目 录一、项目综述11.1项目概述11.2 项目整体建设思想1二、系统容灾方案32.1容灾系统的整体思想32.1.1广东电信容灾系统实现功能目标52.1.2广东电信容灾实施服务内容62.1.3恢复演习日常工作中不可缺少的准备92.1.4广东电信容灾方案实施阶段与步骤92.2容灾系统的影响因素及数据量的估算132.3数据复制技术的选择142.3.1. 同城容灾142.3.1.1 同城容灾方案 Volume Manager镜像142.3.1.2 Vo

2、lume Manager说明152.3.1.2 Volume Manager镜像的性能192.3.2 远程容灾202.3.2.1 采用同步复制方式的分析212.3.2.2 采用异步复制方式的分析222.4系统容灾方案的设计262.4.1 容灾软件262.4.2 网络系统272.4.2.1用于数据传输的TCP/IP网络282.4.2.2基于数据远程同步的SAN网络282.4.3 数据库容灾方式设计312.4.3.1 全数据库复制312.4.3.2 只复制log312.5系统切换描述332.5.1东山口机房生产中心单服务器发生故障时的系统切换342.5.2东山口机房生产中心磁盘发生故障时的处理34

3、2.5.3灾难发生时的异地系统切换352.5.4接管后的数据从深圳向广州同步问题362.5.5 应用切回过程362.5.6 系统维护时的系统切换372.5.7 RTO和RPO的分析382.5.7.1 计划内停机382.5.7.1 计划外停机392.6网络切换描述422.6.1网络切换的原则422.6.2网络切换方案422.6.2.1 DNS方式422.6.2.2 IP方式452.6.3具体切换的步骤452.6.4切换时间分析462.7应急方案制定462.7.1应急方案简介462.7.2为什么要制定应急方案462.7.3应急和灾难恢复计划的区别472.7.4如何制定应急方案47三、采用VERIT

4、AS 容灾方案的几点补充讨论513.1 本地Cluster、同城Cluster及广域Cluster513.1.1 本地Cluster523.1.2 同城Cluster543.1.3 广域Cluster553.2 容灾数据的使用553.3 容灾数据的一致性573.4 系统升级583.5 VxVM及VVR复制对系统的性能影响59四、复制技术实现讨论614.1 同步数据容灾614.1.1基于主机逻辑卷的同步数据复制方式614.1.2基于磁盘系统的同步数据复制功能634.1.3基于主机逻辑卷磁盘镜像功能的异地磁盘镜像方式644.1.4同步数据容灾的性能分析664.2 异步数据容灾69VERITAS S

5、oftware Corporation. i 中国银联新系统容灾方案一、项目综述1.1项目概述“数据源是一切关键性业务系统的生命源泉”,随着美国911事件的发生已经使越来越多的企业管理者认识到了数据信息对自己的企业生存的影响能力,对广东电信而言,同样存在上述问题:随着企业的逐步发展,行业竞争的不断加剧,用户数量的不断增多,新业务需求的不断扩展,现有广东电信业务系统的相关数据信息的安全性和可靠性也需要在原有基础上得到进一步扩充及改进,以保证在灾难情况发生时,相关业务也能正常运行。在目前的广东电信业务系统中,系统的安全性主要是通过下面一些措施或方式来得到保证:主机通过采用双机容错方式保证系统工作的

6、可靠性和可用性;存储设备通过冗余的RAID技术保证数据的可靠性;本地的数据脱机备份技术,从而增加一份数据副本;以及相应的网络安全技术(如防火墙技术等)。但综合上述内容,以上的系统安全方式并不能保证系统在灾难情况发生时,系统的可靠性和可用性。因此,在本期系统中,我们将总体目标定为实现对广东电信现有业务系统中核心数据和核心应用结算系统的容灾备份,并确保灾难情况下业务数据的可恢复性和可用性,从而保证结算系统能够得到及时恢复。1.2 项目整体建设思想整个系统应按以下目标进行建设:1. 灾难恢复。当生产系统发生灾难事件时,能在短时间内由容灾中心接管生产中心的业务。2.可进行两级容灾(在广州本地建立同城同

7、步容灾,在深圳建立远程异步容灾)。当数据中心系统出现故障时,本地容灾中心保证数据不丢失,继续向深圳容灾中心复制;复制结束后,由深圳的远程容灾中心接管所有广州的业务。二、系统容灾方案 随着信息使用环境的日渐普及,人类对于计算机系统的依赖也日益加重。俗语说天有不测风云,人有旦夕祸福,计算机系统很有可能因为天灾或人为因素等意外事故导致系统毁坏而长期无法运行,造成整个组织或企业在营运上的重大损失以至倒闭的风险。随着网络互联方式日趋复杂,各电信运营商在网络互联及其技术实现上相互依存,使得综合结算系统变得更加复杂。各运营商之间的话务量越来越大,网间话费结算系统在电信经营服务中的地位也越来越重要。结算数据的

8、准确性和实时性,直接关系到与其他运营商的互联互通效果,关系到整个公司的收入。在服务与竞争的两大主题下,理顺与各运营商之间的结算关系,正确合理地进行企业间的费用结算,加速电信业务费用的回收是企业进行良好运营的一大重要标志。因此,针对广东电信综合结算系统这样的多业务集成在一体的业务系统,由于本系统的实时性强、影响大,其系统运行环境的好坏,运行的是否稳定、可靠、安全,对于广东电信的如此大的用户是致关重要的,他将直接影响到广大人民群众的日常生活。一旦出现无法避免的灾难而导致系统长时间不能运行,将给广东电信业务带来极大损失,并对广大电信用户带来极大影响。因此高可靠的系统运行对电信来说极其重要的。在本方案

9、中提出了可靠性较为完善的灾难恢复方案,以有效保障系统及业务遭受重大灾难后的持续运营。2.1容灾系统的整体思想广东电信是中国电信的形象门户,其业务系统的安全性直接关系到中国电信和用户的切身利益,也关系到广东电信的形象。所以尽可能地保证系统的绝对安全是必须予以考虑的。为了防范地震、火灾、水灾等自然灾害、电力中断、以及人为破坏而导致系统遭到严重损坏、失效的异常情况,我们也提出了对现有系统进行容灾备份的需求。上面提到的灾害现实发生的概率毕竟非常小,所以一律对现有系统进行简单复制的容灾方案也是不可取的。在具体研究、选择容灾方案时,不仅要在资金投入和具体容灾功能之间进行平衡,而且还应充分考量相关方面的利益

10、(实质上最终都应是保障电信自身的利益),包括用户的所有权益、电信运营商的所有权益、客户使用业务的权利、客户享受相关服务的权利等。本期工程的总体目标是实现对现有结算业务系统中核心数据和核心应用系统的容灾备份,并确保灾难情况下业务数据的可恢复性和可用性,从而进行相关应用系统的及时恢复。容灾系统的建设还包括相关条件的具备、以及管理维护机构设置和人员组织、管理维护制度和操作规程的制定等。根据上述描述,在建设广东电信结算系统的容灾系统时,需按如下原则进行规划和建设:一、在日常系统正常进行生产的时候:(1)确保日常的的关键性数据的安全的备份和存储(包括日志和数据);(2)确保灾难发生后数据库和应用系统的及

11、时恢复,包括数据在线存储的恢复;在进行数据容灾的同时,也建立数据离线备份系统(3)做好计划内切换(如系统升级和管理)和计划外切换的计划和实施方案。(4)坚持容灾备份容灾系统建设投资经济合理性的原则;(5)确保系统的可扩充性、可维护性、可操作性;(6)建立健全相应严密的管理制度和操作流程。(7)恢复演习。二、在灾难发生的时候:1.可进行两级容灾(在广州本地建立同城同步容灾,在深圳建立远程异步容灾)。当电信中心系统出现故障时,本地容灾中心保证数据不丢失,继续向深圳容灾中心复制;复制结束后由,由深圳的远程容灾中心接管所有广州的业务。2.在进行数据容灾的同时,也建立数据离线备份系统。(1) 灾难恢复。

12、当生产系统发生灾难事件时,能在短时间内由容灾中心接管生产中心的业务。确保灾难发生后主要业务运行的及时恢复,包括数据在线存储的恢复;(2)进行两级容灾(在广州本地建立同城同步容灾,在深圳建立远程异步容灾)。当电信中心系统出现故障时,本地容灾中心保证数据不丢失,继续向深圳容灾中心复制;复制结束后由,由深圳的远程容灾中心接管所有广州的业务。(3)将整个电信因灾害而导致的利益损失降低到最小程度;(4)尽量确保客户利益不受损失;(5)做好系统切换的实施方案以及出现异常情况的应急方案。另外在建设容灾系统时必须考虑以下问题:1 容灾系统应具有开放性不依赖特定硬件系统;2 应支持广泛的传输介质支持TCP/IP

13、 网络更佳;3 考虑到容灾能力和对应用系统性能的影响容灾方案不仅要支持近距的同步的数据容灾还必须能支持远程的异步的数据容灾;4 对于异步数据容灾数据复制不仅仅要求在异地有一份数据拷贝同时必须保证异地数据的完整性可用性;5 容灾系统本身应具备各种容错考虑;6 应支持灵活多样的容灾结构;7 完善容灾系统应考虑实用的灾难恢复手段。2.1.1广东电信容灾系统实现功能目标对于广东电信而言,目前的数据容灾系统是整个业务系统中的核心业务,如何保证该系统的最大可靠性和可用性,将是本期容灾系统主要解决的问题,因此我们可以将本期系统的建设目标定为:建立数据容灾备份系统,以保障灾难情况下最大程度地保护所有核心系统数

14、据的安全,同时尽量保证客户的利益不受损失。能及时恢复所有外界与系统主机的连接并正常运作;另外在平时为了保证对容灾中心的所有设备进行充分利用,在规划本期容灾系统时,必须考虑容灾中心具备承担部分业务工作的能力,如作为新应用系统的测试平台,在主生产系统进行例行维护时临时接管业务等。另外,结合广东电信现有的系统结构,我们也将在本期系统中实现以下目标:1灾难恢复。当生产系统发生灾难事件时,能在短时间内由容灾中心接管生产中心的业务。2可进行两级容灾(在广州本地建立同城同步容灾,在深圳建立远程异步容灾)。当电信中心系统出现故障时,本地容灾中心保证数据不丢失,继续向深圳容灾中心复制;复制结束后由,由深圳的远程容灾中心接管所有广州的业务。3对现有系统中的不同业务系统对应的存储孤岛,统一整合网络存储资源,构架出一个存储网络平台,使广东电信真正将存储网络的概念引入到实际的系统体系中,使每个主机都有可能去访问每一个磁盘柜的空间,使应用系统能够很灵活地分配资源,并有效地使用存储,减少企业投资成本, 实现企业投资保护。将来当需要增加应用主机时,象连接以太网那样便利;当需要扩充存储时,可以在线地增加磁盘柜或磁盘,并在线地划分、配置物理卷;4采用业界先进的可扩展式企业级交换机作为网络的核心交换,提高存储系统的高可用

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 营销创新

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号