《精编》惠普-中国人寿IT战略规划项目灾备中心高端设计

上传人:tang****xu4 文档编号:134166667 上传时间:2020-06-03 格式:DOC 页数:56 大小:10.37MB
返回 下载 相关 举报
《精编》惠普-中国人寿IT战略规划项目灾备中心高端设计_第1页
第1页 / 共56页
《精编》惠普-中国人寿IT战略规划项目灾备中心高端设计_第2页
第2页 / 共56页
《精编》惠普-中国人寿IT战略规划项目灾备中心高端设计_第3页
第3页 / 共56页
《精编》惠普-中国人寿IT战略规划项目灾备中心高端设计_第4页
第4页 / 共56页
《精编》惠普-中国人寿IT战略规划项目灾备中心高端设计_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《《精编》惠普-中国人寿IT战略规划项目灾备中心高端设计》由会员分享,可在线阅读,更多相关《《精编》惠普-中国人寿IT战略规划项目灾备中心高端设计(56页珍藏版)》请在金锄头文库上搜索。

1、中国人寿IT战略规划项目灾备中心高端设计版本号 V3.0起草人:中国人寿IT规划项目组北京市朝阳区建国路112号中国惠普大厦(100022)电话:010-65643888传真:010-65668278版权说明本文件中出现的任何文字叙述、文档格式、插图、照片、方法、过程等内容,除另有特别注明,版权均属中国惠普有限公司咨询与集成事业部所有,受到有关产权及版权法保护。任何个人、机构未经中国惠普有限公司咨询与集成事业部的书面授权许可,不得复制或引用本文件的任何片断,无论通过电子形式或非电子形式。文档信息项目名称:中国人寿信息化战略规划文档版本号:3.0文档作者:中国人寿信息化战略规划项目组生成日期:2

2、003-12-2文档审核者:中国人寿信息化战略规划项目组审核日期:2004-3-8文档维护记录版本号维护日期作者/维护人描述0.02003/12/24刘育新目录结构1.02004/2/2刘育新初稿1.52004/2/3刘育新按照中国人寿的情况进行客户化添加恢复组织的角色和职责定义2.02004/2/5刘育新加入Francisco Tang的指导意见2004/2/7刘育新修改灾备中心的功能要求2004/2/9刘育新缩略语2.12004/2/18刘育新根据中国人寿项目小组的审核意见修改2.22004/2/24刘育新修改5.4节,灾备中心的体系架构3.02004/3/4刘育新修改灾备中心的体系架构目

3、 录1概述72灾备中心建设的策略72.1业务连续的几个层次102.1.1 高可用性102.1.2 灾备中心112.1.3 业务永续运行112.2业务影响分析122.3业务永续运行计划142.4结论203灾备中心建设的建议213.1灾备中心的建设方案213.2灾备中心建设要求223.3灾备中心的建设与数据中心的关系223.4灾难恢复基本模式233.5省市灾备中心建设243.6机房建设254灾备中心的功能要求254.1灾备环境254.2开发测试环境254.3预生产环境264.4演习环境264.5灾备中心功能示意图275灾备中心设备、网络性能要求285.1灾备中心的容量285.2恢复时间的要求295

4、.3体系架构305.3.1 灾备中心的主机、存储布局385.4灾备中心的网络415.4.1 灾备中心与生产中心之间的网络415.4.2 灾备中心的广域网架构435.5灾备中心的安全体系446灾备中心的管理体系446.1业务永续管理与中国人寿其他管理流程的关系456.2业务永续管理流程466.3计划的测试、培训和演习466.4业务永续运行计划的维护486.5恢复组组织结构图506.5.1 角色和职责517缩略语57图表目录图 21停机因素8图 22中国人寿IT高可用性环境建设线路图9图 23业务连续的层次10图 24中国人寿业务永续运行环境实施方法12图 25中国人寿业务影响分析方法13图 26

5、中国人寿开发业务永续运行计划的方法14图 41容灾中心的功能27图 51校园集群体系架构32图 52城间集群体系架构33图 53广域集群体系架构34图 54中国人寿灾备中心假设方案37图 55 灾备中心主机、存储布局38图 56 灾备中心与生产中心的数据链路42图 57灾备中心广域网逻辑架构示意图43图 61业务永续管理与ITSM其他流程的关系45图 62中国人寿永续运行管理流程概览46图 63中国人寿业务永续运行计划的维护流程48图 64灾备中心永续运行管理组构成51表 51技术手段与RPO、RTO的对应关系35表 52业务类型的服务级别分类35表 53中国人寿关键应用RTO与RPO要求(来

6、源:中国人寿IT规划项目组)391 概述 根据项目第一阶段的调查和在在中国人寿IT战略的要求,我们认为中国人寿有必要建立一个灾备中心和相应的业务永续运行计划。本文是中国人寿IT战略规划项目的高端设计之一灾备中心高端设计。其中涉及到如下问题: 灾备中心建设的策略提出了业务永续运行的概念,并建议中国人寿的灾备中心具有保证关键业务永续运行的能力 灾备中心建设的建议介绍了灾备中心建设应该考虑的问题,例如灾备中心地点的选择,技术的选择,关于省市级数据中心的灾备中心建设的考虑等 灾备中心的功能要求 灾备中心设备、网络性能要求,以及灾备中心的安全体系 灾备中心的管理体系介绍灾备中心的组织架构以及管理流程,质

7、量控制等2 灾备中心建设的策略 在信息时代,数据是企业创造商业价值的生产资料,数据的丢失将为企业带来毁灭性的灾难。 据Gartner Group的调查数据表明:在经历过大型灾难或长时间系统停运的公司中,有2/5的公司再也未恢复运行,而在其余的公司中,有1/3的公司在两年内破产。面对各种未可预知的灾难,越来越多的企业将容灾作为企业安全的保障。 根据Gartner Group在2003年9月分表的报告,由于硬件故障而导致的系统停机只占非计划停机的21。因此,减少系统的停机时间不能仅仅靠加大硬件的投入,还有兼顾其他因素,例如加强员工的教育,强化管理流程,成立专门的机构应对突发事件等。通过我们第一阶段

8、的调研,也发现中国人寿从自身的发展出发,有建立灾备中心的需求。建议中国人寿的灾备中心建设成一个能构保证关键业务能够永续运行的数据中心。图 21停机因素惠普公司在总结了大量经验的基础上提出了建设高可用性环境的5个步骤。这5个步骤将伴随建设的全过程,是一个不断循环往复的过程。这5个步骤分别是:分析,设计,建设,管理,提高。图 22中国人寿IT高可用性环境建设线路图高可用性只有通过技术,服务和最佳管理实践三者的完美结合才能达到。2.1 业务连续的几个层次 图 23业务连续的层次如图2-3所示,根据受保护对象的不同,保证业务连续运行所使用的技术不尽相同,当然,实现的成本也有较大的差异。2.1.1 高可

9、用性 可用性并不是一个模糊概念,实际上它能用数学方法来精确地表示。简单地讲,一个高可用性系统就是一个用户能随时使用的系统,例如当用户需要在早上8点到下午5点启用该系统时,该系统就应该在这段时间内保证良好的可用状态,其余的时间可以用来进行定期维修保养。可用性常被定义为实际的服务时间和要求的服务时间的比值,常用百分比表示。许多现代化系统需要一天24小时、一年365天连续不间断运转(有时也称为724或36524)。一个可用性为99.9%的36524系统一年的平均故障时间为8.76小时(525分钟),而要想让系统的中断时间在一年中只有3分钟的话,系统必须有99.999%的可用性。我们将图2-3中对应于

10、数据,应用/数据库,系统和网络的解决方案称为高可用性解决方案。我们这里所说的高可用性解决方案是指利用冗余设备在本地(机房内部)完成的,一般恢复时间在几分钟之内。在使用高可用性方案进行系统恢复时,一般只需要IT部门参与,而与业务部门无关。2.1.2 灾备中心 当遇到大规模的自然或人为灾害,例如火灾,地震等,办公场所/机房也许会遭到破坏。灾备中心就是为了应对这种情况而诞生的。灾备中心位于与生产中心不同的建筑物中,距离因容灾目的而不同。灾备中心强调的是灾难恢复功能,重点在灾难发生后。而要保证关键业务在灾难发生到灾备中心开始工作期间不中断运行,仅仅靠IT部门的力量是远远不够的,还需要各个业务部门的积极

11、参与,利用技术,服务和管理的手段才能做到。2.1.3 业务永续运行 所谓业务永续,是指在遇到严重灾害事件时(物理场所的灾难,人为破坏,自然灾害等),仍能够提供保证业务运行的环境。它包括一个持续不断的评估,计划,实现和支持流程,还要求利用必要的技术和服务来为基础架构提供支持。业务永续不是专门的技术,产品或服务。也不是高可用性,灾难恢复或者容灾的实现。业务永续运行应该包括风险评估,中断影响分析,以及避免中断策略,必须将这些因素充分考虑进综合性业务持续性计划即要根据关键性业务程序而不是技术来进行调整。然而,无论在高可用性、冗余、容错、群集和镜像策略等方面考虑得多么全面,仍然没有哪个业务持续性计划能保

12、证业务万无一失。业务永续的关键,在于了解什么业务程序在业务中事关重大,并确定影响该程序的所有因素。综合性风险分析,有助于企业做出有关应对,迁移或转移风险的业务决策。根据中国人寿的具体情况,我们建议中国人寿灾备中心的建设分4个阶段进行:图 24中国人寿业务永续运行环境实施方法2.2 业务影响分析执行业务永续运行项目的第一步就是做业务影响分析(Business Impact Analysis)。以后的基础架构设计和业务永续运行计划都是根据业务影响分析的结果。业务影响分析是确定不同业务流程对企业的影响程度。优先级的制订主要根据分析有形的和无形的影响,对停止业务时间长短的接受情况和为使影响降至最低的最

13、低需求。这些数据可以用来做制订恢复和业务永续运行策略的基础。BIA的目标: 识别和量化每个业务单元或者资源对整个企业在财务和运行方面的影响 识别潜在的失效场景和评估潜在的威胁 帮助定义针对不同的可用性/灾难恢复要求所需要的不同级别的投资情况 规定恢复策略 建立灾难恢复时的恢复流程优先级我们认为,中国人寿应该按照如下步骤进行业务影响分析:图 25中国人寿业务影响分析方法2.3 业务永续运行计划业务永续运行计划是关于一些流程的正式文件,这些流程是制订企业面对不利的意外事件时的策略和行动计划的。使用这些策略和行动计划可以使企业在预先定义的时间段内恢复关键业务的运行,从而使灾难的影响降至最小,使受影响

14、的业务尽快的恢复。业务永续运行计划是灾备中心最重要的文件之一。我们根据中国人寿的情况制订了如下开发业务永续运行计划的方法:图 26中国人寿开发业务永续运行计划的方法根据中国人寿的具体情况,我们认为中国人寿在制订和执行业务永续运行计划时应参考如下原则:原则 1: 董事会和管理层应该对其企业的业务永续运行计划准备情况负责。1. 企业的业务永续运行计划是董事会和管理层的责任。管理层应该通过对业务永续运行计划准备情况的定期验证来表明其对于风险及其消减措施的充分了解和重视。2. 验证的内容应该明确包括: 企业的准备情况以及 企业考虑到其业务活动水平、风险管理策略和在保护保险体系系统稳定性方面所扮演的角色这些因素的情况下,选择遵循本文中原则的程度 3. 这些验证应该提交给董事会。企业业务优先情况的变化可能影响到其业务永续运行计划准备的效率。所以验证应该定期进行更新。4. 越来越多的客户和合作伙伴也在寻求为其提供金融服务的企业在业务永续运行计划准备方面的保证。所以,如果适当,应该将这些验证与客户、合作伙伴以及其它有关方面共享。原则 2:企业应该将业务永续运行计划融入到日常的业务活动中使之成为良好

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号