文档详情

数据中心解决方案设计之灾备方案设计设计

s9****2
实名认证
店铺
DOC
555KB
约17页
文档ID:497797897
数据中心解决方案设计之灾备方案设计设计_第1页
1/17

数据中心解决方案之灾备方案设计1.数据中心容灾备份解决方案随着社会的开展和科技的进步,政府日常工作越来越依赖于数据处理来进展,政务系统的连续性依赖于数据中心系统的稳定运行然而,灾难就像灰尘一样伏击在运营环境周围,政务系统的数据中心可能正在一个充满风险和威胁的环境下运行如果不能对风险采取有效治理,一旦数据由于某种原因丢失,就很有可能对政府的日常工作造成严重的影响如果核心数据丢失,将会使得某些核心功能陷入瘫痪,造成不可估量的损失因此,保证政务的连续性和数据的高可靠性和可用性,已经成为政府部门在数据中心建设中,必须要考虑的问题1.1灾备解决方案原如此首先,在制定容灾系统方案的过程中要考虑的就是容灾系统建设对原有业务系统带来的影响比如,采用数据复制技术对系统I/O带来的延迟,应用数据同步对日常业务处理系统带来的压力等因此,企业要通过周密的测试和分析来躲避容灾系统建设时带来的风险,以保证业务系统不会因容灾系统的建设而出现在处理性能上下降的问题第二,数据状态要保持同步为保证在灾难发生时,业务可以成功地切换到备份中心,就必须保证容灾系统数据同步机制的可靠性因此,建立可靠的数据同步校验机制是必须的; 同时,还要考虑建立定时的、自动的数据同步核查比照机制,以检验两个中心数据的一致性,这是数据容灾工作中非常重要的一局部。

第三,容灾系统的日常维护工作要尽可能轻,并能承当局部业务处理和测试的工作容灾系统的维护和管理是容灾切换成功的重要保证,在系统建设中,就必须要考虑系统的维护管理流程生产中心任何业务处理过程的改变都必须完整地复制到备份中心; 所有新业务系统上线时,必须通知备份中心,并在备份中心配置好数据同步机制; 对原程序的改动也必须保证两个中心同时上线第四,系统恢复时间要尽可能短容灾系统主要是为了实现在主中心系统发生灾难时,可以在规定时间切换到备份中心,保证数据不会丢失,并且继续向用户提供服务但往往在灾难发生时,主要技术人员不能与时到达现场,为了顺利实现系统间的切换,应该让系统切换操作尽可能地简单; 并建立固定化的、标准化的切换流程,要求维护人员在切换演习时严格按照流程的指导步骤进展操作第五,可实现局部业务子系统的切换和回切当人事变动、业务变化、IT设施变化以与其他可能引起恢复规划文档失效的变化发生时,应与时更新各恢复规划文档,并在必要时启动模拟测试或演习,确保业务连续性系统的工作能力第六,技术方案选择要遵循成熟稳定、高可靠性、可扩展性、透明性的原如此目前,国际上比拟成熟的容灾技术包括: SAN/NAS技术、远程镜像技术、虚拟存储、基于IP的SAN互连技术以与快照技术等。

其中基于IP的SAN远程数据容灾备份技术应用比拟广泛,其是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备份中心的SAN中的当备份中心存储的数据量过大时,可利用快照技术将其备份到磁带库或光盘库这种基于IP的SAN远程容灾备份,可以跨越LAN、MAN和WAN,本钱低、可扩展性好基于IP的互连协议主要包括FCIP、iFCP、InfiniBand、iSCSI等第七,构建系统方案可以选择多种技术组合方式目前,业内应用较多的容灾方案是基于智能存储系统的远程数据复制技术,它是由智能存储系统自身实现的数据远程复制和同步,即智能存储系统将对该系统中的存储器I/O操作请求复制到远端的存储系统中并执行由于在这种方式下,数据复制软件运行在存储系统内,因此较容易实现主中心和容灾备份中心的操作系统、数据库、系统库和的实时拷贝与维护能力,且不会影响主中心主机系统的性能如果在系统恢复场具备了实时数据,那么就可以做到在灾难发生时,与时开始应用处理过程的恢复但这种方案也有开放性差(不同厂家的存储设备系统一般不能配合使用)、对于主、备中心之间的网络条件(稳定性、带宽、链路空间距离)要求较苛刻等缺点。

1.2灾备解决方案设计需要考虑的因素RTO〔RecoveryTime Object〕:是指灾难发生后,从IT系统宕机导致业务停顿之刻开始,到IT系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段成为RTORTO是反映业务恢复与时性的指标,表示业务从中断到回复正常所需要的时间RTO值越小,代表容灾系统的数据恢复能力越强各种容灾解决方案的RTO有较大差异,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTORPO〔Recovery Point Objective〕,是指从系统和应用数据而言,要实现能够恢复至可以支持各部门业务运作,系统与生产数据应恢复到怎样的更新程度RPO是反映恢复数据完整性的指标,在同步数据复制方式下,RPO等于数据传输延迟的时间;在异步数据复制下,RPO根本为异步传输数据排队的时间在实际应用中,考虑导数据传输的因素,业务数据库与容灾备份数据库的一致性〔S〕是不同的,RPO表示业务数据库与容灾备份数据库S的时间差发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量设计容灾系统不能只看RTO和RPO,对于不同的业务系统和用户特殊的要求,其它一些指标有可能成为选择容灾解决方案的主要因素。

例如,某些地区为了防X一些特定自然灾害的风险,要求容灾备份中心与业务中心保持足够的距离,在这种情况下,容灾备份中心与业务中心的距离要求就是容灾系统的重要指标通信网络是容灾系统的组成局部,通信线路的质量也是容灾系统的性能指标之一,其中包括网络的数据传输带宽、网络传输通道的冗余和网络服务商的服务水平〔网络年中断率〕如果容灾系统使用的通信网络是确定的,为了比拟不同容灾解决方案,可以用单位存储容量的数据库在同一通信网络上的数据完全恢复时间作为一项设计指标业务连续性是灾备方案的最终目标,是方案的价值所在为了保证业务的连续,首先需要数据的连续,之前我们讨论了数据安全相关的内容其次,在数据连续的根底上,出现灾难时,系统需要能够满足〔1〕网络切换〔2〕应用切换以此,来保证系统能够顺利切换到灾备地,继续安全运营,最大化保证客户利益1.3国标系统灾备等级划分与应对措施国家《信息系统灾难恢复规X》〔GB/T 20988-2007〕规定了六个级别的容灾,下表分别针对每个级别给出了相应的应对措施级别内容措施Level6数据零丢失和远程集群支持实现远程数据实时备份,实现零丢失;应用软件可以实现实时无缝切换;远程集群系统的实时监控和自动切换能力;Level5实时数据传输与完整设备支持实现远程数据复制技术;备用网络也具备字哦那个或集中切换能力;Level4电子传输与完整设备支持配置所需要的全部数据和通讯线路与网络设备,并处于就绪状态;7*24运行;更高的技术支持和运维管理;Level3电子传输和局部设备支持配置局部数据,通信线路和网络设备;每天实现屡次的数据电子传输;备用场地配置专制的运行管理人员;Level2备用场地支持预定时间调配数据,通信线路和网络设备;备用场地管理制度;设备与网络紧急供货协议;Level1根本支持每周至少做一次完全数据备份;制定介质存取/验证和转储的管理制度;完整测试和演练的灾难恢复计划;1.4容灾技术分析(1)冷备份备份系统未安装或未配置成与当前使用的系统一样或相似的运行环境, 应用系统数据没有与时装入备份系统。

一旦发生灾难,需安装配置所需的运行环境,用数据备份介质〔磁带或光盘〕恢复应用数据,手工逐笔或自动批量追补孤立数据,将终端用户通过通讯线路切换到备份系统,恢复业务运行优点:设备投资较少,节省通信费用,通信环境要求不高缺点:恢复时间较长,一般要数天至1周,数据完整性与一致性较差2)温备份将备份系统已安装配置成与当前使用的系统一样或相似的系统和网络运行环境,安装了应用系统业务定期备份数据一旦发生灾难,直接使用定期备份数据,手工逐笔或自动批量追补孤立数据或将终端用户通过通讯线路切换到备份系统,恢复业务运行优点:设备投资较少,通信环境要求不高缺点:恢复时间长,一般要十几个小时至数天,数据完整性与一致性较差3)热备份备份处于联机状态,当前应用系统通过高速通信线路将数据实时传送到备份系统,保持备份系统与当前应用系统数据的同步;也可定时在备份系统上恢复应用系统的数据一旦发生灾难,不用追补或只需追补很少的孤立数据,备份系统可快速接替生产系统运行,恢复营业优点:恢复时间短,一般几十分钟到数小时,数据完整性与一致性最好,数据丢失可能性最小缺点:设备投资大,通信费用高,通信环境要求高,平时运行管理较复杂在计算机服务器备份和恢复中,冷备份服务器〔cold server〕是在主服务器丢失的情况下才使用的备份服务器。

冷备份服务器根本上只在软件安装和配置的情况下打开,然后关闭直到需要时再打开温备份服务器〔warm server〕一般都是周期性开机,根据主服务器内容进展更新,然后关机经常用温备份服务器来进展复制和镜像操作热备份服务器〔hot server〕时刻处于开机状态,同主机保持同步当主机失灵时,可以随时启用热备份服务器来代替对于关键的业务,Primeton建议采用同城热备+异地热备的方式进展部署,对于一般性的业务,建议采用同城热备+异地温备〔应用不启动,数据保持异步复制〕的方式进展部署目前数据复制技术主要有如下表所列4种,基于红色字体局部的要求,结合客户的需要,Primeton推荐采用基于存储或者基于应用程序的数据复制技术来进展数据同步根本原理数据的复制过程通过本地的存储系统和远端的存储系统之间的通信完成复制技术是伴随着存储局域网的出现引入的,通过构建虚拟存储上实现数据复制通过操作系统或者数据卷管理器来实现对数据的远程复制数据库的异地复制技术,通常采用日志复制功能,依靠本地和远程主机间的日志归档与传递来实现两端的数据一致平台要求同构存储与平台无关,需要增加专有的复制服务器或带有复制功能的SAN交换机同构主机、异构存储与平台无关复制性能高高高较高资源占用对生产系统存储性能有影响对网络要求高对生产系统主机性能有影响占用局部生产系统数据库资源技术成熟度成熟成熟度有待提高,非主流复制技术。

成熟成熟投入本钱高,需要同构存储较高,需要专有设备较高,需要同构主机一般局部软件免费,如DataGuard复制软件IBM PPRCEMC SRDFHP CA〔Continues Access〕HDS TrueCopyBrocade Tapestry DMMUIT SVMEMC VSM 原厂技术:IBM AIX LVMHP-UINX MirrorDiskSun Solaris SVM专业的复制软件:Symantec SF/VVROracle DataGuardOracle GoldenGateDNT IDRDSG RealSyncQuest SharePlex重复数据删除技术是指将存储系统中存在的大量内容一样的数据删除,只保存其中一份,从而缩减存储空间的技术在云灾备中,该技术既能大幅减少灾备中心存储的数据量,降低灾备中心的建设和运维本钱,又能大幅减少数据备份和恢复过程中用户和灾备提供商间的数据传输量,提高备份和恢复的性能,是一项十分重要的技术随着灾备中心的规模不断增大,存储的数据量和访问量不断增加,单一节点上的重复数据删除方法已不能满足性能和容量的需求除上述根本重。

下载提示
相似文档
正为您匹配相似的精品文档