abfqyz双机热备

上传人:hs****ma 文档编号:560311673 上传时间:2023-09-10 格式:DOC 页数:13 大小:337KB
返回 下载 相关 举报
abfqyz双机热备_第1页
第1页 / 共13页
abfqyz双机热备_第2页
第2页 / 共13页
abfqyz双机热备_第3页
第3页 / 共13页
abfqyz双机热备_第4页
第4页 / 共13页
abfqyz双机热备_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《abfqyz双机热备》由会员分享,可在线阅读,更多相关《abfqyz双机热备(13页珍藏版)》请在金锄头文库上搜索。

1、-懒惰是很奇怪的东西,它使你以为那是安逸,是休息,是福气;但实际上它所给你的是无聊,是倦怠,是消沉;它剥夺你对前途的希望,割断你和别人之间的友情,使你心胸日渐狭窄,对人生也越来越怀疑。罗兰双机热备第一章 双机热备概述一、 双机热备需求随着信息化建设的不断推进,企业的信息化已经非常普遍,各个企事业单位的活动越来越多的依赖于其关键的业务信息系统,这些业务信息系统对整个机构的运营和发展起着至关重要的作用。如果一些关键应用一旦发生宕机故障或应用停机,将给企业带来巨大的经济损失,并且由于业务的不可用而影响了企业的信誉,致使客户对企业失去信任,所造成的危害是致命的。非正常的服务终止时间的长短会对用户造成不

2、同的损失,或者说用户对服务停止所能承受的时间是不同的。通常取决于应用的类型,如果能够在几秒钟内修复错误,不会对一个在线联机事务(OT)处理系统构成影响,但是对火箭发射等实时应用,哪怕只停止一秒都是不可忍受的。 由于系统的任何一个部件都可能发生故障,因此系统设计师在构建系统时需要能够预见到系统可能会发生的各种故障,并进行软硬件的部署,在这些故障后发生能够迅速纠正。可见,对那些需要保障信息安全和提供不间断的信息服务的企业而言,业务系统的容错性和不间断性显得尤为重要。如何保障各种关键应用持续运营,达到永续经营的良性循环,已成为当今企事业单位和IT领域急需解决的关键问题。二、 服务宕机的必然性通常企业

3、构造服务的硬件环境为单一服务器配置模式,一旦因为计划中宕机和计划外宕机,便会引起服务终止。计划中的宕机通常指完成系统升级、应用迁移、部件更换等操作引起的宕机,这些计划中的宕机是企业维护服务正常工作不可避免的工作项目,虽然可以人为地采取一些措施减少损失,但依然会造成服务的终止。计划外宕机通常是由于系统出错造成的。错误包括硬件、软件、系统和网络,或是系统运行外部环境原因等,这些情况包含了:硬件故障、操作系统崩溃死机、硬盘满、电压不稳、跳电、电源损坏、网络故障、软件漏洞(Bug)、应用出错。同样人为失误造成的故障也称为出错.当然,并非所有的出错会造成宕机,也不是所有的意外宕机都是由于部件出错造成的,

4、灾难或其他意外情况同样会造成服务终止。计划外宕机通常会导致非常严重的后果,比如酒店的入店和结帐系统故障,所有的客户将无法heck-in和ek-ou;医院的电脑系统出错,将导致患者无法结账、医生无法得到患者信息,甚至无法进行手术;银行的记帐系统因电脑出错,客户将无法提现和存款。总之,机会外宕机所造成的损害将非常大。有些环境下,系统停止服务将导致事务处理无法进行,必将导致客户对企业信任度降低,甚至会给客户带来不可挽回的损失.三、 双机热备解决方案通常,对于服务因错误造成的不可避免终止,企业都会安排相关的管理人员进行定时的监控,一旦发现服务不可用,便会立即进行处理排错。这是非常原始的双机热备解决方案

5、,存在诸多问题,譬如及时性问题,一旦错误在深夜发生,而人工不可能2小时监控;再譬如处理时间长短不可控,一旦错误造成的原因非常复杂,排错非常困难,需要非常长的时间,那么服务的终止将非常长。在排错过程中,人为操作失误将可能导致系统的永久瘫痪.另一方面,为了维持系统的双机热备而配备操作人员,劳务费用也非常昂贵。目前,市场上提供多种双机热备解决的软件解决方案.主要原理是在提供硬件冗余的系统基础之上,运行高可靠性软件而构成.双机热备软件自动检测服务的运行状态,一旦服务在主机上出现故障,双机热备软件将自动地把服务转到另一台服务器上,从而让服务持续可用.对系统应用状态的监控和服务故障的恢复,由双机热备软件自

6、动完成,减少了人员的负担。四、 双机热备工作原理(一)、 双机热备硬件配置双机热备环境中,硬件是要求冗余的,包括两台服务器(我们称这种环境为双机容错),每台服务器拥有足够的I/O能力、内存容量、系统硬盘空间、网卡部件,使得配置能够在使用中符合系统的需求,并能够最大限度的降低系统停机时间。存储系统通常也必须是冗余的,例如,将数据存放在RAD5磁盘阵列中.当一个硬盘发生错误时,数据仍然可以正常访问,而且可以从其他硬盘中恢复出这个硬盘的内容(称为RAID重建).图1双机热备的硬件拓扑结构 双机热备的硬件拓扑结构如图1所示。服务器:主服务器和备份服务器运行同一版本的操作系统,但其硬件配置可以不一致,主

7、服务器为提供服务的服务器,备份服务器平时不提供服务,只有主服务器出现问题时,其能够接替主服务工作的服务器。私网:用于在服务器之间传输clster的信息网络结构,其主要是支持T/P协议的以太网和光纤网。公网:供客户端访问服务的网络,客户端可以通过公网访问到每台服务器。共享存储:每个服务器都能访问的存储设备,同时也是服务数据存放的地方,一般采用磁盘阵列,为了对数据进行冗余保护,可根据客户需要做不同的RAI级别数据保护。磁盘阵列的接口形式可以是iSCSI、FC、AS、NS等。(二)、 双机热备工作原理每台服务器都接上磁盘阵列,客户的应用程序或数据都放入磁盘阵列中,客户通过浮动的IP地址访问服务。客户

8、的服务平时在主节点上运行,当主节点出现故障(硬件故障如:网卡,卷,磁盘等出错;软件故障:应用不可用)时,第二台备用服务器自动接管其工作(即带入磁盘阵列的卷,接管浮动IP地址,最后启动应用。因此,一台服务器节点出现故障后,其他服务器可接管其服务,从而保证整个系统对外服务的正常,为企业4小时36天的关键业务应用提供了强大的保障.(1) 心跳信息原理主备机通过心跳路径,周期性地发出检测数据包。如果主机出现故障,备机在规定的时间内没有收到来自主机的检测包后,会认为主机可能出现故障;这时备机自动检测设置中是否有第二条心跳途径,试图在第二条和主机建立心跳通信.如果第二条心跳途径同样失败后,备机则根据已设定

9、的策略,启动备机的相关服务,完成服务的切换。(2) 浮动I工作原理浮动P指客户端访问服务的IP地址,这个浮动IP地址挂载受到双机热备软件的控制。正常情况下,由主服务器对外提供服务,双机热备软件把此I地址挂载到主服务器上.当主服务器出现故障后,服务发生切换,双机热备软件会自动把该IP地址挂载到备份服务器上,用户访问的仍然是浮动I地址.所以用户只会在切换的过程中发现有短暂的通信中断,经过一个短暂的时间,就可以恢复通信.(3) 切换条件l 主机的硬件发生故障,譬如主机主板故障、主板掉电。l 主机的操作系统发生故障。l 运行于主机的服务出现故障.l 主机的公共网络发生故障。当发生以上故障时,双机热备软

10、件会及时检测到这些故障,主动把服务切换到相应的备份主机上。(4) 切换过程服务切换过程主要是把服务从主服务器上切换到备份服务上。首先,在主服务器上主动释放相应的资源,主要步骤是:1.执行正常的服务关闭程序,这样可以保证服务的完整性及数据的安全,而且也不会再有其他服务器执行此项服务。2释放共享磁盘,以便备份服务器能够访问共享磁盘。释放浮动IP地址,这样便可保证不会再有其他服务器使用此IP地址。其次,由备份服务器接管相关的资源:1。获取存有服务的共享磁盘分区并系统检测与恢复,此过程可进一步保证在服务异常中断时共享磁盘的完整性。2在备份服务器网络挂载浮动的P地址,客户端会重新连接到原来的IP地址。这

11、样,用户再去访问服务时,就没有必要再去重新配置或做修改。3重新启动服务.(5) 切换时间影响因素切换时间受多种因素的影响,主要由3个方面决定: 启动服务的实际时间,与环境配置的复杂性和数据库存储数据量相关,往往客户实际配置比较复杂,数据库比较庞大,因而启动服务就比较长;2共享磁盘阵列的挂载,当磁盘阵列的文件系统出现问题同时数据比较多时,挂载该分区时做文件系统检测就比较长;3. 停止服务实际时间,其所受各种环境条件的影响和启动服务一样。第二章 ErneCuter双机热备的功能特点一、 应用双机热备提供双机热备解决方案是双机热备的核心功能,能够保证企业的核心业务2小时不间断运行。 二、 自我修复能

12、力在集群系统的每一台服务器内,双机热备具有两个核心进程,他们互相监控(如:系统宕机、双机热备进程被杀掉、网络、SCI线缆是否断开),如果其中一个进程失败,另一个进程会立即进行恢复。三、 支持多条心跳路径支持网卡(私网/公网)、磁盘心跳等多种心跳方式,多重保障心跳检测途径,配置多条心跳路径可以避免系统的单点故障,进一步提高了系统的可靠性。四、 共享磁盘的锁定软件管理共享磁盘上的数据,以防止多个服务器在同一时间访问数据。双机热备在逻辑设备级(卷)上控制对数据的访问,管理员可以不必担心群中的其它服务器访问数据时,可能会带来的数据访问冲突。双机热备自动在被应用程序定义为共享资源的磁盘卷上设置SSI-/

13、SI-持久保留。当被保护的应用程序由一个服务器被移动/转换到另一个服务器时,双机热备控制这些锁定,以保证激活服务器对共享卷的访问.在主系统发生故障的情况下,次节点系统将能够在磁盘上建立SCSI 锁定,并在备份的系统上将资源投入使用。五、 本地失败恢复在应用软件的检测时间间隔执行检测,以察看资源本身是否失效。如果快速检查和深入检查均局部告失败,系统将根据用户设定的策略尝试局部恢复资源。如果尝试成功,资源将不会向下一优先级的节点进行失效切换.如果局部恢复尝试失败,系统将向下一优先级的节点进行失效切换。六、 本地网卡失败转移在主服务器上,可以加上另外一个NIC作为主服务器的备份I。当主N 出现故障时

14、,双机热备将可切换的IP地址让由本地的备份 NIC 接管,本地资源不需要切换,有效的减少的切换时间。七、 支持种工作模式支持传统的单活(Acvessiv)、双活(te/Active).八、 支持自动迁回当首选节点发生故障后又恢复正常,如果允许自动迁回,备份节点在指定的恢复时间窗口内将资源组切换回首选节点运行;禁止自动迁回时,资源组将保留在备份结点上,管理员可在合适的时间手工切换。九、 直观的GUI用户界面提供直观的GU用户界面,用户可以交互式地对不同的集群系统进行配置、监控和远程管理,实时地显示出主机系统及服务的状态,大大减少了系统因用户人为的错误而引起的损失,同时基于向导形式的设定界面简化了

15、系统安装,配置工作。十、 支持定制开发双机热备可以结合用户需求,开发特定应用或硬件资源的监控程序,与用户应用环境更紧密地结合,更好的监控服务运行状态.第三章 Eenluter双机热备应用规格一、 软硬件规格(一)、 支持各种类型服务器支持DELL,HP,Pwereader,IBM,浪潮,联想等X86架构的所有服务器,各个节点的服务器类型和硬件配置可以不一致。(二)、 支持各种类型的存储设备可利用SAN , SCS, 既存的资源进行系统配置,支持各种类型的磁盘阵列,包括Infortren,P,IBM,SUN,HD等。(三)、 支持的操作系统平台目前双机热备支持id系列和Linux系列的操作系统平台,下面是具体支持的操作系统平台:l Windos系列操作系统n Windows 2000 系列n Windows 2003 系列n Windws 08 系列l Linu系列操作系统n RdHat Eterprs Linu.。/5。0n Suse Liu eprise 8./9.100(四)、 提供丰富的应用软件支持支持多种应用的双机热备,并能与重要的应用如数据库:Mcroso

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号