双机热备及高可用性技术

上传人:ji****72 文档编号:37624098 上传时间:2018-04-20 格式:DOC 页数:48 大小:178.50KB
返回 下载 相关 举报
双机热备及高可用性技术_第1页
第1页 / 共48页
双机热备及高可用性技术_第2页
第2页 / 共48页
双机热备及高可用性技术_第3页
第3页 / 共48页
双机热备及高可用性技术_第4页
第4页 / 共48页
双机热备及高可用性技术_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《双机热备及高可用性技术》由会员分享,可在线阅读,更多相关《双机热备及高可用性技术(48页珍藏版)》请在金锄头文库上搜索。

1、双机热备及高可用性技术 常见问题与方案选择?双机热备、双机互备与双机双工的区别?心跳故障检测过程说明?常见问题与方案选择对于企业重要的应用系统而言,保证系统能持续、可靠地提供服务是非常重要的,因此就 出现了对高可用性的需求和高可用性的解决方案。对于如何选择高可用性的解决方案,特别是关于双机热备的方案选择,常见的有以下问题:Q:已经采取了 RAID 技术和数据备份技术,还有必要做双机吗?A:参见:双机热备与数据备份及 RAID 的关系Q:高可用性的解决方案有哪些?A:从广义讲,高可用性包括一切避免系统服务中断的技术。而一般所说的系统高可用性, 往往特指服务器的双机或多机热备/容错。Q:什么时候需

2、要双机热备?A:决定是否使用双机热备,正确的方法是要分析一下系统的重要性以及对服务中断的容 忍程度,以此决定是否使用双机热备。即,你的用户能容忍多长时间恢复服务,如果服务 不能恢复会造成多大的影响。Q:双机热备、双机互备与双机双工三个概念都是什么意思?有什么区别?A:参见:双机热备、双机互备与双机双工的区别Q:双机热备方案与集群的区别?A:从概念上,双机热备是集群(Cluster)的一种。集群一般包括两类,一类是纯粹应用服务 器的集群,各个应用服务器都访问统一的数据库服务器,但彼些并不需要共享存储,这种 集群是比较简单的,往往采取各个服务器同时提供服务的方式,并且往往同时采用负载均 衡技术。另

3、一类是数据库服务器(或其他需要访问存储数据的系统如 Exchange、Notes)的双 机热备,这种双机热备往往是两台服务器同时使用共享的存储设备,在大多数情况下,均 是采取主、备的方式,但也有高端的系统采用并行的方式。有关应用服务的集群,请参见:谈 Web 服务器和应用服务器的负载均衡Q:数据库服务的高可用性有几种方式?A:最简单的,是采用备机的方式。这其实不属于高可用性的范围,但可以将出现故障后 恢复服务的时间控制在几十分钟的量级,而且备机平时还可用作其他用途。这种方式是一 种低成本的简单方案,对于不是非常重要的应用比较适合。它不适用于重要应用,但是除 非你的应用停上几天都无所谓,否则至少

4、要有这一级别的保护措施。第二种是通过软件方式实现双机热备。即不采用共享的存储设备,而是数据不再单点存储, 本机数据可以向多台主机做实时的数据复制。这种方式的优点是节省了昂贵的存储设备投 资。缺点是或者会产生数据的差异,或者会影响数据库的速度。比如,如果在服务中断时 切换到备机,则可能有少量已经在主机完成的事务在备机上尚未实现。而与备份数据的恢 复不同,备机启动后,后续的操作已经进行,因此丢失的事务就很难补上。因此,这种方 式适用于对于丢失少量数据不是非常敏感的系统。有关这种方式的深入探讨,可参见:镜像与 HA-数据库双机热备的两种方式第三种是基于共享存储设备和双机软件实现双机热备。这是标准的方

5、法,能够在无人值守 的情况下提供秒级的切换,并且不会丢失数据。当然,投资会比较高。Q:数据库双机热备时,双机是同时工作吗?A:在一般的中小规模应用中,数据库的双机热备都是主/备方式,主服务器工作时另一台 等待,在主服务器出现故障时借助双机软件自动切换至另一台服务器。而有些大规模应用 为充分利用设备,可以采用并行服务的方式,两台服务器同时提供服务,如 Oracle 的 RAC(Oracle Real Application Cluster)。Q:如何选择与实施系统高可用性方案?A:参见:如何选择与实施系统高可用性方案?目前,市场上主要的基于 Windows 和 Linux 平台的双机软件包括 L

6、ifeKeeper、 RosaHA、Pluswell 等。双机热备、双机互备与双机双工的区别双机热备即是目前通常所说的 active/standby 方式,服务器数据包括数据库数据同时往两台 或多台服务器写,或者使用一个共享的存储设备。当 active 服务器出现故障的时候,通过 软件诊测(一般是通过心跳诊断)将 standby 机器激活,保证应用在短时间内完全恢复正 常使用。双机互备,在双机热备的基础上,两个相对独立的应用在两台机器同时运行,但彼此均 设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应 用接管过来,从而保证了应用的持续性。这种方式实际上是双机热备的

7、一种应用。它避免 了两个应用使用四台服务器分别实现双机热备。双机双工,两台或多台服务器均为活动,同时运行相同的应用,保证整体的性能,也实 现了负载均衡和互为备份。需要利用磁盘柜存储技术(最好采用 san) 。对于数据库服务而 言,它同时需要数据库软件的支持,是比较复杂的。而 WEB 服务器或应用服务器就比较 简单了,可参见:谈 Web 服务器和应用服务器的负载均衡谈 Web 服务器和应用服务器的负载均衡本文对 Web 服务器和应用服务器的负载均衡进行说明。在负载均衡的思路下,多台服务器为对称方式,每台服务器都具有同等的地位,可以单独 对外提供服务而无须其他服务器的辅助。通过负载分担技术,将外部

8、发送来的请求按一定 规则分配到对称结构中的某一台服务器上,而接收到请求的服务器都独立回应客户机的请 求。提供服务的一组服务器组成了一个应用服务器集群(cluster),并对外提供一个统一的地址。 当一个服务请求被发至该集群时,根据一定规则选择一台服务器,并将服务转定向给该服 务器承担,即将负载进行均衡分摊。通过应用负载均衡技术,使应用服务超过了一台服务器只能为有限用户提供服务的限制, 可以利用多台服务器同时为大量用户提供服务。当某台服务器出现故障时,负载均衡服务 器会自动进行检测并停止将服务请求分发至该服务器,而由其他工作正常的服务器继续提 供服务,从而保证了服务的可靠性。上述的集群技术一般都

9、用于 Web 服务器、应用服务器等,而不是用于数据库服务器,即不 是用于有共享的存储的服务。数据库服务器将涉及到加锁、回滚等一系列问题,要复杂的 多。一般数据库服务器只是使用双机,其中一台工作,另一台备份。数据库的双机并行只 用于大型数据库中。可参见:系统高可用性与双机备份常见问题与方案选择负载均衡实现的方法有几种:最简单的是通过 DNS,但只能实现简单的轮流分配,也不能处理故障 如果是基于 MS IIS,Windows 2003 Server 本身就带了负载均衡服务。但这一服务也只是轮 流分配。 硬件方式,通过交换机的功能或专门的负载均衡设备可以实现。对于流量的分配可以有多 种方式,但基本上

10、都是应用无关的,与服务器的实现负载关系也不大。另外,设备的价格较贵(优点是能支持很多台服务器)。这种方式往往适合大流量、简单应用。 软件方式,通过一台负载均衡服务器进行,上面安装软件。这种方式比较灵活,成本相对 也较低。另外一个很大的优点就是可以根据应用的情况和服务器的情况采取一些策略。 关于负载均衡中比较高级的功能是 FailOver,即一台出现故障时,在这台服务器上正在进 行中的进程也会被其他服务器接过去。相应的成本也很高,一般是要象 WebLogic、WebSphere 软件的群集版本才支持。心跳故障检测过程说明PlusWell Cluster 容错软件在集群节点间保持着间歇的通信信号,

11、也叫做心跳信号,是错误 检测的一个机制。即通过每一个通信路径,在两个对等系统之间进行周期性的握手,如果连 续没有收到的心跳信号到了一定的数目,PlusWell Cluster 容错软件就把这条路径标示为失 效(红色) 。如果你只定义了一条通信路径,当 PlusWell Cluster 容错软件把这唯一的一条通信路径标 为失效时, PlusWell Cluster 容错软件便立即开始恢复过程。然而,如果你有冗余路径, PlusWell Cluster 容错软件能够通过第二条路径确定是系统故障还是只是通信路径有问题。 如果 PlusWell Cluster 容错软件开启优先级第二的通信路径并收到了

12、心跳信号,它就不开始 failover 恢复,只需要把第一条通信路径标成红色(失效) ,作为信号告诉你需要修复有故 障的路径。一般情况下 PlusWell Cluster 容错软件 只在下列事件发生时,启动系统恢复功能:所有的通信路径故障。如果所有节点都没能收到心跳信号, 把所有通信路径都标为失效,PlusWell Cluster 容错软件开始安全检查。安全检查失败。当所有通信路径故障时,PlusWell Cluster 容错软件向整个网络发出安全 检查信号。如果信号指出配对系统还“活”着的时候,PlusWell Cluster 容错软件不启动 Failover。如果安全检查没从配对节点返回信

13、号,PlusWell Cluster 容错软件就开始 Failover。因而,为了减少由于潜在的通讯错误所引起的不必要的系统切换,建议您使用不同介质 的多条通信路径。双机热备与数据备份的关系一些用户在规划双机热备或双机备份时,会有这样的问题:我已经有了 RAID,以及磁带 备份,还有必须做双机吗?或者,如果我做了双机备份,还有必要做磁带备份吗?应该说 RAID 和数据备份都是很重要的。但是,RAID 技术只能解决硬盘的问题,备份 只能解决系统出现问题后的恢复。而一旦服务器本身出现问题,不论是设备的硬件问题还 是软件系统的问题,都会造成服务的中断。因此,RAID 及数据备份技术不能解决避免服 务

14、中断的问题。对于需要持续可靠地提供应用服务的系统,双机还是非常重要的。只要想 一想,如果你的服务器坏了,你要用多少时间将其恢复到能正常工作,你的用户能容忍多 长的恢复时间就能理解双机的重要性了。从另外一个方面,RAID 以及磁带备份也是非常需要的。对于 RAID 而言,可以以很低 的成本大大提高系统的可靠性,而且其复杂程度远远低于双机。因为毕竟硬盘是系统中机 械操作最频繁、易损率最高的部件,如果采用 RAID,就可以使出现故障的系统很容易修 复,也减少服务器停机进行切换的次数。数据备份更是必不可少的措施。因为不论 RAID 还是双机,都是一种实时的备份。任何 软件错误、病毒影响、误操作等等,都

15、会同步地在多份数据中发生影响。因此,一定要进 行数据的备份(不论采取什么介质,都建议用户至少要有一份脱机的备份) ,以便能在数据 损坏、丢失时进行恢复。Oracle,HA 在 Unix 上双机环境的安装指南 将我们最近在 6000 上安装 ORACLE 和 HA 的东西整理了一下,希望对大家有帮助。一、环境 1、硬件环境 IBM M85 2 台 IBM 7133-D40 SSA 磁盘阵列 2、软件环境 AIX 4.3.3HACMP 4.1.1.0 ORACLE9.2.0.13、软件安装规划: 软件类别 软件名称 软件状态 备注 操作系统 AIX4.3.3 已安装 操作系统补丁 AIX PATC

16、H 已安装 补丁 10,以及安装 ORACLE 需要的 Iy30886、Iy30927、Iy31003 补丁。 热备软件 HACMP4.4.1 已安装 数据库 ORACLE9.2 已安装 4、磁盘规划: 物理硬盘 pdisk0 pdisk1 以 raid1 方式做成 hdisk2,逻辑硬盘 hdisk2 放在 vg01 卷组上,正常 工作时为 M851 服务; 物理硬盘 pdisk2 pdisk3 pdisk4 pdisk5 pdisk6 pdisk7 以 raid1+0 方式做成 hdisk3,逻辑硬盘 hdisk3 放在 vg02 卷组上,正常工作时为 M852 服务; 物理硬盘 pdisk8 作 HOT SPARES; M851 上的 rootvg 使用逻辑硬盘 hdisk0 与 hdisk1 做成镜像; M852 上的 rootvg 使用逻辑硬盘 hdisk0 与 hdisk1 做成镜像;5、IP 地址规划: 主机名 启动地址 服务地址 等待地址 M851 202.168.0.11 202.168.0.1 172.17.0.1 M852 202.168.0.12 2

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号