文档详情

双机热备系统方案

汽***
实名认证
店铺
DOC
268.50KB
约24页
文档ID:457469760
双机热备系统方案_第1页
1/24

深圳宝德科技股份有限公司 双机热备方案 1.方案设计原则 22.双机热备系统 22.1方案描述 22.2 方案拓扑图 32.3功能特点 42.4双机热备份(Hot Standby)系统架构 42.5 宝德双机热备系统设计特点 52.5.1 高可靠性、高可用性设计 52.5.2 良好的可扩展性 63.产品配置推荐 64. PLHA 75.PR2310N—部门/企业级2U机架式服务器 105.GS-4020S智能化的磁盘存储系统 156 宝德集团简介 187宝德服务体系介绍 207.1 宝德科技标准服务承诺 207.2 其他服务项目与说明 217.3 特别提醒 221.方案设计原则双机热备系统方案设计应该充分结合当今最先进的网络技术,加上最安全、有效的方案设计,构造一个拥有极佳性能、高度集成的开放网络系统平台在进行系统设计时,考虑到遵循以下原则:高效性、先进性选用目前国际上技术先进、智能化的网络设备,以及宝德优质服务器及配套产品、高效的应用服务和完善的售后服务体系,保证信息系统的通信速度、通信效率,满足用户对应用系统优化、网络速率要求越来越高的需要。

可靠性、稳定性信息系统运行的稳定性、可靠性是该系统的非常重要的指标,特别是在网络应用中,双机以及备份系统的可靠性、稳定性应该是系统建设的出发点和归结点,所以在设计方案时,必须在充分体现方案技术先进性和成熟性的前提下,保证系统和所选用的设备应具有较高的可靠性和稳定性设计中要把先进技术与现有成熟技术结合起来,充分考虑应用的现状和未来趋势高可扩充性、管理性随着技术的发展及应用水平的不断提高,网络带宽、网络速率等方面的需求发展的日新月异,现在的设计方案应能充分考虑到用户未来一段时间内应用扩展的需要,以高扩展性、易管理性为指导,在保护用户投资的前提下方便用户未来进行升级、扩充,最大范围的保护用户的软、硬件系统的投资2.双机热备系统2.1方案描述双机热备是计算机应用系统稳定、可靠、有效、持续运行的重要保证它通过系统冗余的方法解决计算机应用系统的可靠性问题,并具有安装维护简单、稳定可靠、监测直观等优点当一台主机出现故障,容错软件可及时启动另一台主机接替原主机任务,保证了用户数据的可靠性和系统的持续运行双机热备的目的在于保证数据永不丢失和系统永不停机,采用服务器RAID控制器可保证数据永不丢失,采用双机热备份软件可保证系统永不停机。

应用服务器系统方案由两台高性能服务器组成,每台服务器配有一定容量硬盘,用于安装操作系统、数据库软件,应用软件和双机软件等,服务器通过一内部局域网相互通讯当主节点服务器发生软硬件故障时,这台服务器上的服务将被另一节点服务器自动接管,保证了应用不间断2.2 方案拓扑图主服务器和备服务器通过网络线缆和串口线相连,专门用于两台服务器的心跳检测、数据同步链路,不再占用客户端与服务器通信时的网络资源正常情况下,由一台PR2310N作为主服务器处理业务和数据,另一台PR2310N作热备份服务器存储采用宝德的GS-4020S磁盘阵列,通过SAS线缆连接两台服务器和GS-4020S,构成DAS直连式存储服务器数据存储于GS-4020S中主服务器PR2310N发生软件和硬件故障后,备份服务器PR2310N自动接管主服务器的业务和数据备份服务器可同时自动接管主服务器的主机名(Host)及网络地址(IP)等信息访问主服务器的客户(Client)可以继续运行,无需要重新启动机器主服务器修复好以后,再将备份服务器上的作业和数据切换到主服务器如果备份服务器PR2310N发生故障,则主服务器也可自动侦测到,并发出报警信号,提示用户将备份机修好并重新加入双机系统中。

2.3功能特点两台服务器工作于主从模式,一台服务器当主机,另一台当从机主机处于工作状态,从机处于监测状态当主机发生故障时,从机在很短的时间内自动接管主机的工作 自动实时将数据保存在两台主机上,自动监测工作主机的状态,并自动对错误的发生作出相应处理,当某些导致工作主机无法继续处理业务应用时,自动将用户系统切换至另外一台机器上切换发生时,自动使新主机接管原来的用户连接、数据库进程、应用进程等,无需人工干预 留有用户自定义程序接口,方便用户自行定义监控的项目,自定义切换前后,将自动执行的关闭进程指令集合及启动进程指令集合系统将按用户的定义于切换前在原主机上执行相应的关闭进程指令集,于新主机上执行相应的启动进程指令集 支持真正的连接与分离(两台主机通过网络连接,可以支持带电的连接与分离),利于用户的系统维护等操作 与用户的应用系统无关,用户可以不加修改的使用他们的应用,对用户的应用透明 双机热备系统在很好解决了数据可靠性的同时,真正将作为网络核心的服务器端风险分散到了两台服务器上,使的整个网络系统的可靠性大大提高,并且性能稳定,运行可靠,维护简单、方便,性能/价格比高2.4双机热备份(Hot Standby)系统架构所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standby Server),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机可尽早通知系统管理工作人员解决,确保下一次切换的可靠性)。

当工作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断地运行(Non-Stop)当工作机经过维修恢复正常后,系统管理人员以人工或自动的方式将备份机的工作切换回工作机;也可以启动监视程序,监视备份机的运行情况,此时,原来的备份机就成了工作机,而原来的工作机就成了备份机切换时机(Take Over)——系统软件或应用软件造成服务器宕机——服务器没有宕机,但系统软件或应用软件工作不正常——服务器内硬件损坏,造成服务器宕机——服务器不正常关机双主机通过一条TCP/IP网络线以及一条RS-232串口线相联 •主机A为Master,主机B为Slave •主机A处理作业和数据,主机B作为热备份机 •主机A故障后,主机B自动接管主机A的作业和数据 •主机A的作业将在主机B上自动运行 •主机A的客户(client)可继续运行,无需重新登录 2.5 宝德双机热备系统设计特点2.5.1 高可靠性、高可用性设计高可靠性和高可用性是各种信息中心各系统的基本要求,同时也是软件系统对硬件平台的要求它涉及到从点到面的设计,包括系统架构、体系结构、服务器、存储设备、操作系统和数据库等大的方面,也包括RAID卡、光纤HBA卡甚至连接电缆等各个方面的具体细节。

服务器平台高可靠、高可用设计对系统键应用,理论上要求时24小时不间断进行,但是实际运行中造成的停机的情况可以分为两类:1.计划停机:这种停机往往是不可避免的,只是可以控制停机的时间段,如因为软件升级、硬件升级或者更换、系统检修等情况2.非计划停机:也就是故障停机,这种停机不可避免但是可以减少,时间无法控制,对企业造成的危害也最大故障分为软件故障和硬件故障,统计表明,80%以上的故障是因为软件故障或者系统管理管理,而这里有大多是因为认为操作不当造成的宝德服务器作为硬件平台,其优越的服务器管理系统PSMS保证了硬件平台的稳定性,为整个系统的可靠性提供了更加强有力的保障完善的系统资源和故障的监测和处理系统:能及时将故障屏蔽,实现系统的高可用性各类应用程序处于系统运作的中心地位,一般包括数据库服务、教学资源服务应用及核心文件/打印服务等功能当任一节点出现硬件或软件故障时,当前运行在该节点上的应用会由集群服务功能转到其它无故障的节点并被重新启动确保各类应用程序在需要的情况下处于状态2.5.2 良好的可扩展性随着网络的发展,对系统可能会有更高、更全面的要求,所以要使系统具有良好的可扩展性,我们可以从两个方面来考察:系统结构方面:扩充数据库服务器,可以在各种平台下来构建一个集群数据库环境,同时共享光纤通道的磁盘阵列数据。

扩充应用服务器,利用Linux或Windows的集群功能来构建一个负载均衡的应用环境,这个时候,从整个设备层次上消除的单点故障,整个系统的可用性进一步提高从服务器和磁盘阵列:本身的可扩展能力来看,相对目前的配置,仍然有非常大的扩展空间,来满足以后的发展要求3.产品配置推荐项目推荐产品型号推荐产品配置主服务器PR2310NCPU:1×四核英特尔处理器X5570 2.93G/8MB cache/6.4GT/s硬盘:2 × 1000G/7200rpm/32M/ SATA2/企业级内存:16G(4*4G) DDR3/ECCSATA接口薄DVDN系列勉工具导轨,软驱仿真盘P209三年标准(5*8)现场响应备服务器PR2310NCPU:1×四核英特尔处理器X5570 2.93G/8MB cache/6.4GT/s硬盘:2 × 1000G/7200rpm/32M/ SATA2/企业级内存:16G(4*4G) DDR3/ECCSATA接口薄DVDN系列勉工具导轨,软驱仿真盘P209三年标准(5*8)现场响应存储阵列GS-4020S16*1TB 3.5英寸 7.2K RPM SATAII1*LSI SAS HBA3801E卡双机软件PLHA1* PLHA for windows4. PLHAPLHA是一套提供防止业务主机因不可避免的意外性或计划性宕机问题的高可用性软件。

它使联入网络的两台服务器具有近乎无差错的容错能力,保证交易业务的高可靠性PLHA基于服务器、磁盘阵列服务器和双机高可用软件为平台的高可用系统解决方案通过软、硬件的紧密结合为用户提供了具有单点故障容错能力的系统平台,在服务器发生故障时它们的数据和应用系统依靠容错能力,可以实现故障自动切换,保证系统7*24小时不间断运行,避免因停机而造成的损失 PLHA可配置成两种工作模式:“Active/Active”或“Active/Standby”在Active/Active模式中,两台服务器分担不同工作负载,如果其中一台服务器故障,另一台服务器将自动承担所有的工作负载;在Active/Standby模式中,一台服务器承担工作负载,另一台服务器处于备份状态,如果主服务器故障,备份服务器将自动接管所有的工作负载备份服务器监视工作服务器的运行情况,工作服务器也同时监视备援服务器是否正常,确保下一次切换的可靠性 PLHA具有HA双进程冗余的机制,服务器之间心跳的冗余机制(最多3条),供客户端访问的公网网络的冗余机制等特性,为避免单点故障风险提供了具备各种冗余功能的标准配置 PLHA基于GUI及CUI的管理工具,提供了直观简便的Cluster管理和操作环境。

支持多种操作系统(Windows/Linux/SCO/Solaris),在操作系统必须一致的情况下,各服务器的硬件配置规格不受限制.主要特性: 负载均衡: 在Active-Active模式下,应用可分配在两台服务器上运行,提高网络效率; 自动侦测: 允许两台服务器之间相互监控,任何造成工作中断的故障,PLHA侦测到异常,故障机制立刻执行,如不能在本地解决或者恢复,所有资源将转。

下载提示
相似文档
正为您匹配相似的精品文档