容错服务器应用

上传人:油条 文档编号:1270938 上传时间:2017-06-04 格式:PPT 页数:41 大小:6.53MB
返回 下载 相关 举报
容错服务器应用_第1页
第1页 / 共41页
容错服务器应用_第2页
第2页 / 共41页
容错服务器应用_第3页
第3页 / 共41页
容错服务器应用_第4页
第4页 / 共41页
容错服务器应用_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《容错服务器应用》由会员分享,可在线阅读,更多相关《容错服务器应用(41页珍藏版)》请在金锄头文库上搜索。

1、Stratus Confidential,1,连续可用的解决方案,美国容错技术有限公司,Stratus Confidential,2,关于Stratus Technologies,1980 - 硬件级容错计算机系统厂商Stratus成立(位于美国波士顿)1981 - 首先推出基于硬件的容错计算机系统1986 - 建立世界上第一个提供24小时服务的远程服务网1990 推出世界上第一个容错的 UNIX 操作系统 - FTX1991 - 推出 RISC 结构的 XA/R 系列容错计算机系统1995 - 推出 RISC 结构的 Continuum 系列容错计算机系统1997 - 推出容错的 HP-UX

2、 操作系统2001 - 推出世界上第一台 Windows Server 平台硬件容错服务器 ftServer2003 推出支持Windows Server 2003 和Stratus ftLinux的工业标准容错服务器2005 -推出支持 RedHat Linux Enterprise 的容错服务器,全球化公司,具有世界上最可靠服务器技术和解决方案,Stratus Confidential,3,容错服务器的特性,通过种种技术实现高达99.9997%的连续可 用性.而HA cluster是99.99%的可用性支持热插拔主板和CPU及内存等关键性部件;即使硬件损坏也不会宕机;能有效的保护动态数据和

3、硬盘数据;甚至Windows系统打补丁也不需要重起机器;单软件映象使后期维护成本几乎为零;容错的设计理念是避免停机,而双机cluster设计是减少停机时间.,Stratus Confidential,4,Vernon Turner, IDC当我们有避免停机的方案时为什么还要选择减少停机的方案呢?,Stratus Confidential,5,用户成本比较,$,$,Windows 2003 x 2,2套主机系统,集群部件以及存储阵列,应用程序和中间件 x 2,系统维护以及停机损失,应用程序和中间件 x 1,集群软件,简单的单机管理,Win2003 x 1,Rapid Disk Resync,St

4、ratus ftServer 方案,1套ftServer,Stratus 透明OS增强结构,传统Cluster集群方案,TCO 比较,Stratus Confidential,6,WestJet,为什么选用Stratus客户希望核心应用系统能够稳定、可靠地连续运行,在系统运行时间里不能有丝毫的停顿和错误。 Stratus 能向用户提供业界最高的安全,计算可靠性及系统可用性。有效避免Cluster的故障和复杂性,同时Stratus可管理性使得系统的实施和维护变得轻松简单,有效降低管理维护集群系统时的成本。 竞争对手Cluster方案 结果用户采用Stratus方案。,Stratus Confid

5、ential,7,Stratus 改写规则: 为Windows 环境提供99.9998% 的可用性,“对业务繁忙的数据中心和相对有限的IT资源, ftServer 3300 系统提供了相对于如cluster的高可靠方案更加具有性价比和易于管理.如果配合服务,那将更加如虎添翼”PC Magazine,“IDC 坚信:对不允许宕机和对价格有所关注,该服务器相对于传统的解决放案是一个更加有效和节省的方法. IDC,“Stratus ftServer 基于Windows系列产品对各类规模的机构提供了能够负担的起并容易实现的容错解决方案. Maggie Scarborough: Senior Analy

6、st Financial Insights,Stratus Confidential,8,ftServer+Windows的实际运行结果,Public ftServer Availability Uptime MeterSM(See ),99.9998%,Stratus Windows 2000/2003 向用户提供超过当今任何 Unix 系统的稳定运行,Stratus Confidential,9,技术合作伙伴,基于 OS 可用性特征的合作内存再同步强化驱动程序企业关键应用的支持方式ftServer W 系列产品安置在 Redmond 测试实验室,共同决定处理器的使用程序更早得到最新处理器f

7、tServer W系列产品安置在 Intel实验室,ftServer W系列产品安置在 EMC 认证实验室 CLARiiON产品的转销合作支持方式,Stratus Confidential,10,Stratus: 确保系统最大运行时间的最佳方法,通过各种方法来保护系统的最大运行时间,Stratus Confidential,11,Stratus连续处理 技术 (一),Stratus Confidential,12,LockStep Technology,Continuous Processing Systems,Stratus Confidential,13,ftServer W 系列体系结构

8、,同步锁定 CPUs,多路径 I/O,模块方式实现,消除单点故障单一软件映像零切换时间,6600,4300,4600,5700,2400,Stratus Confidential,14,Stratus连续处理 技术(二),Stratus Confidential,15,软件屏蔽瞬间硬件错误强化驱动程序预防软件故障广泛综合和错误插入测试准确捕捉,分析和纠正软件问题内存和磁盘数据保护,故障防范!,故障安全软件机制,软件可靠性,预防、诊断、和解决软件问题,Stratus Confidential,16,Stratus连续处理 技术(三),Stratus Confidential,17,自动的故障检测

9、和隔离集成的故障”回叫”和远程支持 Stratus 和第三方的合作支持系统非工作状态的管理能力,技术激活的服务方式,ActiveService 体系结构,在问题引发系统停顿前检测和报告错误,故障防范,ActiveService体系结构,Stratus Confidential,18,ActiveService 体系:自动获得可用性,热插拔部件非常容易更换,系统自动同步更换的部件,系统正常处理贯穿整个更换过程!,系统自动订购正确的更换部件,部件故障. 系统隔离错误并通知 Stratus 有CPU 故障,Stratus Confidential,19,可用性动员全球性 24 x 7 电话支持准确的

10、故障隔离,部件派发Stratus 驱动 OS 问题解决Microsoft 金牌认证合作伙伴100% 可用性计划,24 x 7关键性系统支持,Stratus Confidential,20,Stratus ftServer W 系列家族产品,工业标准基于Intel 处理器 Windows 服务器Microsoft 硬件兼容性列表,4410家族,财务能负担的入门级服务器,具有最强可用性和处理能力的企业级服务器,2 路4核,6210家族,2510 家族,应用不停顿,性价比领先的应用服务器,1-路4核,1- 2 路4核,Stratus Confidential,21,容错概念,按时间划分的故障的分类永

11、久性故障 permanent永远持续下去直至修复为止间歇性故障 intermittent短暂的,但却是断续的,既有其偶然性,又有其不定期的重复性偶然性故障 transient暂时的,且可能是非重复性的间歇性故障和偶然性故障占所有现场失效的90%消除其影响是容错技术研究的重点课题,Stratus Confidential,22,服务器可用性级别的概念,International Date Corp. (IDC),AL4-关系到整个企业甚至公众的关键应用AL2-3-关系到企业和政府的日常运行AL0-1-关系到计算机的应用和普及,Stratus Confidential,23,服务器可用性级别的定义

12、,可用性度量,Availability vs. Downtime,*IDCs Levels of Availability Spectrum,Stratus Confidential,25,不同技术的可靠性对比,容错服务器,独立服务器,使用外部磁阵的独立服务器,简易的集群系统,消除单点故障的集群系统,大型主机,Stratus Confidential,1. 一套系统级共享资源,协同工作以保障重要服务。2. 硬件与软件组合以减少停机时间。3. 服务恢复快速,但不是恒定的。,Stratus 区别:系统结构设计目的为消除,而不是减少停机时间,结构设计差异,Stratus Confidential,2

13、7,逻辑架构差异,CPU/Memory,CPU/Memory,I/O,I/O,Disk,Disk,Stratus 硬件容错服务器,CPU/Memory,CPU/Memory,I/O,I/O,Disk,Disk,传统Cluster 集群系统,Stratus Confidential,28,Cluster 会如何呢?,I/O,CPU,1+1=?,MEM,2,I/O,CPU,1+1=?,MEM,2,Disk,0100010110100010101010111010111010010110001100011101,X,1+2=3,CPU、内存和等待I/O的所有数据丢失,数据库、应用、文件系统都没有被安

14、全关闭,需要时间等待备机检测到故障发生,需要时间进行磁盘组切换、需要时间进行文件系统检查,需要时间重新启动应用程序,需要重新进行一些运算以回到断点,需要时间重新启动数据库并进行数据库修复工作,系统 A,系统 B,Stratus Confidential,29,Passive Backplane,SSP,SSP,SNP,SNP,I/O,I/O,正常工作的容错机,CPU,CPU,1+1=?,1+1=?,MEM,MEM,2,2,Disk,Disk,所有运算在不同板上同时进行,I/O 板,CPU/MEM 板,Stratus Confidential,30,当CPU板出问题时,Passive Backp

15、lane,SSP,SNP,I/O,I/O,CPU,CPU,1+1=?,1+1=?,MEM,X,Disk,Disk,SNP,SSP,2,MEM,2,任何一块CPU板上的任何部件损坏,都不会影响系统的正常运行。正在进行的运算和操作会象没发生问题一样继续下去。,I/O 板,CPU/MEM 板,Stratus Confidential,Detect Failure,Package Script Starts,Database Started,Database Recovery,恢复总时间 = 基本系统恢复时间 + 数据库恢复时间 + 应用程序恢复时间 + 网络恢复时间,与容错 CA不同,通用Cluster 集群系统的恢复时间直接依赖于客户的具体环境!,Stratus环境的可预测性与Cluster恢复时间的不确定性,最重要的是:切换并不一定总是成功!,Stratus Confidential,32,CA vs. HA,通用HA,容错CA,故障出现,故障恢复,动态数据丢失.等待恢复,Stratus Confidential,33,与传统方案的价值比较,Stratus Confidential,34,Stratus 的客户市场,全球大企业都信赖Stratus,Stratus Confidential,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号