计算机系统可靠性

上传人:xzh****18 文档编号:34690748 上传时间:2018-02-27 格式:DOC 页数:4 大小:21.50KB
返回 下载 相关 举报
计算机系统可靠性_第1页
第1页 / 共4页
计算机系统可靠性_第2页
第2页 / 共4页
计算机系统可靠性_第3页
第3页 / 共4页
计算机系统可靠性_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《计算机系统可靠性》由会员分享,可在线阅读,更多相关《计算机系统可靠性(4页珍藏版)》请在金锄头文库上搜索。

1、1计算机系统高可靠性研究引言:随着计算机应用水平的不断提高,计算机的依赖已经成为社会的必然。计算机的依赖即对数据的依赖,数据已成为社会文明赖以维持的重要条件。不论是在政府机关企事业单位使用的现代办公系统中,还是在保证企业正常生产的大型集散控制系统中,抑或是在代表现代制造业最新水平的柔性制造系统或计算机集成制造系统中,如何保障数据的高可靠、持续访问是我们计算机应用者必须面对的主要问题。以计算机应用和数据为中心的理论为依据,建立计算机应用系统高可靠理论与应用推广技术,保障计算机应用系统的数据高可用,避免数据灾难对社会正常秩序的严重破坏,是计算机应用高可靠性研究的主要内容,该研究具有重大的意义。具体

2、来说包括:海量数据存储系统,数据处理通道高可靠性,数据传输通道高可靠性等。系统可靠性的定义:在特定时间内和特定条件下系统正常工作的相应程度,即(degree of suitability) 。系统的可用性(availability),即利用率。可用性的平均值即平均利用率,其计算方法为:A = MTBF / (MTBF + MTTR)其中:MTBF(MeanTime Between Failures),故障间隔平均时间; MTTR(MeanTime To Repair),系统平均修复时间。当前主要容错技术:提高计算机系统可靠性主要有两种方法:避错和容错。所谓避错就是采取各种可能的技术措施避免计算

3、机在使用过程中发生错误;所谓容错就是在系统运行过程中允许某些环节发生某些错误,但是计算机给出的最终结果中不包括由于上述环节中发生的错误所造成影响。1.避错技术。2其实就是追求一种完美性。要求组成系统的各个部件、器件具有高可靠性不允许出错,或者出错率降至最低。1.1 硬件的可靠性与完美性指元器件的完美性、部件的完美性、整机与系统的完美性。例如: 电路:规范设计、电路结构、时序与竞争元器件:制造、筛选、老化、容差、寿命部件:PCB 板、布局、位置、结构、布线、焊接、安装、散热、机械性能、频率整机:整体一致、结构合理、干扰屏蔽环境:布局、强弱电干扰、静电1.2 软件的可靠性与完美性指软件的正确性、可

4、用性、完美性、兼容性。2.容错技术即在一定程度上容忍故障的技术。容错系统,采用容错技术的系统。当系统因某种原因出错或者失效,系统能够继续工作,程序能够继续运行,不会因计算机故障而中止或被修改,执行结果也不包含系统中故障引起的差错。容错技术也称为故障掩盖技术(fault masking)。 冗余技术是容错技术的重要结构,它以增加资源的办法换取可靠性。由于资源的不同,冗余技术分为硬件冗余、软件冗余、时间冗余和信息冗余。资源与成本按线性增加,而故障概率则可按对数规律下降。冗余要消耗资源,应当在可靠性与资源消耗之间进行权衡和折衷。2.1 硬件容错技术1) 系统级容错多种系统容错后备模式 双机双工热备份

5、(Mutual Backup)两机同时运行,分不同作业,各自资源负载,故障、接管、修复、交还。 主从热备份(Master/Slave)主从式(M/S ) ,M 运行,S 后备,M 故障,S 接管并升级为 M,原 M 修复后作为 S 热备份(Hot-Standby)M 运行,S 后备, M 故障,S 接管作 M,原 M 修复,S 归还 M。32) 部件级容错 存储子系统(最容易发生故障的地方) 磁盘镜像:将相同的数据分别写入两个磁盘 磁盘双联:为镜像磁盘增加了一个 I/O 控制器,形成磁盘双联,使总线争用得到改善。 RAID(独立磁盘冗余阵列)简单地解释,就是将 N 台硬盘通过 RAID Con

6、troller(分 Hardware,Software)结合成虚拟单台大容量的硬盘使用。磁盘阵列中针对不同的应用使用的不同技术,称为 RAID level,而每一 level 都代表着不同技术,目前业界公认的标准是 RAID 0RAID 5。用哪个 level 视用户的操作环境和应用而定。RAID 的采用为存储系统(或者服务器的内置存储)带来巨大利益,其中提高传输速率和提供容错功能是最大的优点。 电源:采用双电源,DC 冗余,AC、DC 全冗余。 I/O 卡:双网卡。 PCI 总线:三重对等 PCI 技术。 CPU:多 CPU 容错系统。2.2 软件冗错技术这里所讨论的软件容错主要是对计算机应

7、用软件科技人员为某一个特定的工程设计和开发的应使用软件而言。目前实现软件设计的冗余通常都采用重版本程序设计法,这如同硬件静态容错一样,是一种静态屏蔽软件可能造成错误的技术。设计思想是用 N 个具有相同功能的程序同时或先后执行某项计算,结果通过多数表决来选择。表决程序是 N 重本程序设计结构的关键。以 N 重版本程序设计的方法来实现软件设计的冗余是保证软件可靠性同时也是提高整个系统可靠性的最强有力的措施,但是这种技术措施的采用又反过来要求增加为其运行所需的硬件资源,从而加大了系统的成本和硬件设计的复杂性$另一方面也增加了系统在时间上的开销,从而使系统运行时间增加用户等待时间加长。正是由于这种原因

8、,一般情况下,如果不是在超高可靠性要求的实时系统中可以不必考虑采用这些措施。4结论社会各界对计算机系统的稳定性,可靠性问题随着计算机应用领域的扩大和规模的增加,还会提出许多新的要求。所以在过去已有基础上,继续开展这方面的研究工作,不仅具有重要的理论意义,同时也有广泛的应用价值。多年来广大计算机科技工作者为提高计算机系统的稳定性、可靠性、可维护性而采取硬、软冗余技术来增强系统的避错、纠错、容错等办法,未来将仍是我们可以遵循的技术路线。实际上众多的计算机硬软件制造商、系统集成商,在自己的计算机及其系统中通过采用双多机系统、镜象、热备份多种硬软件结合的冗余技术,大大提高了其新产品和工程系统的容错能力,使计算机的稳定性、可靠性、可维护性得到了很大的改善。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号