数据中心供电系统设计理念的变化

上传人:wt****50 文档编号:49821907 上传时间:2018-08-03 格式:PPT 页数:50 大小:2.80MB
返回 下载 相关 举报
数据中心供电系统设计理念的变化_第1页
第1页 / 共50页
数据中心供电系统设计理念的变化_第2页
第2页 / 共50页
数据中心供电系统设计理念的变化_第3页
第3页 / 共50页
数据中心供电系统设计理念的变化_第4页
第4页 / 共50页
数据中心供电系统设计理念的变化_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《数据中心供电系统设计理念的变化》由会员分享,可在线阅读,更多相关《数据中心供电系统设计理念的变化(50页珍藏版)》请在金锄头文库上搜索。

1、数据中心供电系统 设计理念的变化2010年2月目录目录一 新的NCPI设计理念的形成过程-供电系统设计理念的变化二 新的设计理念对机房建设、供电系统设计、设备功能和选用配置标准,以及设计和设备提供厂商定位影响近近5 5年来对网络基础物理设施提出的问题年来对网络基础物理设施提出的问题1 生命周期成本问题:优化投资问题、装配速度问题、服 务费用问题、投资风险问题2 适应性和扩展性问题:系统和部件的标准化与规范化、不可预测的功率密度问题、如何适应不断变化的其他需求3 系统可用性问题:人为操作失误问题、如何把UPS与关键负载之间的故障点减至最少、减少大面积断电的故障点、谐波干扰问题、信息共享问题4 管

2、理性问题:分路管理问题、监控负载机柜的电源状态、线缆管理的问题、预防性故障分析的问题5 维护服务问题:降低系统的复杂性问题、减少平均维修时间MTTR的问题、带电操作的问题、供应商之间的相互推诿的问题一,新的一,新的NCPINCPI设计理念的技术形成背景设计理念的技术形成背景-供电系统设计理念的变化供电系统设计理念的变化1 研究工作从单台UPS设备向整个供电系统变化2 对系统可靠性的研究向可用性研究变化3 从对单纯的供电系统研究向整个IT基础物理设施(NCPI)变化4 提高UPS供电系统的“适应性”5 集成一体化架构-基础设施建造的最重要的原则,6 系统模块化设计-是基础物理设施的最基本的法则设

3、计理念变化(一)一个完整的系统中除了UPS系统外,还可能有变压器、瞬态电压浪涌抑制器、电网进线开关柜、负载配电柜、柴油发电机、 交流稳压器、变压器、电池系统、各种开关、断路器、保险、转 插,上百乃至几百个级连接点和相应的传输线。由于这些部件和 环节在可靠性模型中的串联特性,以及它们之间的相互影响,就 使得系统可靠性大幅度降低。研究工作从单台UPS设备向整个供电系统变化年设备质量故障台数 / 年总故障台数=0.259按总故障台数计算可靠性:=年总故障台数/总台数=19835台/196711台年=0.1MTBF=1/ =10年=87600小时按设备质量故障台数计算可靠性:=年总故障台数/总台数=5

4、141台/196711台年= 0.0261MTBF=1/ =年=335632.2小时系统故障数据的启示系统故障数据的启示对系统研究的问题包括对系统研究的问题包括 系统中各种设备和环节的相互匹配和可靠性问题; 系统可靠性和冗余配置问题; 可修复和降低修复时间问题; UPS设备的模块化冗余系统结构问题; 各种设备和环节连接技术的研究和规范化问题、供电系统的布局(集中式、区域式、分散式)问题等对设备的研究要适应系统研究的变化对设备的研究要适应系统研究的变化设计理念变化(2)越来越多的厂商和用户已经形成这样一个共识:在UPS性能指标已完全满足计算机网络设备要求的情况下,真正能为用户带来价值的 是其可用

5、性。对系统可靠性的研究向可用性研究变化系统在使用过程中,可以正常使用的时间与总时间之比。可用平均无故障工作时间MTBF和平均修复时间MTTR表示,在概念上它包含了系统中设备的可靠性、可管理性和可维护性。可用性高意味着给用户更多的正常使用时间,把故障后不可用时间降到最低限度。可用性定义为:“不停电”观念的变化市电故障后延时1015分钟供电,保证计算机数据存储并安全关机。系统要求可靠性不停电保护系统 市电故障后保证系统不间断继续供电。 系统要求可用性不停电供电系统失效率:式中:ns试验开始时正常工作的样品数;n在运行(t1-t2)时间间隔内出现故障的样品数;可靠度:平均无故障时间:平均维护时间:可

6、用性:UPS的可靠性与可用性指标可靠性科学数学家Erich Pieruschka串联系统的解答得出了有关产品可靠性的Lusser 定律, Rs = R1 x R2 x .x Rn二十世纪四十年代,德国火箭科学家Von Braun 在 V1 导弹项目中创建了 最早的预测可靠性模型。“链的强度取决于最弱的一环” 提高可用性的措施之一- 提高薄弱环节可用性的基本措施1,提高设备的额可靠性- MTBF 先进电路技术 可靠性电路设计 智能管理功能 可靠性热设计 电磁兼容性设计 生产工艺 生产管理2,降低故障维护时间- MTTR 模块化插拔维护-电路板、功 能电路、功能模块 模块化冗余热插拔维护 智能管理

7、与通讯功能 可维护性-提高维护水平提高设备的可靠性措施提高设备的MTBF- 提高功率器件的规格和档次(IGBT等) 改进控制技术,提高逻辑控制电路规格和档次(CPU,DSP) 采用更先进的主电路结构 严格生产工艺,加强质量管理(ISO9000)此方法有效,但是困难大,效果有限 因为:组成UPS主机的上千个元器件和几千个接点,在可靠性等效 图上是串连的,整个系统的可用性是这上千个元器件和几千个接点 可用性的乘积 受其它元部件工艺和技术革新和发展的限制系统不可用时间比例提高可用性的措施之二-冗余配置系统运行总时间=1 系统可用时间比例A两个系统串联 两个系统冗余并联(空间状态图)MTBF与失效率及

8、产品寿命的关系MTBF与产品生命周期无关 以 50 万个 25 岁的人作为抽样。 在一年的时间内,收集这些人口的“故障”(死亡)数据。 这些人口的生活时间是 500000 x 1 年 = 50 万人年。 在这一年当中,有 625 个人“出现故障”(去世)。 故障率为 625 个故障 / 50 万人年 = 0.125% / 年。 MTBF 是故障率的倒数,即 1 / 0.00125 = 800 年。故障率的浴缸曲线MTBF与失效率及产品寿命的关系MTBF并非产品可达到的连续工作时间 MTBF和是时间的概率函数, MTBF和对特定的时间段才有意义 例如:MTBF=200000小时,并不是可连续20

9、年不发生故障。在一年中,年失效率=1/MTBF=8760/200000=0.0438一年中的故障可能性为4.38%在一个月中,月失效率=720/200000=0.0036在一个月中的故障可能性为0.36%同理,天失效率=0.00012,一天中故障的可能性为0.012%同样,同样,MTBF只有在产品寿命期限内才有意义,NTBF的反浴缸曲线Eearlyfailure periodNormal operating periodWear out periodMTBFTime保证计算机和网络IT设备正常运行的条件除了配置UPS供电设备外,还必须有与之配套的完整的供电系统、空调及通风系统、机架及IT设备线

10、缆的支撑系统、消防及门禁系统、基建及装修装饰等,统称为网络关键物理基础设施,即NCPI(NetworkCriticalPhysicalInfrastructure),这些设施都会在一定程度上影响信息系统的可用性,所以研究工作自然地就由单纯的电力供应扩展到空气调节(包括IT机架微环境)、IT设备机械支撑、系统的集中管理。从UPS设备到一体化供电系统,再到NCPI,是供电系统设计思维模式的重大变化。设计理念变化(三)从对单纯的供电系统研究向 整个IT基础物理设施(NCPI)变化-系统:相互关联-实质:IT微环境是终极目标人员/流程/信息空调电力IT微环境管理IT系统对NCPI的终极要求IT微环境状

11、态 是衡量NCPI质 量的最终标准NCPI与整体机房Decoration 装修空调Ceiling 天花板Grounding 接地RaisedFloor地板Shielding 屏蔽消防动力配电计算机基础物理设施机房 机架、微环境 系统管理IT设备 厂商NCPI机柜(架)-数据中心中与IT设备直接发 生联系的基础物理设施要解决的问题: 对不同厂家不同型号设备的兼容; 机架级电源分配和线缆管理; 机架微环境通风散热问题; 机架电源状态和环境(温度、湿度、烟雾等)状况的监测和管理。提高UPS供电系统的“适应性”设计理念变化(四)当经济环境的变化周期小于设备的生命周期时,就会对设备的适应性提出要求。由于

12、技 术发展和经济环境的不确定性和不可预测性,要求一台设备能够自动而有准备地适应新 的需求是根本不可能的。 经济形势的变化; IT设备技术革新和功率密度的变化; 维护人员操作水平的变化、组织管理模式的变化; 设备运行场地的变化等。部署传统 NCPI 系统典型的 400 天时间表 投资预算设计容量容量需求方案规划设计 12个月工程设计 34个月系统安装调试 - 1月试运行机房建设 78个月用户应用与 服务要求计划内过度规划设计 增加20%余量,可提高设备的可靠性。规划程序及其缺陷 对需求的假设包括: 设计人员不能犯容量不足错误; 在生命周期的中途增加容量的成本非常高; 在生命周期过程中增加容量会带

13、来严重的、无法接受的故障停机风险; 必须事先完成所有最终机房容量的工程设计与规划工作; 负荷未来将会提高,但是增加的程度是无法准确地预测的。造成过度规划设计的根本原因 在设计流程中进行预测的能力非常差; 目前采用的系统容量设计技术是一种逻辑上的过度规划设计,这种系统是通过降低“系 统无法在生命周期过程中满足负荷要求”这种可能性,来防止系统受到最终实际功率 过高的影响。 传统设计观念导致过度规划设计传统设计观念导致过度规划设计要求 系统统筹设计(可用性、可扩展能力、总拥有成本、建设周期等) 设备制造和供应渠道的统一化; 设备结构的一体化和连接的规范化; 各设备和环节状态管理的集中化; 体系结构和

14、物理空间的可修复性设计、各设备和环节结构的模块化、冗余配置和连接的热插拔功能。集成一体化范围: 系统规划、机房设计建造、强电系统、机房内供电系统、 温湿度调节、防静电功能、防雷系统、新风净化、安全系统、 消防系统;环境监测系统;维护管理。设计理念变化(五)集成一体化架构-基础设施建造的最重要的原则,基础设施集成一体化架构输入配电UPS系统供电系统IT设备机 械支撑IT机架线缆管理管理系统运行监测管理环境设置 监测机房空气调节局部通风制冷新风气流组织输出配电维护运行 服务集成一体化机房规划与设计、工程实施、工程验收中央监控办公空调新风系统防火阀门照明天花系统电源配电柜机柜及附件UPS及PMM电源

15、管理系统消防减压气体灭火系统冷凝水漏 水监控系 统早期故障 报警系统高密度制 冷机柜气体灭火 报警网精密空调设备和冷凝器综合布线系统 高架地板隔断布置,如石膏板、彩钢板玻璃光纤电缆强、弱电缆槽门禁系统报警显示系统保安监控系统机房规划设计机房供 配电UPS供电系统机房空 调制冷机房布线机房安全机房装修机房妨雷系统管理数据中心UPS供电系统典型结构示意图UPS 输入动 力配电谐波治理油机输入 配电输出 配电电池冗余转换STS机架供配电冗余转换ATS软件管理产品: 自诊断及保护功能、通信功能、管理软件企业管理: 英飞中央管理器 容量管理器 变化管理器物理威胁管理: 环境及安全 NetBotz EMS

16、/EMU分布式软件: UPS监控及操作系统安全宕机 PowerChute Business Edition PowerChute Personal Edition PowerChute Network Shutdown设备管理 : 监控管理卡( NMC, BMC, EMC) 电池监控MGE UPS管理产品 Solution-Pac EPM (Enterprise Power Management) Monitor-Pac服务器访问: 远程服务器操作-KMM、KVM非集成系统故障率集成系统故障率集 成 一 体 化 架 构 的 优 势提 高 系 统 可 用 性提 高 系 统 适 应 性降 低 总 拥 有 成 本集中管理机房物理空间总体布局优化设计提高管理维护水平成熟案例和经验的积累兼容性、开放性方案可行性仿真设计系统可用性

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号