机房DCIM方案

上传人:油条 文档编号:107395450 上传时间:2019-10-19 格式:DOCX 页数:39 大小:2.46MB
返回 下载 相关 举报
机房DCIM方案_第1页
第1页 / 共39页
机房DCIM方案_第2页
第2页 / 共39页
机房DCIM方案_第3页
第3页 / 共39页
机房DCIM方案_第4页
第4页 / 共39页
机房DCIM方案_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《机房DCIM方案》由会员分享,可在线阅读,更多相关《机房DCIM方案(39页珍藏版)》请在金锄头文库上搜索。

1、数据中心基础设施监控管理(DCIM)解决方案V1.02015年06月12日39目 录第1章项目概述31.1.项目背景31.2.需求分析41.3.项目目标4第2章系统设计52.1.设计概述52.2.设计依据52.3.系统关键参数62.4.系统架构72.4.1.物理架构72.4.2.功能架构8第3章DCIM系统亮点10第4章DCIM系统功能114.1.个人工作台114.2.基础设施监控子系统114.2.1.可监控的设备114.2.2.设备展示功能184.2.3.告警功能194.3.能效管理子系统214.3.1.能效展示224.3.2.能耗分析244.3.3.能效控制264.4.资产管理子系统264

2、.4.1.仓库资产管理274.4.2.在架资产管理284.4.3.办公资产管理284.4.4.资产维保信息管理294.4.5.其他资产相关功能294.4.6.U位检测系统布署预留294.5.容量管理子系统294.5.1.容量建模294.5.2.容量展示304.5.3.容量预分配304.5.4.趋势分析314.6.变更管理子系统314.6.1.流程逻辑说明314.6.2.变更流程控制324.6.3.变更风险控制324.6.4.变更数据管理324.7.可用性管理子系统324.8.报表管理334.8.1.预定义常用报表报告模板334.8.2.自定义报表报告模板功能334.8.3.报表报告管理33第5

3、章客户收益345.1.基础设施监控回报345.2.能效管理回报345.3.资产管理回报355.4.容量管理回报35第6章应用场景举例376.1.统一监测376.2.报警定位:复杂事件分析CEP376.3.节能:幽灵服务发现376.4.批量资产预占与上架376.5.资产盘点386.6.功耗控制与容量优化38第1章 项目概述1.1. 项目背景在当前高速信息化发展的时代背景下,数据中心是整个社会信息化的基础。数据中心础设施直接影响了数据中心安全、高效、环保、稳定的运行。如何维护好机房,及时发现隐患和排除故障,降低管理成本,提高运维效率,控制机房能耗,成为管理者关注的重点。对机房管理者来说,存在下列痛

4、点:管理效率低投产后的数据中心最关注的是稳定和高效,稳定与管理团队的日常运维相关,高效与科学化的监控管理系统相关,此中包含的三要素就是:数据中心监控管理系统管理团队。由此可知,监控管理系统相当于数据中心和管理团队之间的纽带,管理人员通过监控管理系统去感知数据中心的各项指标参数正常与否,结合数据调整运维流程,应对突发事件。目前,绝大多数数据中心投入使用的监控管理系统繁多复杂,且各系统间的相互独立造成信息孤岛;另一方面,现有的许多监控管理系统自动化、智能化程度不够,造成日常运维管理对人力依赖大。资产难管理数据中心管理诸多管理工作中,涉及IT资产上架、下架、维护、盘点等工作十分头疼。现有对IT资产的

5、管理主要是依靠人工+简单系统统计来实现,例如定期对在架的资产盘点,在缺乏智能资产管理系统的状态下,处理这些工作对人手依赖程度高,工作内容简单重复,很难保证操作与记录的准确性,导致账实不符。容量利用率低数据中心的配电容量、制冷容量、机柜U位容量决定了该数据中心的计算能力。在缺乏有效的管理工具的状况下,IT设备部署需求与数据中心容量实际供给情况难以匹配,导致基础设施容量实际利用率低。据Gatener,90%以上的数据中心容量利用率不到70%。故障定位难数据中心管理人员对监控系统的核心关注点在于告警准确性,但实际上因为数据中心本身复杂性高,当一台设备出现故障时,经常引发并发告警。因此,在基础设施的管

6、理层面,必须依靠监控系统来精准定位故障,以确保管理人员第一时间知道后迅速处理恢复。鉴于以上数据中心管理者所面临的各种痛点,应当采用一套可将:基础设施、资产、容量、日常运维、机房安全性作出统一管理的系统。数据中心基础设施管理(DCIM)系统就应运而生,亦是当前数据中心行业发展的必然趋势。共济DCIM定义如下:通过监控、分析数据中心基础设施的运行信息(如状态、参数、配置等),帮助数据中心管理者掌握数据中心基础设施运行情况(当前与趋势),管理数据中心资产、基础设施资源(空间、电力、冷量等)、能耗,提高基础设施可用性、资源利用率、管理效率与能效。1.2. 需求分析据与用户初步交流,此次机房改造,需完成

7、如下工作:1、 集成原有动环监控系统;2、 新增xxx节蓄电池监测、x台UPS监控;3、 增加移动巡检系统、资产管理、容量管理等管理功能;4、 全部子系统接入DCIM系统,通过DCIM平台对各子系统进行的统一管理。1.3. 项目目标为机房布署数据中心基础设施管理系统。实现以下目标:1) 实现数据中心基础设施集中监控,全面直观展示数据中心基础设施运行状态,精准定位故障,分析预防故障。2) 实现数据中心资产全生命周期智能管理,给客户提供面向企业内部统一的资产管理平台。3) 提供机房实物资产自动化盘点工具,并为机房容量管理、配置管理等IT服务管理提供数据接口,协助管理员高效运维机房业务。第2章 系统

8、设计2.1. 设计概述DCIM系统通过统一的操作平台和统一的通信平台,完成对动力系统(供配电系统)、环境系统、安防系统(包括视频监控系统、红外报警系统)各子系统无缝数据集成,实时获取各子系统监控数据,通过对各子系统监控数据处理、分析及逻辑判断,实现上述各子系统的集中视图、集中监控、集中告警、集中数据分析和统一运维管理。对于各子系统集成,采用分布式部署、分散控制原则通过分布式部署系统采集网关,完成各子系统数据采集和分散控制交互,从而达到子系统之间的数据无阻塞交互、各子系统之间实现互通互联。DCIM系统作为开放式信息交互平台,能够采用多种方式实现不同子系统厂商产品的信息接入及功能集成,如采用OPC

9、、SDK、Webservice、Socket等多种方式。针对机房内分散、相对独立的系统,通过独立部署系统采集网关的方式经由运维网络实现各系统之间的互联互通。所有信息汇聚至DCIM系统,DCIM系统对外提供B/S分布式远程访问,在运维网络的任意一台工作站上,运维人员均可采用B/S方式对自身授权范围内的子系统系统进行实时操作。整体操控界面采用组态方式,提供多种展示工具,实现动态图形、文字、图像相结合,满足运维人员的查看、查询及管理需要。DCIM系统通过系统网关完成各子系统之间的协议对接、标准协议转换、数据转换,实现综合监控系统与各子系统间的通讯联网和数据交互。2.2. 设计依据电子信息系统机房设计

10、规范(GB 50174-2008)电子信息系统机房施工及验收规范(GB50462-2008)电子计算机场地通用规范(GB/T 2887-2000)数据中心基础设施监控白皮书数据中心基础设施管理白皮书综合布线系统工程设计规范(GB50311-2007)供配电系统设计规范(GB 50052-2009)2.3. 系统关键参数参数类型参数说明容量单台服务器50万测点并发访问200个用户数量大于5000报警数据采集小于6秒命令下发控制小于5秒变化数据采集小于6秒页面响应速度小于1秒在架资产盘点小于10秒运行网络环境内部网络不低于百兆带宽;如需外网方位,需VPN网络做安全控制运行服务器环境不低于如下配置:

11、CPU:Intel® Core? I5以上内存:8G以上硬盘:1T以上操作系统:CentOS 6.42.4. 系统架构2.4.1. 物理架构 DCIM系统物理架构图Ø 数据采集处理层数据采集处理层设计为系统的数据入口,是系统管理所需基础设施数据的来源,其通过提供标准接口及协议,接收原有的监控控系统、新增的资产容量系统以及蓄电池检测系统的监控数据。Ø 管理服务层管理服务层以下服务:基础设施监控服务、能效管理服务、资产管理服务、容量管理服务、告警告知服务、移动巡检管理服务。通过对采集数据进行二次计算,形成上层管理所需的数据。随着数据中心管理成熟度的提高,增加功能模块扩

12、展方式拓展运维管理功能,易满足数据中心管理需要,系统支持拓展增加工单管理等模块。管理服务层相当于发布各种监视和管理的核心层,作为数据采集层和展示层之间的关键环节,“DCIM系统”是发布上述服务功能的核心。Ø 展示层展示层提供丰富的展示媒介,包括手机终端、PC浏览器等;提供2D/3D展示效果;提供友好的用户界面。随着应用设备的发展,根据应用需要,在应用层增加展示应用模块。2.4.2. 系统性能(1) 测点容量:DCIM系统数据处理容量最大500,000点;(2) 系统中断自恢复:当系统因供电及其他意外非正常中断运行时,系统将从软、硬件两个方面进行自动恢复,即服务器立即重新启动,软件自动

13、启动运行;(3) 系统架构:系统采用分布式、模块化架构;数据的采集、传输、处理相互独立,互不干扰;具有热插拔和主设备倒换功能,技术成熟,运行稳定可靠;(4) IE客户端:最大支持200个IE客户端并发访问;(5) 移动客户端:最大支持50个移动客户端并发访问;(6) 报警数据采集周期:小于5s;(7) 命令下发控制:小于5s;(8) 变化数据采集:小于4s;(9) 页面响应速度:小于4s(远程监控刷新时间);(10) 报警方式:支持页面报警、电话报警、短信报警(短信网关)、语音报警;(11) 告警发出:小于20s;(12) 数据管理:运行状态、报警信息、系统日志全部记入数据库,可通过数据管理查

14、询。DCIM系统实时、准确的显示所有监控信息,系统采样时间由管理人员设定。2.4.3. 功能架构系统采用模块化的架构进行设计,确保系统的稳定可靠运行,任何模块出现故障不会影响同级别的其他模块的正常工作;系统采用分布式系统架构,确保系统后续的扩容能力和系统反应速度。DCIM系统基于网络分布式部署,运维网络内的任意一台或多台集成工作站,运维人员权限相同时,系统将以相同的界面操作,管理整个机房权限范围内的子系统,并具备授权的所有操作功能。当需要增加监控工作站时,可在机房区内的任何地方的运维网上增加网络点、工作站即可,通过系统提供的B/S方式进行管理,以最大限度保护投资,完成监控功能。第3章 DCIM

15、系统亮点1) 监控全覆盖,可视化展示基础设施实时状态2) 精细化微环境检测,监控每台IT设备的进风温度3) 复杂事件分析处理,准确定位故障;大数据分析,智能预警4) 资产自动检测,线下资产变更,线上信息自动更新5) U位级资产定位,资产部署维护准确高效6) 在架资产实时盘点,及时提交准确报表7) 数据中心全方位资产生命周期管理,资产说得清、管得住8) 可视化容量管理,直观展示容量使用情况及趋势分析,扩容决策及时准确9) 批量设备预占快速匹配,多套精细部署方案,减少容量碎片10) 设备部署合理,平衡各维度容量综合利用率,避免单项容量短板11) 精细化能效管理,监控每台耗电设备能耗,能效指标计算与对标12) 内置能效分析工具

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号