数据中心基础设施管理系统

上传人:工**** 文档编号:497734300 上传时间:2023-07-26 格式:DOCX 页数:18 大小:282.75KB
返回 下载 相关 举报
数据中心基础设施管理系统_第1页
第1页 / 共18页
数据中心基础设施管理系统_第2页
第2页 / 共18页
数据中心基础设施管理系统_第3页
第3页 / 共18页
数据中心基础设施管理系统_第4页
第4页 / 共18页
数据中心基础设施管理系统_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《数据中心基础设施管理系统》由会员分享,可在线阅读,更多相关《数据中心基础设施管理系统(18页珍藏版)》请在金锄头文库上搜索。

1、数据中心基础设施管理系统(DCIM )目录1. 项目概述及需求理解41.1. 项目背景简介41.2. 项目管理范围42. 系统总体架构设计52.1. 项目建设原则52.2. 项目建设目标62.3. 解决方案概述73. 技术架构及实现原理114.1. 系统架构114.1.1. 采集层124.1.2. 处理层124.1.3. 管理层134.1.4. 交互展现层134.2. 系统集成144.2.1. 第三方集成144.2.2. 短信猫集成154.2.3. 短信网关集成154.3. 开发工具及技术介绍154.3.1.自定义流程引擎164.3.2. 成熟的开发标准技术174.3.3. 分布式通讯调度17

2、4.3.4. 搜索引擎173 /181. 项目概述及需求理解1.1.项目背景简介伴随着数据中心规模的不断扩大,业务量的逐渐增大,对数据中心的运维管理也变的越 来越重要。一旦基础设施系统出现问题,而没有及时地得到妥善解决,常常会给企、事 业造成很大的损失。怎样能7x24小时保证设备系统的正常运行避免各种故障的发生, 优化和改进传统的运维模式,提高客户服务的及时性和满意度就显得非常重要。因此,建设一套数据中心基础设施管理系统势在必行。一个完备的运维管理系统能 够提供7x24小时检测基础设施运行状态、各种资源状态的信息。运维管理人员依靠流 程管理系统可以及时排除故障避免造成重大损失,控制运维质量提高

3、服务水平。三项目内容:设施故障发现与警报;记录日常运维日志信息;设施故障统计;设施软硬件信息统计;服务进程管理;将数据信息存储备份,并采用不同方式直观的展示出来;服务人员绩效、考核管理;将数据生成报表;2. 系统总体架构设计2.1.项目建设原则数据中心基础设施管理系统建设指导思想是:统一规划、分步实施、已有纳入、 新建遵循”。数据中心基础设施管理系统项目建设是要建设一个集中管控资源的运维平台,所以 需充分考虑对已有各种产品组件做针对性的开发、整合工作。在项目建设过程中,除满足系统功能需求外,遵循如下原则: 安全性原则:系统设计注重安全方面的设计,确保系统的安全运行。系统提供 安全认证技术,确保

4、登录身份认证安全性、有效性。 稳定性原则:保证系统不间断运行,系统执行监控及操作任务时或出现自身故 障,绝不能影响被监控及操作对象的正常稳定运行。 开放性原则:系统遵循行业主要的标准化组织所提供的标准或建议,采用标准 的、开放性的技术,能够实现与其他厂商的产品无缝地连接;采用国际标准化 组织及工业界广泛接受的有关标准和基于标准的通用软硬件平台。 可扩展性原则:在保持系统的基本体系结构长期稳定的前提下,可以有效地容 纳和支持基础设施规模的不断扩大和复杂、业务种类的增多。同时,能够在应 用体系结构和软件模块划分两个方面支持整个应用的良好扩展性。在体系结构 方面采用多层结构划分,实现各层的高聚合和层

5、间低耦合。尽量使用模块化和 插件化,使得扩展时对原系统的影响最小化。 用户体验优化原则:具有较高的易用性,界面友好,美观统一,并对人机交互 进行优化设计。 灵活性原则:系统各子系统及子系统内功能模块具有一定的独立性,同时具有 系统相关性和整体一致性。系统提供自动化升级维护功能,系统的维护及拓展 灵活、方便。规范性原则:统一接口标准,规范数据字典。定义监控接入标准,规范未来新 建系统的监控。22项目建设目标加强数据中心的维护平台建设,提高数据中心的运行管理水平,通过运维体系的建设, 结合构建集中式的服务热线、运维流程、系统监控和综合展示系统,通过系统联动,及 时、准确、全面反映与掌握数据中心的运

6、行状态,保障各业务系统的正常运行,并达成 如下目标:(1)强化主动监控,实现集中管理。以设施资源可用性监控为主线,构建数据中心统一集成的设施资源及应用服务监控平台, 能够主动、及时地发现问题,并调度资源解决问题,形成数据中心运维管理主动服务的 新局面。帮助定位故障,快速恢复系统运行。 建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。当故障产生时, 可以进行故障的快速定位,发现故障原因,调度资源快速恢复系统服务,从而缩短故障 解决时间,降低维护成本,提高系统整体可用性。(3) 掌握运行质量与效率,合理利用资源。建立数据中心基础设施管理系统平台后,可以实时了解数据中心全部资源的负载与

7、使用 情况,根据需要从整体角度考虑资源的使用,同时可以根据业务高峰期的不同来调剂业 务系统对资源的使用。(4) 规范运行管理,有序开展维护。参照数据中心运维规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据 电子化,管理过程规范化。根据相关制度进行运行维护管理,对内完善流程,对外提高 服务,加强管理,使流程更规范更合理,使技术人员具备更高的工作效率,提高业务技 术能力和解决实际问题的能力。(5) 共享运维经验,完善知识库。把运维过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知识的共享机 制,提供信息共享和交流的平台,提高数据中心运维人员的工作效率。23解决方案概述DCIM

8、系统是在在分析了国内数据中心管理现状和需求后,自主研发而成。秉承以 客户为中心、流程为导向的理念,实现对基础设施资源的全面管理,完美整合了人员、 技术和流程三大要素,帮助用户以较低的成本提供稳定、优质的服务,共同实现基础设 施服务的目标。DCIM系统提供了 无缝式基础设施监控系统”功能,其系统架构清晰,采用模块 化的设计理念,各功能模块既可独立运行、松散耦合;亦可整体功能无缝衔接覆盖整个 业务系统,灵活的自由组合真正实现个性化的基础设施无忧运维。DCIM系统提供一个图形化、可定制、统一的监控管理平台。通过它实现对基础架 构性能和告警数据的直接监控与展示,实现对用户环境的整体运行状态的监控管理。

9、1. 故障预警和管理前瞻性地发现系统的故障和性能问题,能够快速识别、隔离、诊断和修复生产中出 现的问题。1)前瞻性发现基础设施和应用系统的故障。2)前瞻性检测复杂的应用性能问题。3)基于业务的性能影响分析报告4)快速识别、隔离和诊断问题的起因,事故根本原因分析。5)对一些简单的故障问题,提供自动化修复故障的功能;对复杂的故障和性能问 题,尽可能提供修复故障和改善性能的建议。6)提供的丰富的事件通知功能,事件通知方式包括:Mail自动向指定邮箱发送告警邮件。短信自动向指定手机发送告警短信。声音自动产生声音告警。图像自动以图标形式显示告警事件。其它通过二次开发可实现特殊要求的告警方式。7)提供监控

10、参数化配置管理,参数超过设定阀值,产生报警信息。2. 多层次的视图展示直观、准确地体现各层面的系统和业务运行状态,分别展示不同管理层次和范围的 系统运行状态。根据企业的业务特点和管理习惯,可将展示视图分成一级视图、二级视图和三级视 图,分别展示不同管理层次和范围的系统运行状态(如下图所示)。3. 集中统一的管理界面用户在统一监控管理平台上可查看所有视图,提供直观的图形用户界面。1)基于上下文环境和组合视图,降低用户诊断问题的时间。2)基于角色和权限的控制,增强管理的安全性。3)提供可定制化的工作区和视图,提高操作的灵活性。4.开放的接口能够集成第三方监控工具,实现将第三方监控(例如BA、安防、

11、柴发、电力或特定应用管理工具等)完全变为监控系统的一部分。| f ft L BlLDg5.丰富的报表展示功能提供统一的报表界面,具备强大的数据展现能力:1)提供网络、系统、数据库、网络、中间件、应用和业务运转状况的集中统一报 表2)提供实时与历史性能报表3)提供数据分析、展现和用户报表定制功能4)预制报表模板5)自动周期性报表,如日报、周报、月报、季报、年报等6)支持PDF、HTML、Excel等报表格式3. 技术架构及实现原理4.1.系统架构本次提供的数据中心基础设施管理系统涵盖较多被监控的对象,覆盖面较广,功能 复杂,系统设计遵循模块式开发、部署,系统从底层到最上层的图形用户接口共分为四

12、层,每一层实现不同的功能,系统整体的架构如下图所示:斂功能SS -总 Inlg谊产管理IZXIEI旦用户苣理歎件養口适配II婚丄:4监岸 I电尢|安防耒禽匚垂 |子澈子泵述整个系统管理架构分为采集层、处理层、管理层、交互展示层四个层次。4.1.1. 采集层包括数据中心环境中的机房环境、暖通设备、电力设备、安防设备等被管理实体, 是需要被实时监控的对象,是原始信息的来源。所有的被管理对象通过标准协议或私有 协议方式向管理端提供各种性能和事件数据。4.1.2. 处理层包含两个功能,一是对管理实体中的数据进行数据采集;二是根据要求对数据进行 必要的整合。除了采集到的数据外,还可能包括各种管理数据,系

13、统汇总后的数据、文 档数据等。系统管理的数据采集方式支持以下几种:采用定时轮循机制获取被监测设施的数据; 监听代理端的TRAP消息实时获取数据;通过设备厂家提供的监控工具获取数据; 通过读取日志文件获取数据;通过其他厂商监控平台获取数据。理层413数据中心基础设施管理系统所使用的各种业务逻辑,集中管理和协调各子系统之间 的服务调用,是系统管理的核心管理平台,主要有如下功能要点:1性能管理,对基础设施实时监控,采集各种指标数据,并与告警模块关联,在 产生异常时及时发出警告2. 告警管理,提供告警主动通知、告警统计、告警相关性分析等功能3. 统一事件处理,集中收集基础设施事件与告警,并提供告警相关

14、性分析,辅助 管理员排除故障4. 基于运维服务管理则实现运维管理功能,包括服务台、事件管理、问题管理、变更管理、配置管理、发布管理、知识库管理、SLA管理等模块。4.1.4.交互展现层展现层是DCIM系统与运维人员之间的人机交互接口,本次系统采用全WEB化的 客户端界面,运维人员只需使用浏览器即可在网络中任意一台电脑上随时接入系统,系 统支持portal功能可以根据用户的需要呈现不同的功能和数据。此外系统支持email、 短信、声光等多种方式的事件通知形式。通过北向接口及标准协议,系统可将监控、采集数据推送至第三方管理平台及3D 展示平台。4.2.系统集成421第三方集成DCIM系统在设计之初,充分考虑了开发性和可扩展性的需求,可以有效地容纳和支 持基础设施规模的不断扩大和复杂、业务种类的增多,能够在设施体系结构和软件模块 划分两个方面支持整个应用的良好扩展性。系统预留业界较通用的接口,可以方便地实 现与各类第三方系统的集成,支持通过以下方式进行对接和整合: Trap :基础设施管理系统可以接受第三方监控平台产生的trap,前提是双方确 定好trap的报文格式,由DCIM系统内置的trap解析器进行解析和处理。如工单 的自动生成,告警消息的上报,确认和清除等等。 Webserv

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号