网络管理告警系统

上传人:ni****g 文档编号:562751142 上传时间:2023-12-13 格式:DOCX 页数:19 大小:137.67KB
返回 下载 相关 举报
网络管理告警系统_第1页
第1页 / 共19页
网络管理告警系统_第2页
第2页 / 共19页
网络管理告警系统_第3页
第3页 / 共19页
网络管理告警系统_第4页
第4页 / 共19页
网络管理告警系统_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《网络管理告警系统》由会员分享,可在线阅读,更多相关《网络管理告警系统(19页珍藏版)》请在金锄头文库上搜索。

1、文稿归稿存档编号:KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-网络管理警告系统的设计1 设计目标1 数据采集:通过采集计算网络中的配置信息,告警信息,性能信息,反馈给 告警中心。2 数据分析:分析告警信息(原始告警信息,性能数据,配置信息),推理处 理并存储记录告警,且实现告警的可确认消除(自动回复/手动恢复)。3 数据应用:实时监控重要的告警信息,解决并消除告警信息。根据告警信息 记录生成报表统计,向上层提供决策的数据依据。2 概要设计系统分三层 : 数据的采集 数据处理 数据应用数据采集:从系统的网元上采集数据包括:性能数据信息,网元告警信息,拓扑结构的配

2、 置信息,向数据处理层的制定临时数据库中传送。数据处理:从指定的数据库中获得原始数据信息,判断处理。根据估值(及性能阀值)判 断生成警告信息,存储分析并上报告警信息。实现告警的匹配确认清除,重复告警的归并 处理。数据应用:及时监控重要的告警信息,并处理此告警,反馈告警的确认信息。根据不同的 用户需求展现告警统计信息报表,为决策提供数据支持。3 数据采集层3.1 内容3.1.1 配置数据采集的内容及获得该网络中的网元设备,基本信息,与实体形成对应的映射。用于网络的拓扑信息管 理。网管系统管理采集以下配置数据: 3.1.2告警数据采集的内容告警源需要采集的告警报告分为:网元告警路由器:交换机:配线

3、板:服务器:cpu ,内存,硬盘,电源,风扇(散热),网卡,光驱,端口,运行的软 件服务1. 环境告警:暂保留。2. 通信连接告警(拓扑管理):当某一网元设备持续一定时间不响应网管系统 时,网管系统应能自动生成该网元设备的通信连接警。3. 性能告警:当性能指标超出预先设定的范围时,系统触发的告警称为性能告 警。4. 设备告警:来自设备红端的告警信息。原始告警数据内容原始告警数据是从告警源采集到的未经任何处理的原始告警信息,格式和内容与网元类型 相关,原始告警信息将在告警管理应用层进行处理,采集层采集到的告警原始数据至少应 包括以下内容:中文名称名称说明类型告警的序列 号Alarm i d告警的

4、序列号字符串网元的识别 名Dn网元的识别名字符串告警发生时Occur_t告警发生时间时间间ime告警清除时 间Clear_t ime告警清除时间时间告警原始类 型org_type告警类型字符串告警原始级 别org_severity告警级别字符串活动状态actives tatus活动状态整数告警标题Title告警标题字符串告警内容alarm_t ext告警内容字符串3.1.3性能数据采集的内容 针对不同的网元,采集其对应的性能信息。格式和内容与网元的类型相关。在采用阀值过滤器,判断产生原始的警告信息。3.2方式采集方式分两种:1. 直连网元 及直接连接到网元设备,进行数据采集。(使用于小的系统)

5、2. 系统采集 及上一级的网管通过下一级的网管来获取数据。(使用于多个小系统集成 的大型系统)3.3要求配置、性能、告警原始数据至少要保留一周以上。对配置数据、告警数据和性能数据采集 的要求不尽相同,下面分别进行说明。3.3.1配置数据采集的要求为了在用户层展现的网络结构与实际的网络结果相对应,需要周期性的检测当前网络的连 接情况,设备的运行情况等实时信息:在系统相对稳定的情况下,网管系统能够按照用户预定的时间表定时的、周期性地自动采集配置数据,时间表中的采集开始时间和采集周期可由用户设置;如果由于网络或者其他原因,网管系统没有正确采集到网元的配置数据,网管系统能够让用户在必要时手工启动配置数

6、据采集程序进行重采或补采,并可按网元组、 地区进行分别采集刷新配置数据;网管系统以报告等方式方便地检查每个网元的配置数据采集情况,即该网元的配置 数据的更新情况。3.3.2告警数据采集的要求实时地采集所有网元(NE)生成的各种设备故障告警报告、网络事件报告以及与网络、业 务相关的故障报警报告。为保证数据采集的完整性,告警数据采集层必须提供手工采集手 段,并应具备以下主要功能:能够自动采集告警数据,采集时间和采集周期可设置;能够实时接收由厂家OMC或网元设备实时上报的告警信息;需要时能够即时手工启动告警数据采集程序,保证数据采集的完整性;可根据需要,按告警网元、告警级别、告警类别等条目或按一定地

7、区进行设置,实 现过滤采集。3.3.3性能数据采集的要求性能数据采集应具有以下四个主要功能:能够周期性地24小时自动采集性能数据,采集周期和采集时间可选择,最小的数 据采集时间周期为15分钟,采集的时间粒度可以基于网元或地区进行选择; 能够即时手工启动性能数据采集程序(分地区、分时段);当报表数据不全时,能够提供简单的手段确认所采集的网元数据的齐全; 采集和补采的数据能够自动入库。4数据处理层原始数据通过数据采集层进入系统后,数据处理层对这些原始数据进行归纳整理,实现数 据结构规范化,为数据应用层实现具体功能提供支持,便于系统的二次开发和新的应用功 能的提供。处理层数据至少需要保存6个月。以下

8、从配置、告警和性能三方面对数据处理层进行说明。 4.1配置数据处理层 本节从信息归一化、配置数据的存储、刷新和备份等四方面进行说明。4.1.1 配置信息归一化 配置数据采集到网管系统之后,必须进行归一化、数据结构规范化,使数据应用层的相关 应用能够方便地使用这些数据。配置信息按照交换机,路由器,服务器,等六个方面进行归一化,具体内容参见附录。 4.1.2配置数据的存储 网管系统应能够将不同种配置数据转换成以上描述的归一化标准数据格式并存储到数据库 中,为性能、告警等应用提供数据支持,为二次开发或其他的后处理提供标准的存储接 口。4.1.3配置数据的刷新网管系统发现新的配置数据采集结果与网管数据

9、库中的配置数据不同时,如网元的增加、 删除、网元属性改变(何种属性),需要用户确认,并生成变更记录,作为采集日志的一 部分,供用户后期查询,同时更新网络拓扑图等相关的上层应用程序的配置数据,使上层 应用能够呈现网络的最新配置信息。4.1.4 配置数据的备份网管应提供对配置数据的快照功能 (即备份功能),用户通过此功能可将当前网络的配置 信息存储下来,供其他应用所调用。快照可以由网管系统按照时间表的设置自动进行或由 用户手动启动。快照后的配置信息可用于:网络配置信息的历史对比 配合性能,告警数据做网络多维分析4.2 告警数据处理层以下对告警数据的处理进行说明。4.2.1 告警信息格式标准化采集层

10、采集到的原始告警数据要经过告警数据处理层的处理,处理后提供的标准化数据应包括以下内容:中文名称名称说明类型告警的序 列号Alarm_id告警的序列号字符串网元的识 别名Dn网元的识别名字符串告警发生 时间Occur_ti me告警发生时间时间告警确认 时间ack_time告警确认时间时间告警清除 时间clear_time告警清除时间时间告警类型type告警类型整数告警级别Grade告警级别整数告警原始 类型org_type告警类型字符串告警原始 级别org_seve ri ty告警级别字符串活动状态activest atus活动状态整数告警源source_t ype字符串确认操作 员ack_o

11、ptr确认操作员用户名字符串清除操作 员clr_optr清除操作员用户名字符串告警标题Title告警标题字符串告警内容alarm te xt告警内容字符串告警的原始信息中文名称名称说明类型告警的序列 号Alarm i d告警的序列号字符串网元的识别 名Dn网元的识别名字符串告警发生时 间Occur_t ime告警发生时间时间告警清除时 间Clear_t ime告警清除时间时间告警原始类 型org_type告警类型字符串告警原始级 别org_severity告警级别字符串活动状态actives tatus活动状态整数告警标题Title告警标题字符串告警内容alarm_t ext告警内容字符串4.

12、2.1 告警的重定义 应允许用户根据管理工作重心的变化,按照可能原因、网元类别、网元识别码、原告警类型、告警级别、时间类型等条件及各种条件的组合对告警类型和级别进行重定义。 告警级别分为严重告警、主要告警、次要告警、警告告警;告警类别分为通讯告警、环境 告警、设备告警、处理错误告警、服务质量告警;4.2.2 告警过滤(通过推理机的知识库来过滤,且知识库是对管理员可维护。) 对单位时间内发生的大量告警,能按用户要求和管理部门的考评要求及实际管理情况,对 告警网元、告警级别、告警类别或告警标题等条目进行过滤。告警数据过滤用于过滤掉从底层提取的告警信息中监控人员认为不重要的信息,从而减少 轻微告警的

13、干扰,以提高监控与处理的效率。应能对告警数据过滤的开启状态进行手工设定。1、过滤后的告警信息的处理经过过滤后的告警信息最后应插入当前告警数据表。对系统数据库中的告警信息要加过滤标志。2、告警数据的过滤条件对象:选择过滤掉哪些对象的告警信息。 监控人员可通过三种方式选择对象:单个或多个对象 (必须是同一网元类型); 同一网元类型的所有对象;某一地区内同一网元类型的所有对象; 告警级别:选择过滤掉选定对象的哪一级别的告警。 过滤模式:定义派生的告警信息是否写入系统数据库。 确认模式:定义符合条件的告警信息的确认模式。由监控人员手工确认。告警信息采集上来后自动确认。 告警信息取消时自动确认。4.2.

14、3 告警传递为了保证底层对象 (有可能在拓扑图或导航器中当前不可见) 的告警信息也能及时地显 示,监控界面对底层对象的告警应逐层传递给其父对象,即改变其父对象子告警状态及子 告警次数,引起其父对象状态图标的变化,从而达到实时监控的目的。在展现层进行逐层 的展现。告警传递的方式 在网元逻辑关系树中,树的底层节点网元发生告警时,应上传到上层的一级或多级网元节 点,告警传递层数应可由用户根据需要设置,系统默认为一层。传递的告警信息的显示 当父对象有由子对象传递上来的告警时,要显示出有子对象告警的状态 当父对象有子对象告警时,设置该父对象的状态为有子对象告警,并将子对象告警数目加(在设备状态表中提供相应字段,子对象告警状态与次数)当取消子对象告警时,父对象的子对象告警数目减一。当减为零时,设置该父对象的状态 为无子对象告警。4.2.4告警相关性分析及处理(可选) 首先定义告警相关及处理的具体规则,对每条将要入库的告警信息按规则进行相应的告警 相关性分析,然后根据分析结果进行相应的处理。告警相关分为两类,一类产生新的告警,涉及告警的自定义,另一类并不产生

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号