《故障处理流程》由会员分享,可在线阅读,更多相关《故障处理流程(3页珍藏版)》请在金锄头文库上搜索。
故障处理流程省应急平台系统网管故障管理流程包括如下步骤,形成故障处理的闭环操作 故障发现:包括设备故障上报、网管定时轮询、网管性能监视、网管配 置文件定期检查等; 故障接收:根据告警脚本中的事件定义,接收并解析发现的故障; 故障分析:对接收到的故障进行分析,屏蔽重复告警,支持告警手动确 认和自动确认功能,对于部分次要告警,维护人员可将其设置为自动确 认,告警一产生就自动转为已确认状态;对于重要告警,必须经维护人 员手工确认。故障报告:告警灯、告警音、告警转发(E-mai 1,短信,其它网管); 故障修复:告警定位,告警确认,系统预安装修复建议;故障修复后, 系统可自动或手工确认告警,如果该告警已确认,该告警从当前告警列 表中转入历史告警表,同时清除拓扑图的相应告警提示。 故障诊断经验共享:可以保存有价值的维护经验,供后续管理提供参考。 省应急平台系统网管提供告警知识库。告警知识是用户在维护过程中的 经验总结,将这些经验输入系统,下次再出现同样的故障时,可以作为 参考。用户选中一条告警记录,系统根据用户选中的告警记录,从告警 知识库中查询出该条告警记录的维护经验,供用户进行告警处理进行参 考。管理员将自己的日常处理经验以及业务信息及时写入数据库、更新 告警处理知识对以后的故障诊断与排除非常有益。故障经验分析