华为告警处理手册1.0.doc

上传人:飞****9 文档编号:136313603 上传时间:2020-06-27 格式:DOC 页数:82 大小:400.50KB
返回 下载 相关 举报
华为告警处理手册1.0.doc_第1页
第1页 / 共82页
华为告警处理手册1.0.doc_第2页
第2页 / 共82页
华为告警处理手册1.0.doc_第3页
第3页 / 共82页
华为告警处理手册1.0.doc_第4页
第4页 / 共82页
华为告警处理手册1.0.doc_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《华为告警处理手册1.0.doc》由会员分享,可在线阅读,更多相关《华为告警处理手册1.0.doc(82页珍藏版)》请在金锄头文库上搜索。

1、 目 录1. MSC SERVER处理分册31.1 告警箱处于离线状态31.2、FE端口故障31.3、WCKI时钟参考源丢失41.4、控制框与业务框通信失败51.5、BAM到主机通讯失败71.6、BAM到主机连接中断81.7、与NTP服务器断连91.8、Q922链路故障101.9、TCP链路故障111.10、CPU过载121.11、单板网口协商失败141.13、许可证文件即将失效151.14、计费中心长时间未取话单161.15、心跳中断171.16、双机倒换181.17、私网中断191.18、IP资源失效211.19、备份连接失败221.20、单板故障231.21、许可证即将过期告警241.2

2、2、许可证已经过期告警251.23、电源输出开关关闭261.24、H.248 SCTP链路故障271.25、MGW退出服务291.26、MTP目的信令点不可达301.27、MTP路由传输禁止3211.28、MTP链路故障331.29、MTP缓冲区拥塞351.30、M2UA链路故障371.31、SCCP目的信令点禁止381.32、SCCP子系统禁止40N = 联系对端局点确认其子系统是否恢复。422. MGW处理分册422.1 FE级联网口故障422.2 风扇框通讯故障432.3 NET单板时钟检测异常462.4 NET单板时钟失锁492.5 GE级联光口故障512.6 NET单板时钟失锁532

3、.7 NET单板时钟配线故障542.8 级联光口故障562.9 GE通道光模块故障582.10 TDM通道光模块故障613.11 BLU时钟检测异常632.12 信令链路故障告警652.13 SPF扣板链路故障672.14 L2UA链路组故障702.15 L2UA链路故障712.16 单板软件异常告警732.17 SIWF故障告警752.18 控制平面拥塞772.19 单板故障782.20 告警箱断链812.21 单板上存在故障的半永久822.22 参考源丢失842.23 虚拟媒体网关迁移出业务态851. MSC SERVER处理分册 1.1 告警箱处于离线状态告警含义 1. 告警解释 当BA

4、M与告警箱之间通信中断时间超过10秒钟后,系统将产生该告警。 2. 告警参数 无。 对系统的影响 告警箱无法正常运行,不能对BAM发送的告警做出正确响应,如不能发出声光告警。 系统自处理过程 无。 相关告警 无。 告警处理 1. 可能原因 BAM与告警箱之间链路中断。 2. 处理建议 通知分公司维护人员检查BAM和告警箱的连接。1.2、FE端口故障 告警含义 1. 告警解释 系统监测到FE端口出现故障,将产生此告警。 2. 告警参数 参数名称 参数含义 板类型 发生告警FE端口所在单板的类型 框号 该故障端口所在单板的机框号码 槽号 该故障端口所在单板的槽位号码 端口号 FE端口编号 对系统的

5、影响 如果FE端口故障,通过该端口连接的设备之间通信中断。 系统自处理过程 系统的FE通信基于双平面,如果一个端口故障,将另一端口进行通信。 相关告警 无。 告警处理 1. 可能原因 硬件故障。 2. 处理建议 对于WSMU和WIFM板,需要检查网线的连接情况。 对于其它单板,需要检查WHSC板的运行情况。 DSP BRD: FN=1, SLN=2;(输入单板的框号槽号)1.3、WCKI时钟参考源丢失告警含义 1. 告警解释 当WCKI时钟参考源丢失时而产生此告警。 2. 告警参数 参数名称 参数含义 框号 WCKI板所在的框号 槽号 WCKI板所在的槽号 丢失时钟源端口号 丢失的时钟参考源号

6、 对系统的影响 可能使系统不能正常工作。 系统自处理过程 时钟参考源丢失,可能导致时钟系统不能正常工作。 相关告警 无。 告警处理 1. 可能原因 外部时钟源工作不正常。 连接外部时钟源的时钟线有问题、或时钟连线不正确 2. 处理建议 1观察设备面板CKI单板BITS时钟输入端口是否正常。2检查外部时钟源是否工作正常,如果不正常,更换时钟源。 3检查时钟线连接是否正确,如果连线正确,请更换时钟线。 1.4、控制框与业务框通信失败告警含义 1. 告警解释 当控制框和业务框之间的通信中断时产生此告警。 2. 告警参数 参数名称 参数含义 框号 框号 对系统的影响 控制框和业务框之间的通信中断。 系

7、统自处理过程 无。 相关告警 无。 告警处理 1. 可能原因 可能控制框与业务框的HSC之间连线不正确 可能业务框工作不正常。 可能业务框没有及时发心跳消息给控制框。 2. 处理建议 1. 检查控制框与业务框的HSC之间的连线是否正确,或更换网线,如果问题解决,这说明是连线有问题。 2. 观察业务框的WSMU板是否运行正常,如果不正常,更换WSMU单板看问题是否解决,如果仍然没有解决更换HSC板,如果仍然没有解决,那可能是背板有问题,需更换背板解决。 3. 检查CPU是否被某个任务长时间占用,导致没有发送心跳消息,或者有网络风暴,导致控制框无法正常接受到消息 1.5、BAM到主机通讯失败告警含

8、义 1. 告警解释 当BAM到主机通讯失败时,系统发出此告警。 2. 告警参数 参数名称 参数含义 模块号 表示与BAM无法通讯的模块号。 对系统的影响 BAM与主机之间无法通讯。 系统自处理过程 无。 相关告警 该告警由ALM-2364 BAM到主机连接中断 引发,ALM-2364 BAM到主机连接中断 表示BAM和交换机断连,因此必然导致该告警的产生。 告警处理 1. 可能原因 交换机有一个框的两个连接都断了。 2. 处理建议 1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。2、检查BAM机器网卡和LAN switchs: 3、检查BAM机器网卡和LAN swit

9、chs是否工作正常。并保证所有网线连接正常。告警是否恢复? 1.6、BAM到主机连接中断告警含义 1. 告警解释 当BAM与主机中断时,系统发出此告警。 2. 告警参数 参数名称 参数含义 模块号 表示与BAM无法通讯的模块号。 IP 与BAM连接失败的模块对应的IP地址。 对系统的影响 BAM与主机之间无法通讯。 系统自处理过程 无。 相关告警 该告警连带产生 ALM-2362 BAM到主机通讯失败 。 告警处理 1. 可能原因 交换机某一个框的一个连接断开。 2. 处理建议 1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。2、检查BAM机器网卡和LAN switc

10、hs: 3、检查BAM机器网卡和LAN switchs是否工作正常。并保证所有网线连接正常。告警是否恢复? 1.7、与NTP服务器断连告警含义 1. 告警解释 时间同步进程与NTP服务器断连,时间同步已停止。 2. 告警参数 无。 对系统的影响 系统时间无法和NTP服务器同步。 系统自处理过程 无。 相关告警 无。 告警处理 1. 可能原因 NTP服务器被停止或服务被关闭。 系统和NTP服务器之间的网络断连。 2. 处理建议 (1)、在MSOFT3000跟踪维护中用PING NTP服务器IP地址,检查网络是否正常。(2) 检查NTP服务器是否被停止,NTP服务器的时间服务是否被关闭。 (3)

11、检查系统和NTP服务器之间的网络是否断连。1.8、Q922链路故障告警含义 1. 告警解释 系统单板之间通过Q.922链路进行通信,底层为FE。当两个单板间的Q.922链路发生故障时,产生该告警。 当WSMU启动时,WHSC板会自动被复位,此时也会产生该告警。 2. 告警参数 参数名称 参数含义 源模块号 发出告警的单板的模块号 目的模块号 Q.922链路对端模块号 对系统的影响 使用该链路通信的两个模块之间通信中断。 该链路传输的业务发生中断。 系统自处理过程 无。 相关告警 无。 告警处理 1. 可能原因 Q.922链路发生故障。 WSMU启动。 2. 处理建议 1. 检查是否复位了WSM

12、U板? Y= 正常告警,不用处理 N= 转步骤(2) 2. 检查FE网口的状态是否正常? 观察设备面板HSC端口状态。Y= 转步骤(3) N= 更换不正常状态网口所在的单板 3. 检查单板的运行状态,如果单板发生故障,更换单板。 DSP BRD: FN=1, SLN=2, PSN=FB;(输入HSC单板框号、槽号、前后插板)1.9、TCP链路故障告警含义 1. 告警解释 系统监测到TCP链路出现故障时产生该告警。 WSMU板通过TCP链路与BAM和iGWB进行通信。 2. 告警参数 参数名称 参数含义 模块号 产生该告警的模块号 连接类型 出现故障TCP链路的连接类型,用于定位链路。如到BAM

13、的链路、到iGWB的链路。 对系统的影响 告警模块与目的模块之间的通信中断; 基于该TCP链路的业务中断。 系统自处理过程 无。 相关告警 无。 告警处理 1. 可能原因 网络连接网线故障; 网卡故障。 2. 处理建议 (1) 检查WHSC单板工作状态是否正常? Y=可能为对端设备如BAM、iGWB网卡故障。 N=更换故障单板。 DSP BRD: FN=1, SLN=2, PSN=FB;(输入HSC单板框号、槽号、前后插板)(2) 根据告警参数确认故障链路位置,检查TCP链路两端网卡的指示灯是否正常? Y=请联系华为当地办事处技术支援人员。 N=可能是网线连接问题。(3) 判断是否网线松脱,拔插一下两端的网线接头,确保网线连接正常,检查故障是否排除? Y=网线连接问题,结束。 N=可能是网卡故障。 1.10、CPU过载告警含义 1. 告警解释 单板CPU占用超过设定的阈值(使用命令SET CPUTHD设置)时,产生该告警。 2. 告警参数 参数名称 参数含义 板类型 发生CPU过载的单板的类型 框号 发生CPU过载的单板所在的机框号码 槽号 发生CPU过载的单板所在的槽位号码 位置 该单板在机框中的位置,包括前插板和后插板 过载级别 CPU过载的级别,包括14共四个级别 CPU占用率 告警发生时CPU的占用率。 对系统的影响 部分呼叫会丢弃,产生呼损。 系统自处理过程

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号