传输网告警故障典型案例

上传人:夏** 文档编号:509468972 上传时间:2023-12-14 格式:DOCX 页数:14 大小:210.24KB
返回 下载 相关 举报
传输网告警故障典型案例_第1页
第1页 / 共14页
传输网告警故障典型案例_第2页
第2页 / 共14页
传输网告警故障典型案例_第3页
第3页 / 共14页
传输网告警故障典型案例_第4页
第4页 / 共14页
传输网告警故障典型案例_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《传输网告警故障典型案例》由会员分享,可在线阅读,更多相关《传输网告警故障典型案例(14页珍藏版)》请在金锄头文库上搜索。

1、本地传输网故障告警典型案例光缆线路中断导致业务全阻系统概述某局本地传输网采用 ZXSM-150/600/2500 设备组网,整个网络由 5 端 ZXSM-150/600/2500 网元组成,构成一个通道保护环带链的结构,环一上 的传输速率是2.5Gbit/s, F到C的链上的传输速率是622Mbit/s, B和D 的链上的传输速率是155Mbit/s。网络结构如图6-1所示。中心局设在E 网元,网管终端放在中心局。链上光纤连接关系如下:F网元的27#OL4接A网元7#OL4, A网元的10#OL4接B网元 7#OL4, B网元的10#OL4接C网元7#OL4, B网元的13#0L1接D网元7#

2、0L1。所有其他网元均只和E网元有业务配置,A到E的业务使用链上的1#AU, B到E的业务使 用链上的2#AU, C到E的业务使用链上的3#AU, D到E的业务使用链上的4#AU。网元A 设置为内时钟,其余网元通过S1使用双向提取线路时钟。故障现象描述A, B, C, D到E的业务全部中断,通过网管采集告警发现,F网元的27#OL4上有“622M 接收信号丢失” A网元的7#OL4上有“622M接收信号丢失” 7#和 10#OL4上有14#AU 的“AU通道告警指示信号” “不可用时间开始”等告警。B, C, D网元的光板上有相关 AU的AU通道告警指示信号”、“不可用时间开始”等告警。A网元

3、和F网元间有B1/B2/B3 UAS 性能指示。故障分析由于有再生段和复用段等高级别的告警和 B1/B2 性能,首先必须排除光路上的故障和外部 光缆线路的因素。通过上面的告警指示可以知道,A和F都没有收到光信号。故障在A和F 之间,由于A和F光板同时产生故障的可能性比较小,因此外部光缆线路等因素导致上述 故障的可能性比较大。故障定位和排除步骤采用光功率指标测试法:到网元F所在机房,用光功率计从27#光板输入口、ODF的收光 法兰连接、 ODF 上光缆成端的法兰连接,逐级测量光接口的功率。光功率计上均为收无光 率指示。测试27#光板的发口光功率,为-2.15dBm,由于F和A距离25km,采用L

4、4.1的 光板连接,测试值在发送指标范围内。然后联系网元A所在机房,使用光功率计做类似测 试,收光测试结果相同,7#OL4发口光功率,为-1.85dBm。于是确认是外部光缆线路中断, 通知局方处理。并配合局方调度中断的业务到其他设备和线路上。进一步的工作:必须确认A网元7#OL4和F网元的27#OL4收口良好。采用尾纤自环的办 法将光板的收口和发口自环,但必须保证光板收口接收从尾纤过来的光功率在指标范围内。 此时如果该网元指示“622M接收信号丢失”告警消失,证明该光板收口良好。通过局方检查确认光缆线路由于工程施工被挖断,熔接处理后光缆恢复正常。在网元A和F 测试收口光功率正常后,将光板上的尾

5、纤接回,光路正常,告警消失。注意:因为局方处理外部光缆线路故障要使用OTDR (光时域反射计),验证A和F光板 收发接口良好后,必须将光板上的收发尾纤拔掉,避免OTDR发出的强光功率损伤光板上 的光器件。设备温度过高导致B2误码系统概述某局本地传输网采用 ZXSM-150/600/2500 系统组网,整个网络由 2 端 ZXSM-150/600/2500网元组成,传输速率是2.5Gbit/s。采用点对点无保护 链形组网,网络结构如图6-2 所示。中心局设在 B 网元,网管终端放在 中心局。图 6-2 案例 2 网络结构图光纤连接关系如下:A网元的5#OI16接B网元5#OI16。A网元和B网元

6、的业务配置使用 全部16个AU资源。网元B设置为外时钟,网元A提取线路时钟。故障现象描述局方反映交换业务层有误码,怀疑是传输有故障。检查网管发现:网元A的7#LP16板上有 大量的“B2, B3 BBE/ES/SES性能值”上报,同时有“复用段信号劣化”和“B2, B3 BBE/ES/SES 性能超值”告警。网元B的7#LP16板上有大量的“B2, B3 FEBBE/FEES/FESES性能值”, 同时有“复用段远端缺陷指示”和“B2, B3 FEBBE/FEES/FESES性能超值”告警。故障分析由于有 B2/B3 和复用段告警,是复用段上的故障。首先检查机房环境和设备状况,然后再 使用高阶

7、故障定位处理的一般方法处理故障。故障定位和排除步骤检查设备发现设备的风扇被局方的维护人员关掉,LP16板温度非常高,怀疑故障由此引起。 将风扇打开 10 分钟后,观察网管性能和告警指示,故障消除。故障原因:由于LP16板温度过高,芯片不能正常工作而产生误码。光板故障导致 B2 误码系统概述某局本地传输网采用中兴通讯的 ZXSM-150/600/2500 设备组网,整个网 络由 3 端 ZXSM-150/600/2500 网元组成,构成一个无保护链结构,传输 速率为622Mbit/s。网络结构如图6-3所示,中心局设在A网元。7#10#7#10#ABC图 6-3 案例 3 网络结构图光纤连接关系

8、如下:A网元的7#OL4接B网元10#OL4,B网元的7#OL4接C网元10#OL4。 各网元间都有2M业务。故障现象描述从网管上查询监视的性能数据,在A站发现该站与B站和C站间的业务在支路上有大量低 阶误码V5 BBE,在7#OL4线路上有大量B3 BBE和B2 BBE误码。检查B站,发现该站的 10#OL4线路上有大量B3 FEBBE和B2 FEBBE.在支路上与 A 站间的业务有大量 V5 FEBBE,而与C站间的业务正常。检查C站,发现该站只有在支路上与A站间的业务有大 量 V5 FEBBE。故障分析先定位故障网元。从A站与B站,A站与C站间业务都有误码,而B站与C站间无误码这 一规律

9、可以判断出故障应该出在A站与B站间。因为所有有误码的业务都会经过这段路由。 但问题是出在A站或B站,还是在光路上,这就需要分析性能数据。我们先分析线路上的性能数据。线路上共有B1/B2/B3三种误码监测开销字节,分别监测各 自产生点和终结点之间的路由质量。其中B1字节,测两站再生段间的路由,B2字节监测 两站复用段之间的路由,而B3则只监测两站间某高阶通道间的路由。显然B3监测的路由 包括B2和B1监测的路由,而B2监测的路由包括Bl监测的路由。从现场的数据来,只有B2和B3误码数据,说明站点的再生段之间没有问题,从而排除了 光路问题的可能性。有B2误码,说明两站的复用段路由之间有故障。从误码

10、数据内容来看, A 站有背景块误码 BBE 数据,而 B 站有远端背景块误码 FEBBE 数据,这说明信号中的误 码是在A站监测到的,但这并不说明问题一定出在A站,因为我们知道,误码都是在下行 信号流中检测到的,因此,A站检测到的误码既可能来自于本站的接收端,也可能来自对端 站 B 站的发送端。故障定位和排除步骤通过逐站排除的方法来定位故障。先自环本站A站西向光路,发现本站误码消失,说明问 题不在本站,更换B站光板,全网误码消失,问题解决。窍门在上面的问题分析中,根据B1/B2/B3误码所检测路由的覆盖关系,使用了一个判断方法, 那就是假定B1误码会引起B2和B3误码,而B2误码会引起B3误码

11、。但在事实上这一规律也不是绝对的,因为虽然三者之间所监测的路由有覆盖关系,但三者各 自监测的内容并不具有覆盖关系,Bl监测该STM-N帧的所有字节,而B2只监测除再生段 开销以外的所有字节,B3只监测各通道VC-3和VC-4,因此当开销字节出现误码时,三者 之间的关联性就不能实现了。比如在再生段开销字节B1中监测出误码,B2和B3是不会检 测出来的。然而在实际维护中,我们发现仅仅是开销字节出误码的情况非常少见,因此利用 B1/B2/B3 的路由覆盖关系来定位故障常常可以作为一个经验性的方法来运用。时钟导致B3误码系统概述某局本地传输网采用中兴通讯的 ZXSM-150/600/2500 系统组网

12、,整个网 络由9端ZXSM-150/600/2500网元组成,传输速率是622Mbit/s。构成两 个无额外业务的复用段保护环,网络结构如图6-4 所示。中心局设在 A 网元,网管终端放在中心局。西环光纤连接关系如下:A网元的10#OL4接B网元7#OL4, B网元的10#OL4接C网元 7#OL4, C网元的10#OL4接D网元27#OL4, D网元的30#OL4接E网元7#OL4, E网元 的10#OL4接G网元7#OL4, G网元的10#OL4接A网元7#OL4。东环光纤连接关系如下: A 网元的 30#OL4 接 H 网元 7#OL4, H 网元的 10#OL4 接 I 网元 7#OL

13、4, I 网元的 10#OL4 接 A 网元 27#OL4。所有其他网元均只和A网元有业务配置,西环中A到B业务使用10#OL4方向的1#AU, A 到C和D业务使用10#OL4方向的2#AU; A到G业务使用7#OL4方向的2#AU,A到E 和F业务使用7#OL4方向的2#AU。东环中A到H业务使用30#OL4方向的1、2#AU,A 到I业务使用10#OL4方向的1、2#AU。网元A设置为内时钟,其余网元通过S1使用双向 提取线路时钟。故障现象描述西环A到B的所有业务性能劣化,交换机和基站工作不正常,通过网管发现A网元10#OL4 的1#AU有B3性能超值告警,同时性能上有连续的B3 BBE

14、/ES,频率比较高,每分钟报 100200个,同时相应的EP1上所有支路均有连续的V5 BBE/FEBBE/ES/FEES,各支路的 V5 误码指示不等,小的每分钟报2个,大的每分钟报1000个。故障分析由于没有再生段和复用段等更高级别的告警和B1/B2性能,可以把故障定位在高阶通道层。 通过提取网管历史告警和性能,发现发生告警和性能的网元只有A和B,初步定位故障范 围。由于观察性能发现两端网元V5都有近端和远端性能,为便于故障定位,从网元A到网 元B依次做对A 10#OL4的1#AU的终端侧环回、对B 7#OL4的1#AU的线路侧环回,通 过对网元A10#OL4的1#AU时隙的任一支路长时间

15、(15分钟左右)挂误码仪定位故障网元。 挂表后发现在网元A 10#OL4的1#AU的终端侧环回就有上述告警和相关性能,必须先排除 此故障,再确定网元B是否有故障存在。故障定位和排除步骤定位网元A的故障点。首先分析网元A可能的故障点,由于有B3,所以凡是有AU总线的 地方都有可能出现。列写可能的故障源如下:网元A的10#OL4光板;网元A的CS交叉板; 和网元A的10#OL4光板1#AU交叉连接的2#、#EP1支路板的AU总线;网元A的PWCK 时钟板;网元A的MB后背板插针接插不良。排除故障:通过对网元A的10#OL4光板拔收纤,产生复用段倒换,使B和A的业务从7#OL4 的3#AU接收,然后

16、长时间(1小时左右)观察,误码仪没有任何误码指示;同时网管除A 和B有复用段倒换告警指示外,网元A的10#OL4光板1#AU没有性能超值告警和性能指 示,于是排除网元A的10#OL4光板故障的可能性。将网元A的10#OL4光板收纤插回,等待网管上A和B的复用段倒换告警指示消失后,通 过网管对网元 A 的主备交叉板做倒换。倒换后观察误码仪,误码仍然存在,网管上很快就 产生了性能超值告警和性能指示,于是排除网元A交叉板故障的可能性。33#和 34#EP1 支路板尚未开业务,观察相关支路板的历史性能并挂误码仪确认上述支路板 性能良好,用它们更换2#和3#EP1,故障依旧,更换后的支路板放到33#和34#槽位后测试 良好,排除了网元A的2#和 3#EP1支路板故障的可能性。分析:由于该局交验不久,正在试运行阶段,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号