隐形链路故障排查分析

上传人:d****0 文档编号:148786021 上传时间:2020-10-22 格式:DOC 页数:9 大小:832.50KB
返回 下载 相关 举报
隐形链路故障排查分析_第1页
第1页 / 共9页
隐形链路故障排查分析_第2页
第2页 / 共9页
隐形链路故障排查分析_第3页
第3页 / 共9页
隐形链路故障排查分析_第4页
第4页 / 共9页
隐形链路故障排查分析_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《隐形链路故障排查分析》由会员分享,可在线阅读,更多相关《隐形链路故障排查分析(9页珍藏版)》请在金锄头文库上搜索。

1、隐形链路故障排查分析【摘 要】滁州电信大王固网BBU下挂东升花园小区出现RRU内部故障告警,告警详情为TX通道异常,多次处理仍出现异常,从RRU侧排查及BBU侧排查后,定位为FS单板或者光物理器件隐形故障。【关键字】内部故障告警 TX通道异常 隐形故障1.【故障现象】2018年5月1日,滁州电信大王固网BBU下挂东升花园小区出现RRU内部故障告警,告警详情为TX通道异常,如图1所示。 按正常处理内部故障流程,先进行单板硬件检测后显示RRU故障,如图2所示。图1 告警详情图2 单板硬件检测结果专业网管查询该小区网络日常指标,5月1日后该小区日常指标异常,无用户,无流量,具体如图(3)所示。 图3

2、 东升花园日常网络指标2.【故障分析】2.1现场硬件排查1).初步判定RRU故障,通知代维上站处理,代维进行掉电复位后告警恢复。2).告警恢复后,查询小区状态,RRU功率状态都显示正常。 图4 小区状态查询结果 图5 RRU功率查询结果3).继上次告警恢复后,几天时间,告警再次出现。因为上次硬复位,只是临时告警恢复。所以通知代维进行RRU更换。更换后告警消除,并且查询各项运行状态显示正常。4).5月6日,故障告警再次出现,因为上次进行了RRU更换,再次诊断RRU还是显示RRU故障,上站再次更换RRU。告警暂时恢复。5).几天后再次复现,更换两次RRU,所以直接进行了可能导致告警的部件、光纤、光

3、模块、天线、馈线进行了更换。与之前情况相同,再次出现告警,更换所有链路硬件未能解决问题。图(6)小区告警详情6.现场维护人员未能确定故障具体原因。2.2 RRU侧排查2.2.1故障说明该告警的含义:前向的功率低,上报告警。统计故障期间的所有历史告警,可以看出“内部故障告警”的发生时间都在单板上电后,大概10分钟上报。和代码设计对照,是符合告警规则。通过诊断分析,单板上各制式载波TSSI均正常,但是各制式的TSSI值为0,显示“无功率状态”。可以看出这个告警检测是正常。接下来的问题是:为什么分载波功率为0?2.2.2故障分析采集信息,tssi命令可以查出的分载波功率也是0,pa是正常开启的。采集

4、底层的功率状态,发现底层的PA被触发了功放保护,从而触发无功率,上报低功率的内部故障告警。进而将底层保护打开,以及在RU内部源的情况下,功率正常。开始怀疑底层链路过来的功率异常。查询底层的光口信息统计状态,存在异常,且RRU上Id在频繁跳变。如下图所示:图7 RRU内部信息查询2.2.3结果以及处理建议RRU侧分析结果:RRU本身并无异常,问题的指向BBU-RRU之间的链路问题,后续处理建议:引入内部故障TX通道异常的原因有多种多样,可能是RRU单板内部触发,也可能是单板外部触发。单板内部触发的可能是软件bug触发,或者硬件故障触发。建议如下:(1)根据实验室现象,如果是硬件坏掉故障,通过复位

5、等各种手段,这个RRU都不会恢复正常。(2)如果是软件故障,可以观察其他RRU是否有相同配置,如果存在相同配置,且不为故障,说明不是一个共性问题,可以进一步怀疑链路异常。这种情况下,如果只更换RRU,故障不会恢复。2.3 BBU侧排查2.3.1故障分析登录到RRU,采集BBU侧的光口信息,确认RRU侧光口接收有链路告警。根据RRU的处理原则,在有告警时,会把上报给BSP的RRU_ID屏蔽成为0xfe(254),此时软件呈现的就是异常状态。如下图所示,软件获取的是异常的RRU_ID。图8 RRU软件获取的是异常登陆FS单板,在FS单板查看光口信息,发现FS链路存在异常,looptest控制字出现

6、偶发告警。该控制字为BBU发送信息给RRU,RRU环回给BBU,在BBU侧做检查,如果一致则认为正常。如下图所示,每一个bit代表一级RRU的告警,1代表有告警,可以看到:图9 looptest控制字出现偶发告警详情图10 looptest检测原理2.3.2故障定位从上述的信息看,BBU-RRU的链路存在异常点。可能是由于光路以及硬件故障导致。3.【故障处理】根据现场反馈光纤以及光模块已更换,故障仍存在,进一步排查BBU单板,在更换FS单板后问题解决,故障小区网络指标恢复正常。初步确认是该FS单板或者光物理器件上存在问题导致,该问题目前定位为单板隐性故障,故障单板已经标注原因送修研发单独处理分

7、析。图11 故障小区恢复后网络指标详情4.【总结】日常处理故障的过程中,要根据现场实际情况做出合理的判断,避免重复且无效的上站。对于BBU-RRU之间的链路问题整理基本排查的思路具体如下图所示,后续故障处理过程中可作参考。分类故障原因故障表现影响范围解决思路或方法光纤光纤破损光信号色散等光功率更换光纤光纤弯曲度过大光衰过大光功率整理光纤,减小弯曲度。光纤头端面污染光衰过大光功率清洁光纤端面光纤模式不匹配光衰过大光功率更换匹配光纤连接鸳鸯线光口信息收发不匹配业务异常重新按照正确的序号连接光纤光纤长度过长光衰过大光功率更换光纤、更换光模块光纤未插紧光衰过大光功率工程整改,重新插紧光纤受挤压变形光衰过大光功率更换光纤光模块光接口污染光衰过大光功率清洁光模块光模块不在位/未插紧光模块不在位收、发异常重新拔插光模块无输入光信号接收无光光功率排查光纤或对端发送源发送光功率过低发送光功率过低对端收异常更换光模块光模块速率不匹配通讯异常通讯异常更改配置、更换光模块单板环境过温误码率过大传输误码处理环境过温问题单板硬件故障单板硬件故障光口等故障处理单板硬件故障表1 光路问题排查思路

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 电子/通信 > 网规网优

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号