华为enodeblte常见故障分析指导

上传人:今*** 文档编号:106665017 上传时间:2019-10-15 格式:PPT 页数:46 大小:5.02MB
返回 下载 相关 举报
华为enodeblte常见故障分析指导_第1页
第1页 / 共46页
华为enodeblte常见故障分析指导_第2页
第2页 / 共46页
华为enodeblte常见故障分析指导_第3页
第3页 / 共46页
华为enodeblte常见故障分析指导_第4页
第4页 / 共46页
华为enodeblte常见故障分析指导_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《华为enodeblte常见故障分析指导》由会员分享,可在线阅读,更多相关《华为enodeblte常见故障分析指导(46页珍藏版)》请在金锄头文库上搜索。

1、FDD-LTE常见故障分析,Page 2,目录,传输故障常见问题分析 射频通道类故障常见问题分析,Page 3,LTE传输常见问题现象,Page 4,LTE传输故障关注点,Router/安全网关,Router,Router,SAE/M2000,IP/MPLS Aggregation,LanSwitch,Access Network,关注基站侧参数的配置(端口配置、IP层配置、安全参数配置、应用层配置等) 交换机传输参数配置(VLAN、QinQ等) 路由器传输参数配置(VRRP功能配置、IP地址、IP路由、MTU) 安全网关参数配置(证书、安全参数配置、通信矩阵) SAE/M2000参数配置(I

2、P层配置、应用层配置等),连通性问题定位总体思路,查看告警 通过告警信息初步判断故障发生的协议层次。低层协议的告警会引起高层协议的告警。首先要排除低层链路的故障,然后再观察是否继续存在高层协议告警。 观察端口灯状态 观察基站和直连传输设备指示灯是否正常。 链路层排查 检查基站侧的端口状态、ARP表项以及VLAN配置是否正确。 IP层排查 查看基站路由配置、使用Ping/TraceRT进行问题隔离。 应用层排查 若仍有应用层告警(SCTP等),检查基站侧对应的参数配置是否正确。 通信矩阵排查 在应用层链路参数配置正确时,需要查看传输网中防火墙、安全网关等设备是否关闭对应的端口。,Page 5,性

3、能类问题定位总体思路,一般性能类问题的现象为:业务达不到峰值、波动较大、有掉坑等。 查看传输路径上MTU 使用TraceRT来查看MTU,当MTU小于基站配置时,会产生大量的分片导致传输效率低。 传输网QoS检测 核心网非我司:使用UDP环回检测传输QoS; 我司核心网:使用IPPM实时检测传输网QoS; 抓包/第三方工具 在客户对传输网检查结果提出疑问时,可使用抓包或第三方工具(Smartbits)对传输网质量检测。 依据传输QoS计算峰值速率 对于TCP业务, 通过上述公式,可以计算出当前QoS下最大速率,和测试结果做对比。,Page 6,跟踪功能汇总,Page 7,TraceRT功能介绍

4、,Page 8,注意事项: 当启用TRACERT命令时,可以使用CTRL+Q来停止该命令。 该命令不能与PING、CFMTRACE、CFMPING命令同时启动。,在出现路由不通问题时,可使用TraceRT来判断网络中路由是否可达,检查网络连接是否可达,以及分析定位网络发生故障的位置。,UDPLOOP功能介绍S1接口,Page 9,一、在核心网侧使用loop udp enable使能UDPLOOP功能,二、在M2000上启动UDP测试任务,在出现TCP吞吐量下降、传输故障时,可以使用UDP环回功能检测传输网QoS和连通性。UDP环回可以通过对端发送UDP报文来检测网络的连通性及质量。UDP环回会

5、影响基站现有业务。,UDPLOOP功能介绍X2接口,Page 10,一、在远端基站侧使用使用SET UDPLOOP使用环回功能,环回时间默认值是1分钟,建议设成15到20分钟左右。,环回模式:远端环回SPECIALIPUDPPORTREMOTE,二、在M2000上启动UDP测试任务,UDPLOOP功能介绍结果查看,Page 11,双击测试如何就可以查看跟踪结果,IP PM技术原理,Page 12,FM,BR,sGW,eNB,Transport Network,FM,1,eNB performs periodic Forward Monitoring,sGW replies a Backward

6、 Report packet after receiving a FM packet,2,BR,eNB calculates jitter & RTT & packet loss ratio after receiving a BR packet,3,eNB performs periodic logical port bandwidth adjustment according to the mean jitter and the mean packet loss ratio in the interval,4,FSN n Total packet sent (PkTx) Total byt

7、e sent (ByteTx) Sending FM packet time (T1),FSN n Total packet sent (PkTx) Total byte sent (ByteTx) Sending FM packet time (T1) Total packet received (PkRx) Total byte received (ByteTx) Receiving FM packet time (T2) Sending BR packet time (T3),为了解决UDP环回对业务的影响,实时观察传输网QoS,可以使用IPPM功能。通过周期性的发生FM/BR帧来完成传

8、输网QoS的实时检测。,Page 13,IP传输故障处理思路,总体思路:分层/逐段排查定位 分层法:根据协议层,逐层定位,定位出实际故障点; 逐段法:完成故障隔离,对数据流进行分段,逐段环回,逐段定位; 具体介绍: 物理层故障排查 ARP/IP层故障排查 IPPATH异常处理 传输安全故障处理 应用层故障处理,Page 14,基本的观测点:告警、配置、物理连接。 主要手段:“检查网线/光模块”、“PC替代网元”,“检查配置(端口模式)”,物理层故障排查,物理线检查(水晶头等,网线超过100m?)换线 检查光模块(光模块/光纤插好、光模块是否损坏)更换光模块,PC替代网元 1. 使用PC和eNo

9、deB网口连接,查看告警是否消失;(FG/GE链路故障告警,错帧超限告警) 2. 使用PC和对端设备进行对接,查看电脑的灯是否可以点亮。 如果1)正常而2)不正常,对端端口物理故障。 如果1)不正常而2)正常,eNodeB上可能异常。 如果两个都正常,说明对端设备网口和eNodeB的网口兼容性不好,重点检查上面的端口协商参数。,三 端口参数检查 使用DSP ETHPORT和LST ETHPORT查看两端的端口对接参数,重点关注端口属性、速率和双工模式设置是否一致。 协商参数一致的含义:以速率来说,一端为100M,另外一端必定也是100M,或同时为AUTO。双工模式也是如此。 我们推荐为:,Pa

10、ge 15,ARP/IP层故障排查,1. ARP不通问题处理思路 a)了解ARP相关定位知识 eNodeB对报文处理流程是先根据IP Route查询对应的下一跳的MAC地址(对应ARP表项),只有在有ARP表时,才直接把此报文发送出去(ICMP,SCTP,UDP等等);如果eNodeB上没有此ARP表时,则先会发一个ARP请求的广播报文,来请求下一跳的MAC地址。,在出现IPPATH、SCTP等告警信息时,需要排查传输链路是否可用。 总体思路:检查基站告警信息、检查配置、Ping/TraceRT问题隔离、抓包。,Page 16,ARP表项建立失败的场景:初始建站ARP建立失败和ARP老化后建立

11、失败; b)问题定位方法: 在eNodeB上执行一下DSP ARP查询是否有下一跳的ARP表,如果有,则不是eNodeB的ARP表项问题,判断结束。 如果没有,使用DSP ETHPORT查询一下端口的收发包统计。 在eNodeB上执行一下ping命令,然后再执行一下DSP ARP,如果没有下一跳的ARP表,则是ARP表项问题。 再执行DSP ETHPORT查询一下端口的收发包统计,查看eNodeB发送和接收报文是否在增加,如果在增加基本说明eNodeB有问题的可能性很小。 如果包数在增加,使用LST VLANMAPLST VLANCLASS查看VLAN配置是否正确。 如果包数不在增加,则是eN

12、odeB的问题,则需要重启基站。 基站重启后问题仍旧存在,需要反馈信息给研发分析。,ARP/IP层故障排查,1. ARP不通问题处理思路,Page 17,2. IP不通问题处理思路 此类问题,大多是路由不通导致。 总体思路:检查基站配置、TraceRT问题隔离、抓包 在前面的ARP表项正常的情况下,问题处理思路为: 检查路由表配置 使用LST IPRTDSP IPRT查看基站的路由信息是否和规划的一致。 使用TraceRoute定位 使用TRACERT来查询发送报文经过的各个端点,看看到达哪个端口网关出现不通。 报文捕获/信息收集 在基站上通过STR PORTREDIRECT启用端口重镜像进行

13、抓包和分析。 收集一键式日志以及上面排查的结果给研发分析。,ARP/IP层故障排查,IPPATH不可用,Page 18,检查IP路由是否配置正确 执行LST IPRT和DSP IPRT可查询主控板的路由表,是否存在到达IPPATH对端地址的路由。 检查IPPATH参数配置 执行LST IPPATH查询本地IP和对端IP是否配置正确。 检查IPPATH的QoS配置 若地址对无问题,则检查QoS类型,一般建议配置如右图所示。 Ping/TraceRT问题隔离 首先Ping Path对端路由看是否ping通,在ping不通时,使用TraceRT进行问题隔离。 抓包 使用端口镜像在eNodeB进行抓包

14、。 规避方式 若以上步骤检查结果都正确,可尝试删除IPPATH重新 添加。,在基站出现IPPATH链路告警、S1接口告警时,需要先排查IPPATH的故障。 总体思路:检查基站配置、检查IPPATH QoS配置、抓包。,SCTP原理介绍,Page 19,依据3GPP协议规定,LTE的信令面的业务是承载在SCTP协议上的,通过SCTP多归属特性提供信令面的可靠性保护。 下面是SCTP正常的协商流程以及心跳检测报文。,Page 20,SCTP链路故障处理思路,总体手段:跟踪、Ping、报文捕获、删除重建 先检查底层传输FE/GE链路状态是否异常,有异常先排查链路故障处理 检查SCTP相关传输配置与传

15、输设备是否一致 执行LST SCTPLNK命令,检查IP地址、端口号是否和核心网端协商的一致,且需要确认中间传输网的MTU,两端MTU要小于或等于传输网的MTU。 在M2000上启用SCTP跟踪 若可以跟踪到SCTP的报文,则需要排查中间传输网配置是否正确。 PING 目的地址,确认到目的地址是否PING通 如果不通,需要确认基站的路由配置,中间传输设备的路由配置。 如果PING通, 尝试RMV SCTPLNK/ADD SCTPLNK重新协商建链,Page 21,IPCLK时钟类问题定位思路(1),采用IP CLK作为时钟源,常见的问题现象是:时钟源丢失、时钟无法锁定。 IPCLK时钟分为基站

16、侧和IPCL Server侧两个部分。 定位的思路:排查物理层/IP层传输问题,IP时钟强相关配置检查,时钟信息采集(时钟交互跟踪,抖动数据采集,时钟交互抓包)。 IPCLK Server定位思路 LST SOFTWARE,检查IPCLK版本是否支持所配置的时钟协议。 DSP WORKSTATUS,只有当工作状态是server时,IPCLK才可以发包。 DSP CLIENTMODE,DSP PTPPARA查看IPCLK当前客户端相关参数设置,检查当前客户端模式、业务网口类型及支持大小基站个数是否满足需要,以及server侧下发时钟报文频率等时钟参数。 DSP CLKSTAT查看server状态,一般情况处于锁定状态/hold才可以发包。 运行LMT上的IPCLK_TRACE跟踪,跟踪对应eNB的报文(务必对两个端口分别都进行跟踪:CLIENT PORT = 319、320,时长:3分钟) 。,Page 22,IPCLK时钟类问题定位思路(2),eNodeB侧的定位思路: 检查基站的时钟配置 执行LST CLKSYNCMODE

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号