10_EPON设备故障处理交流

上传人:工**** 文档编号:567248299 上传时间:2024-07-19 格式:PPT 页数:52 大小:2.38MB
返回 下载 相关 举报
10_EPON设备故障处理交流_第1页
第1页 / 共52页
10_EPON设备故障处理交流_第2页
第2页 / 共52页
10_EPON设备故障处理交流_第3页
第3页 / 共52页
10_EPON设备故障处理交流_第4页
第4页 / 共52页
10_EPON设备故障处理交流_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《10_EPON设备故障处理交流》由会员分享,可在线阅读,更多相关《10_EPON设备故障处理交流(52页珍藏版)》请在金锄头文库上搜索。

1、综合&宽带接入D&T团队EPONEPON设备常见故障处理设备常见故障处理设备常见故障处理设备常见故障处理V1.1V1.1PO_SM01_C1_P1PO_SM01_C1_P1本章学习目标本章学习目标本章学习目标本章学习目标q通过本章的学习,你可以获得以下收获:了解 EPON 设备故障处理方法2 故障处理注意事项故障处理注意事项故障处理注意事项故障处理注意事项处理过程中如遇到难以定位解决的问题,可尽快联系厂家进行处理。在紧急故障处理时,要及时、准确记录必要的信息和处理步骤,以供后续分析故障原因所用;需要收集的信息包括:1版本信息,包括系统软件的版本,ONU版本,相关单板版本。2提供现场设备的组网图

2、。3描述设备基本配置情况,包括ONU数目,单板类型和数量, QINQ配置。4详细描述故障现象。5提供相关的告警。6. 提供故障影响范围3 EPONEPON系统故障定位系统故障定位系统故障定位系统故障定位根据用户申告和网管告警判断故障的范围有多大,是单个ONU的问题,还是所有ONU业务中断,是一个PON口下的ONU,还是所有PON口的ONU。然后依此判断可能的故障点。OLT侧故障上联网络出现故障ODN网故障单个ONU故障、具备某种相同属性ONU发生故障.4常见故障处理常见故障处理常见故障处理常见故障处理无源分光器ONUONUOLTONUIP数据网用户ABCDE5ONU无法注册处理流程无法注册处理

3、流程lONU是否在所查看的PON下?可以通过网管查看整个OLT的未注册ONU,其会标识未注册的ONU是从哪个PON口上报的。l测量ONU侧接收光功率是否大于-24db。如果小于-24db,那么应逐级检查光路跳接点是否正常。l查看ONU对应的PON口灯是否亮或闪烁l光路距离是否超过20KM:系统缺省仅支持20KM,超过20KM的ONU即使接收光功率正常,也无法注册。lONU光模块或硬件故障,更换ONU试试常见故障处理常见故障处理6上网业务故障处理流程:上网业务故障处理流程:l首先查看ONU是否能正常在线?l检查ONU业务vlan设置是否正确。l通过show mac查看ONU子接口能否学习到电脑或

4、路由器mac。如果学习不到,应确认ONU是否能稳定在线?是否有频繁掉线告警?l通过show mac vlan pvlanid查看是否能从上联口pvlan学习到网关mac。如果无法学习到网关mac,可能是上联设备Pvlan没有透传。检查上联设备VLAN配置和bas上数据配置。常见故障处理常见故障处理7IPTV业务故障处理流程业务故障处理流程l如果同一个ONU其他业务正常,那么首先确认是单播业务(点播、回看)不通还是组播业务(频道直播,也有可能采用单播方式,取决于IPTV平台设置)l如果是单播、组播均不正常,那么首先vlan数据配置是否正常;l再次检查ONU上联带宽分配,缺省ONU带宽为2000k

5、bps,对于视频业务可能带宽不足;l检查mac表学习正常(ONU学习机顶盒mac、OLT或ONU上联口学习网关mac。l如果是只组播业务不通,详见下面的组播业务故障处理流程常见故障处理常见故障处理8VOIP业务故障处理流程业务故障处理流程l查看IAD注册状态,是否正常注册成功 ;l如果IAD注册状态不正常,逐段ping iad所在网关IP、SS IP,检查整个网络通路是否正常。l如果能ping通,还是注册不上,核对双方配置的对接参数是否正确,特别是域名; l终端可以注册成功,但是用户无法正常呼叫,首先需要查的就是USER TID和RTP TID在终端和软交换上是否配置一致 ;l如果是业务时通时

6、断,首先ping包测试网络是否丢包,然后检查双方RTP TID设置是否一致?l抓包和信令跟踪分析故障原因。常见故障处理常见故障处理9IPTV组播业务故障处理流程组播业务故障处理流程l查看上联端口是否可以从组播vlan学习到macl检查OLT上是否将该ONU添加到组播接收端口?Show igmp mvlan 29l检查ONU子接口是否正确透传组播vlan 29 ?Show run interface epon-onu_0/x/x:xl对于通过远程下发配置的,检查是否已经对组播报文剥离tag使能?Show onu run con epon-onu_0/x/x:xmulticast vlan tag

7、-strip port eth_0/2 enablel查看OLT上组播表是否已经建立。 show igmp dynamic-memberl对于MDU,还需要登录ONU,进一步检查ONU上的组播配置常见故障处理常见故障处理10故障现象故障现象l某局反映F822下挂用户观看IPTV时点播业务正常,组播业务很卡。故障处理故障处理l检查ONU带宽没有问题;l组播很卡说明不是没有组播信号,而是组播带宽受到限制。于是检查ONU上的组播设置,发现F822上联口系统缺省的组播报文限速为100ppsF822-1(config)# show interface gei_0/3/1Interface : 3/1Mu

8、lticastRateLimit : 100ppsl修改上联口的组播限速F822-1(config-if)# eth-switch multicast 2048修改后测试业务正常。典型故障案例典型故障案例组播业务故障处理一例11故障现象故障现象l某局新开ONU注册不上,在ONU侧测量光功率为-21db,在允许范围,但OLT上一直无法发现该ONU。故障处理故障处理l了解组网情况:该PON口为一个新开的PON口,只挂这个ONU;l将ONU拿到OLT近端的一个光交节点测试,发现可以注册,判断可能原先光路距离过长了,向现场了解光路情况,得知该ONU到OLT光路超过20KM,估计有25KM左右,为了避免

9、光衰过大,特意使用了一个1:4分光器。l故障原因已经清楚:PON系统目前支持的最远注册距离是20KM,超过20KM后,即使光衰在ONU的接收范围内,依然是无法注册的。lOLT上可以临时调整最长距离,但一般不建议这样操作lC220(config)#interface epon-olt_0/1/4lC220(config-if)#maxrtt ? Default value is 13524(TQ).lC220(config-if)#maxrtt 16905/25KM:25*13524/20 = 16905l该设置最大距离建议不超过30KM,同PON下不同ONU之间光路距离差距不要超过10KM典型

10、故障案例典型故障案例光路距离太长导致ONU注册不上故障12故障现象故障现象l某局modem用户从原先PSTN网络中换到F820下,modem拨号不成功。 故障处理故障处理l现场使用的modem支持V92协议,出现问题时通过修改增益、tdm与ip编码的一致性等都没有解决该问题。通过芯片产家的分析,建议将modem降速。l相比V90协议增加了3个功能,一个是提高上行速率到48k;一个是拨号过程中可以支持语言通话;再一个就是快速连接。快速连接就是将第一次拨号成功的一些协商配置项保存为文件,以后再拨号时可以默认调用这些配置项而省略协商过程。对于线路没发生变化的modem可以提高协商速度,但对于六安这种

11、从PSTN切换到F820的modem,如果还用之前的配置项,则会影响modem拨号的成功率。现场将modem使用的协议从V92改成V90,也就是去掉新增的3个功能后,拨号能够成功 。l这个问题主要是由于设备使用环境发生变化后,相关的配置未做相应的修改,通过修改modem的相关参数就可以解决 典型故障案例典型故障案例modem拨号不成功问题分析 13故障现象故障现象l某局F820同华为SS对接,用户提机通话约2分钟左右就断话。 故障处理故障处理l从信令上通话过程中会占用F820上的物理终结点和rtp终结点,默认的配置中rtp终结点会每隔一段时间给SS发审计消息,以确认该rtp终结点的占用是否正常

12、,但华为的SS并不支持这样的检测机制,会给F820回错,因此将该rtp释放,从而影响话路。l对于与华为SS通过H248协议对接的地方,都需要将rtp的心跳检测功能关闭。修改命令如下:lZXAN(config-voip)#mgc h248tid link-kept-flag 0l0表示关闭心跳检测;1表示打开心跳检测。 典型故障案例典型故障案例F820语音通话2分钟左右断话问题 14故障现象故障现象l某局一个C220下挂的所有9806H用户均无法获取到IP地址 故障处理故障处理l该OLT下用户业务原先都是好的,经了解,昨晚上层IPTV承载网设备做了割接,割接后其他设备(包括该C220下挂的其他O

13、NU设备)用户IPTV均正常,只有9806H的用户反映无法获取到IP地址。l故障定位应该是和9806H的配置有关系,登录9806H查看,发现上联口设置了禁止广播转发l9806H-1(cfg-if-ge-5/1)# show interface 5/1 lInterface : 5/1lFloodForWard : disablelBroadCastRateLimit : disable典型故障案例典型故障案例9806H下挂用户获取不到下挂用户获取不到IP地址故障地址故障 15故障处理(续)故障处理(续)l该设置后,如果DHCP server响应报文是以广播方式下发的,将导致机顶盒无法收到响应报

14、文。之前业务正常是因为其DCHP报文都是采用单播方式下发的,而昨晚上层设备刚好做过割接,可能方式产生改变,于是修改配置。l9806H-1(cfg-if-ge-5/1)# rate-limit broadcast 2048/单位ppsl测试机顶盒能正常获取到IP了。证实了上述推断。典型故障案例典型故障案例9806H下挂用户获取不到下挂用户获取不到IP地址故障地址故障 (续)(续)16典型故障案例典型故障案例9806H无法配置语音无法配置语音IP故障现象故障现象l配置ip subnet voip时提示冲突conflict。故障处理故障处理l经检查,发现分配的语音IP地址为10段的,而9806H缺省

15、的带外ip host是10.62.5.101/255.0.0.0,因此所有10网段都会产生冲突,将带外掩码改成24位后即可。l数据规划需要保证带内、带外、语音IP不在同一个网段,避免产生冲突。17典型故障案例典型故障案例9806H个别用户数据无法删除个别用户数据无法删除故障现象故障现象l使用9806(ag)# del-slctermid begin slot 3 num 48 命令删除用户时提示“DB: Error delete ”。故障处理故障处理l如果窄带端口处于被占用状态(Seize/LineBusy),该端口的TID数据是不能被删掉的,会提示DB: Error delete,此时应先g

16、et-slcstatu 查看一下相应端口是否被占用(也可能外线接触不好)。l在这种情况下,可以拔掉外线/或者复位用户板后迅速删除。 /如果外线或话机没挂好,过一会儿仍然会导致端口状态占用。因此动作要快,建议写好删除脚本。18典型故障案例典型故障案例IAD用户拨打用户拨打1000号无法挂断号无法挂断故障现象故障现象l某局IAD出现10000号无法挂断的问题,试了其他固话号码都可以正常挂断包括114,95588等,手机也可以正常挂断。但是拨打10000号后始终挂不断,到20多秒时估计电话超时而挂断。故障处理故障处理l跟踪信令发现挂机时ONU正确上报了al/on挂机消息,但是SS没有下发指令释放资源

17、与电路;最后查出,SS设置了,只有被叫挂机才结束通话。SS侧修改数据后正常19典型故障案例典型故障案例POS机刷卡不成功问题机刷卡不成功问题故障现象故障现象l用户的农行金穗支付通POS机拨号后,屏幕显示先是“连接中心。”再是“接收数据。”,接着过一会儿就断线,无法正常连接操作。正常时应该是在“接收数据。”后显示操作界面能实现转帐等功能 故障处理故障处理l该IAD用户拨打电话业务正常。在软交换平台上给此POS机所拨的接入号码配置“业务控制媒体”数据,使得在软交换上能够优先处理保证稳定建链。但此数据配置后POS机故障现象依旧。l进一步抓包分析,发现从软交换到C220的两次丢包率为2.1%和3.4%

18、。确认是C220上层IP承载网的RTP丢包率过大 。lMODEM和传真业务的丢包率要求一般不能超过0.5%;POS业务一般不能超过1% 解决方案解决方案l解决网络丢包问题l配置冗余:mod-rtppar parid 1 g711redundancy 13 /1-3可以试着修改,但配置冗余只能解决一般较轻丢包,严重丢包还需解决网络问题。20典型故障案例典型故障案例IAD用户电话时好时坏用户电话时好时坏故障现象故障现象l某9806H下挂用户使用一段时间后就出现电话不能用,当被叫能振铃,提机就听忙音。 故障处理故障处理l经过信令跟踪,发现是MG与MGC的RTP termid不一致导致无法拨通。lMG

19、发的:lRecord 12l时间=11:45:32l=!/1 :2944 P=688181764C=21A=A2,A=RTP/000056MLv=0lc=IN IP4 10.251.130.2lt=0 0lm=audio 10110 RTP/AVP 8la=ptime:20l21典型故障案例典型故障案例IAD用户电话时好时坏(续)用户电话时好时坏(续)故障处理(续)故障处理(续)lSS发的:lRecord 15l时间=11:45:32l=MEGACO/1 61.157.213.2:2944 T=695915016C=21MF=A2MOMO=SR,RV=OFF,RG=OFF,tdmc/ec=ON

20、,E=688249347ctyp/dtone,al/*,SG,MF=RTP/56MOMO=SR,RV=OFF,RG=OFF,Rv=0lc=IN IP4 61.157.213.2lm=audio 26048 RTP/AVP 8la=ptime:20l22典型故障案例典型故障案例IAD用户电话时好时坏(续)用户电话时好时坏(续)故障处理(续)故障处理(续)l所以MG回error:lRecord 16l时间=11:45:32l=!/1 :2944 P=695915016C=21MF=A2,MF=$ER=410Incorrect identifier l将MG与MGC的RTP termid修改成一致,

21、故障解决。l小结:本例是由于双方RTP设置不一致导致(AG侧设置为RTP/00056,SS侧设置为RTP/56)。实际上如果双方的RTP资源数量不相符也会出现单通现象。23典型故障案例典型故障案例9806H用户电话无法使用用户电话无法使用故障现象故障现象l9806H下所有用户电话摘机忙音,有时有拨号音,但拨号后中断出现忙音 故障处理故障处理l查看H.248状态,发现有时是ok,一两分钟后break,不断重复此过程。l查看ips、slc的termid与ss一致并且状态都正常,ping软交换不丢包。l更换语音ip、语音板、主控板进行测试,仍然没有解决故障。l由于9806H采用域名进行注册,怀疑可能

22、是域名冲突。l联系SS核对数据,发现该节点配置的域名错误,同另外一个节点产生冲突,修改后正常。有一例类似故障有一例类似故障lSS上抓信令发现9806H不断在上报重新注册消息,但在9806H上抓信令却没有看到该消息,经确认另有一台设备设置了同样的窄带IP但未带业务,不断上报注册请求消息。h.248协议不断瞬断,主要是由语音ip或者域名冲突造成,当发生冲突时,ss回应的消息,会在两个冲突的mg之间不停转换,因此造成h.248协议时断时续。 l因此数据规划一定要严格,更换语音域名、IP一定要求核对清楚,避免冲突。24端口端口A端口端口B管理员管理员A和和B通信通信端口镜像把端口端口镜像把端口B收到收

23、到的流量也发给端口的流量也发给端口C端口端口C端口镜像端口镜像 端口镜像使得管理员在不影响交换机正常通信的情况下,能够对网络流量进行监控和调试。维护技巧维护技巧-抓包抓包25配置范例配置范例配置范例配置范例ZXAN(config)#monitor session 1 创建一个镜像(只能创建一个)ZXAN(config)#interface inner-port_0/3/1进入内联口或上联口模式ZXAN(config-if)#monitor session 1 source direction both设置源端口以及数据流方向ZXAN(config)#interface gei_0/4/1进入上

24、联口模式ZXAN(config-if)#monitor session 1 destination设置目的端口ZXAN(config-if)#show monitor session 1显示镜像配置 Session 1 - Source Ports: Port: inner-port_0/3/1 Monitor Direction: both Destination Port: Port: gei_0/4/1维护技巧维护技巧-抓包抓包26Wireshark的功能简介的功能简介撷取网络封包撷取网络封包 分析网络封包分析网络封包分解网络封包分解网络封包Wireshark(前称Ethereal)是一

25、个网络封包分析软件维护技巧维护技巧-抓包抓包27撷取网络撷取网络报文报文维护技巧维护技巧-抓包抓包28分包撷取分包撷取29数据分析数据分析网络丢包网络丢包网络抖动网络抖动单向媒体流单向媒体流广播包广播包媒体流还原媒体流还原30数据过滤数据过滤megaco.termid=USER00600800031|megaco.termid=RTP0020030006031根据用户端口号过滤根据用户端口号过滤udp.port=6120|udp.port=612132根据根据ip地址过滤地址过滤3334网络丢包网络丢包针对网络丢包可以在两端配置冗余来规避针对网络丢包可以在两端配置冗余来规避35Seq从从234

26、12跳变到跳变到2341436网络抖动网络抖动我们这里所说的网络抖动在我们这里所说的网络抖动在WireShark中可以中可以通过通过Delta的值来衡量,的值来衡量,Delta是相邻两个媒体是相邻两个媒体包之间的间隔值。包之间的间隔值。因为网关发送媒体包时的打包间隔是固定的,因为网关发送媒体包时的打包间隔是固定的,在没有网络抖动的情况下,接收侧网关收到在没有网络抖动的情况下,接收侧网关收到的媒体流的的媒体流的Delta也应该是一个定值。当有网也应该是一个定值。当有网络抖动时,络抖动时,Delta的值会随着网络抖动而变化。的值会随着网络抖动而变化。 Graph37笔记本电脑抓笔记本电脑抓tag报

27、文配置报文配置笔记本电脑网卡驱动默认会在接收数据包的时候过滤vlan tag,使得用wireshark抓到的数据包中不含vlan tag,此时需要通过修改注册表让驱动保留vlan tag。 Intel PRO/1000或PRO/100网卡,对于此类网卡需要将注册表:HKEY_LOCAL_MACHINESYSTEMControlSet001ControlClass4D36E972-E325-11CE-BFC1-08002BE1031800xx,如果该目录下有多个子项,需要找到Intel(R) PRO/100 S网卡对应的子项(其中DriverDesc是设备类型):其他维护技巧其他维护技巧38笔记

28、本电脑抓笔记本电脑抓tag报文配置报文配置对于Broadcom千兆网卡,需要在注册表里增加一项PreserveVlanInfoInRxPacket=1,类型为string。位置与TxCoalescingTicks相同,后者可以在HKEY_LOCAL_MACHINESYSTEMCurrentControlSet下搜索到。其他维护技巧其他维护技巧39批量工具使用批量工具使用批量工具能够脱离网管独立运行,通过TELNET连接实现对我司PON节点(包括OLT和ONU)实现批量版本下载和命令执行功能,方便对PON节点进行批量维护,特别是没有安装中兴网管的点。批量工具实际上是一个TELNET客户端和FTP

29、服务器端(当然也可以启动第三方FTP服务器端软件,这样会提示FTP端口已经被占用,继续执行即可),可以顺序批量telnet到若干个PON节点顺序发布命令。 以下以F820为例,说明批量工具的使用其他维护技巧其他维护技巧40批量工具使用批量工具使用-认识工具认识工具批量工具是一个免安装的绿色软件,解压缩后有以下文件:其中主要是bachtool.ini这个文件,可以修改其中的配置,以达到对不同设备的操作和设置其他维护技巧其他维护技巧41批量工具使用批量工具使用-配置文件配置文件Bachtool.ini打开后,其中主要是前面一部分的配置 UpdateBootCmd_WaitSeconds=30 /升

30、级线卡BOOT等待时间,单位为秒; UpdateVersionCmd_WaitSeconds=180 /升级线卡版本等待时间,单位为秒; FtpPort=21/ftp端口号; FtpTimerOut=29/ftp超时时长,单位为秒; FtpWriteLog=1/ftp日志生成控制,0位不生成,1为生成; TelnetPort=23/telnet端口号; TelnetTimerOut=30 /telnet超时时长,单位为秒; TelnetConnectCount=5/telnet最大连接数,单位为个; TelnetDefaultUserName=zte“/telnet节点用户名默认配置; Tel

31、netDefaultPassword=zte“/telnet节点密码默认配置; CommPortName=COM1其他维护技巧其他维护技巧42批量工具使用批量工具使用-节点管理节点管理节点管理界面:新增-新增节点,修改-修改节点信息,删除-删除掉勾选的节点,批量增加,可以批量添加一批节点,保存-将本页面的节点信息保存成一个txt文件。其他维护技巧其他维护技巧43批量工具使用批量工具使用-节点生成节点生成制作节点列表:从网管导出网元列表,保存成表格格式,选中其中我们需要的IP这列,拷贝出来。其他维护技巧其他维护技巧44批量工具使用批量工具使用-节点生成节点生成新建一个txt文本文件,将复制的IP

32、列表粘贴进去,保存其他维护技巧其他维护技巧45批量工具使用批量工具使用-节点导入节点导入导入节点:点击批量增加打开保存的网元列表文件其他维护技巧其他维护技巧46批量工具使用批量工具使用-命令管理命令管理在“命令管理”界面,可以逐条增加要对网元所做的操作,也可以批量增加一批的命令其他维护技巧其他维护技巧47批量工具使用批量工具使用-命令生成命令生成制作命令脚本,打开一个txt文件,每条命令换行即可。也可以直接使用设备的startrun.dat文件拷贝出需要执行的部分命令。保存成一个txt文件。其他维护技巧其他维护技巧48批量工具使用批量工具使用-命令导入命令导入命令批量导入其他维护技巧其他维护技巧49批量工具使用批量工具使用-命令执行命令执行执行命令,在命令执行界面,点击开始,工具就将按照设置的网元列表,逐个telnet到设备执行命令,状态显示执行的结果。其他维护技巧其他维护技巧50批量工具使用批量工具使用-记录文件记录文件执行的过程和log保存在工具目录下20100513-135937bachtool.log执行的过程log(包括了telnet进程)20100513-135937bachtool_cmd.log命令执行log(记录所执行的命令、结果)其他维护技巧其他维护技巧

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 国内外标准规范

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号