华为培训资料-故障处理

上传人:wt****50 文档编号:49539737 上传时间:2018-07-30 格式:PPT 页数:78 大小:992.50KB
返回 下载 相关 举报
华为培训资料-故障处理_第1页
第1页 / 共78页
华为培训资料-故障处理_第2页
第2页 / 共78页
华为培训资料-故障处理_第3页
第3页 / 共78页
华为培训资料-故障处理_第4页
第4页 / 共78页
华为培训资料-故障处理_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《华为培训资料-故障处理》由会员分享,可在线阅读,更多相关《华为培训资料-故障处理(78页珍藏版)》请在金锄头文库上搜索。

1、网络设备故障排除华为技术有限公司1版权所有,侵权必究内容提要p网络故障处理技术概述p一般网络故障的解决步骤pQuidway中低端路由器产品介绍p路由器常用诊断工具介绍p故障处理常用方法p故障处理对网络维护和管理人员的要求华为技术有限公司2版权所有,侵权必究网络故障处理技术概述当今的网络互连环境是复杂的,而且其复杂性的还在日益增 长,主要原因如下:p现代的因特网络要求支持更广泛的应用,包括数据、语音 、视频及它们的集成传输;p新业务发展使网络带宽的需求不断增长,这就要求新技术 的不断出现。例如:十兆以太网向百兆、千兆以太网的演 进;MPLS技术的出现;提供QoS能力等。p新技术的应用同时还要兼顾

2、传统的技术。例如,传统的 SNA体系结构仍在某些场合使用,DLSw作为通过TCP/IP承 载SNA的一种技术而被应用。华为技术有限公司3版权所有,侵权必究网络故障处理技术概述p能够正确地维护网络尽量不出现故障,并确保出 现故障之后能够迅速、准确地定位问题并排除故 障,对网络维护和管理人员来说是个挑战。p这不但要求对网络协议和技术有着深入的理解, 更重要的是要建立一个系统化的故障处理思想并 合理应用于实际中,以将一个复杂的问题隔离、 分解或缩减排错范围,从而及时修复网络故障。华为技术有限公司4版权所有,侵权必究网络故障的一般分类连通性问题p硬件、媒介、电源故障p配置错误p不正确的相互作用性能问题

3、p网络拥塞p到目的地不是最佳路由p供电不足p路由环路p网络错误华为技术有限公司5版权所有,侵权必究一般网络故障的解决步骤p故障处理系统化是合理地一步一步找出故障原因 并解决的总体原则。它的基本思想是系统地将由 故障可能的原因所构成的一个大集合缩减(或隔 离)成几个小的子集,从而使问题的复杂度迅速 下降。华为技术有限公司6版权所有,侵权必究网络故障解决的处理流程 华为技术有限公司7版权所有,侵权必究网络故障解决的处理流程p该处理流程是网络维护人员所能够采用的排错模 型中的一种,如果你根据自己的经验和实践总结 了另外的排错模型并证明是行之有效的,请继续 使用它网络故障解决的处理流程是可以变化 的,

4、但故障处理有序化的思维模式是不可变化的 。p下面我们以一个故障处理的实例来学习如何应用 这些步骤。华为技术有限公司8版权所有,侵权必究故障处理的实例 p该案例组网如上:某校园网的三个局域网,其中10.11.56.0为一个用户网段, 10.11.56.118为一个日志服务器;10.15.0.0是一个集中了很多应用服务器的网 段。 用户网段广播包过多造成该网段的服务器FTP业务传输速度慢网云A:10.11.56.118/24C:10.11.56.120/24B:10.15.254.253/16D:129.9.35.53/16ETHERNETETHERNETETHERNET华为技术有限公司9版权所有

5、,侵权必究1.故障现象描述p要想对网络故障做出准确的分析,首先应该了解故障表现 出来的各种现象 p用户反映“日志服务器与备份服务器间备份发生问题。” 这就是一个不完整不清晰的故障现象描述。因为这个描述 没有讲述清楚下列问题:n这个问题是连续出现,还是间断出现的?n是完全不能备份,还是备份的速度慢(即性能下降)?n哪个或哪些局域网服务器受到影响,地址是什么?p正确的故障现象描述是:n在网络的高峰期,日志服务器10.11.56.11到集中备份 服务器10.15.254.253之间进行备份时,FTP传输速度很慢,大约 是0.6Mbps。华为技术有限公司10版权所有,侵权必究2. 相关信息收集p搜集有

6、助于查找故障原因的详细信息:n向受影响的用户、网络人员或其他关键人员提出问题;n根据故障描述性质,使用各种工具搜集情况,如网络管理系 统、协议分析仪、相关display和debug命令等;n测试性能与网络正常情况下的记录进行比较。p如上述案例,可以向用户提问或自行收集下列相关信息:n网络结构或配置是否最近修改过,即问题出现是否与网络变 化有关?n是否有用户访问受影响的服务器时没有问题?n在非高峰期日志服务器和备份服务器间FTP传输速度是多少 ?p通过该步骤,我们收集到了下面一些相关信息:n最近10.11.56.0网段的客户机不断在增加;n129.9.0.0网段的机器与备份服务器间进行FTP传输

7、时速度正 常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;n在非高峰期日志服务器和备份服务器间FTP传输速度正常, 大约为6Mbps;华为技术有限公司11版权所有,侵权必究3. 经验判断和理论分析p利用前两个步骤收集到的数据,并根据自己以往的故障处 理经验和所掌握的的知识,确定一个排错范围。通过范围 的划分,就只需注意某一故障或与故障情况相关的那一部 分产品、介质和主机。p如上述案例,我们现在能够确定是一个网络性能下降问题 。那么,是网段10.11.56.0的性能问题?是中间网络的性 能问题?还是10.15.0.0网段的性能问题呢?p根据129.9.0.0网段的机器与

8、备份服务器间进行FTP传输时 速度正常为7Mbps这一事实,我们可以排除掉10.15.0.0网 段的性能问题。华为技术有限公司12版权所有,侵权必究4. 各种可能原因列表p该步骤列出根据经验判断和理论分析后总结的各 种可能原因。p如上述案例,可能原因如下:n网段10.11.56.0的性能问题,其原因可能为 :p日志服务器A的性能问题p10.11.56.0网络的网关性能问题p10.11.56.0网络本身的性能问题n中间网络性能问题,主要是到网络10.15.0.0 的路由不是最佳路由华为技术有限公司13版权所有,侵权必究5. 对每一原因实施排错方案p根据所列出的可能原因制定故障排查计划,分析 最有

9、可能的原因,确定一次只对一个变量进行操 作,这种方法使你能够重现某一故障的解决办法 。如果有多个变量同时被改变,而问题得以解决 ,那么如何判断哪个变量导致了故障发生呢?华为技术有限公司14版权所有,侵权必究6. 观察故障排查结果p当我们对某一原因执行了排错方案后,需要对结 果进行分析,判断问题是否解决,是否引入了新 的问题。如果问题解决,那么就可以直接进入文 档化过程;如果没有解决问题,那么就需要再次 循环进行到故障排查过程。华为技术有限公司15版权所有,侵权必究7. 循环进行故障排查过程p在进行下一循环之前必须做的事情就是将网络恢 复到实施上一方案前的状态。如果保留上一方案 对网络的改动,很

10、可能导致新的问题。p循环排错可以有两个切入点:n当针对某一可能原因的排错方案没有达到预期 目的,循环进入下一可能原因制定排错方案并实施;n当所有可能原因列表的排错方案均没有达到排 错目的,重现进行故障相关信息收集以分析新的可能 原因。p如上述案例,我们在列出了可能原因列表后,开 始制定方案进行故障处理:华为技术有限公司16版权所有,侵权必究7. 循环进行故障排查过程p可能原因1:网络10.11.56.0到网络10.15.0.0的 路由不是最佳路由。p制定的方案:在10.11.56.0网段的网关上使用 “tracert 10.15.245.253”命令,发现探测报文 返回时长仅为10ms,表明该

11、可能原因并不是造成 故障的原因。我们进入循环排错过程。华为技术有限公司17版权所有,侵权必究7. 循环进行故障排查过程p可能原因2:日志服务器A的性能问题。p制定的方案:测试同一网段的主机C和日志 服务器间的FTP传输速度,是6Mbps,正常 。可见问题与服务器A无关。华为技术有限公司18版权所有,侵权必究7. 循环进行故障排查过程p可能原因3:10.11.56.0网络的网关性能问 题。p制定的方案:测试主机C和备份服务器B间 FTP传输速度是7Mbps,正常。排除了网关 因素,因为B、C在不同网段上而速度正常 。华为技术有限公司19版权所有,侵权必究7. 循环进行故障排查过程p可能原因4:1

12、0.11.56.0网络本身的性能问题。p制定的方案:在网段10.11.56.0的以太网交换机 上使用命令“show mac”,输出如下:Port Rcv-Unicast Rcv- Multicast Rcv-Broadcast - - - - - 6/32 10317812 0 8665 Port Xmit-Unicast Xmit- Multicast Xmit-Broadcast - - - - - 6/32 6667987 286652 2474038 (输出的广播:输出的单播比 例为1:3,太大了。) Port Rcv-Octet Xmit- Octet - - - -6/32 140

13、94829358 1516443041p在网段10.15.0.0上的以太网交换机上使用命令 “show mac”输出如下:Port Rcv-Unicast Rcv- Multicast Rcv-Broadcast - - - - - 6/36 55780287 0 285 Port Xmit-Unicast Xmit- Multicast Xmit-Broadcast - - - - - 6/36 27879749 190257 119430 (广播:单播比例1:270 ,属于正常。) Port Rcv-Octet Xmit-Octet - - - - 6/36 67172587081 499

14、8816809p由此得知,网段10.11.56.0上广播包和 单播包比例为1:3,确实太大了。p再次询问用户该网段主要运行的业务是 什么,而得出了故障最终原因如下: 10.11.56.0是普通用户网段,由于业务 原因每个用户需要发送大量广播包和多 播包,随着近期越来越多的用户接入该 网络,在这个网段上的服务器需要花费 更多的资源来处理越来越多的广播和多 播包,因此其服务的传输速度自然减慢 。p这是一个网络布局不恰当的问题,需要 重新安排服务器的位置,将服务器移动 10.15.0.0网段后,故障解决。华为技术有限公司20版权所有,侵权必究8. 故障处理过程文档化p当最终排除了网络故障后,流程的 最后一步就是对所做的工作进行文 字记录。p文档化过程决不是一个可有可无的 工作,原因如下:n文档是排错宝贵经验 的总结,是 “经验判断和理论 分析”这一过程中最重要的参 考资料;n文档记录了这次排错 中网络参数所做的修改,这 也是下一次网络故障应收集 的相关信息。p文档记录主要包括以下几个方面 :n故障现象描述及收 集的相关信息n网络拓扑图绘制n网络中使用的设备 清单和介质清单n网络中使用的协议 清单和应用清单n故障发生的可能原 因n

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 文化创意

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号