网络故障分层诊断

上传人:wt****50 文档编号:49790615 上传时间:2018-08-02 格式:PPT 页数:45 大小:407KB
返回 下载 相关 举报
网络故障分层诊断_第1页
第1页 / 共45页
网络故障分层诊断_第2页
第2页 / 共45页
网络故障分层诊断_第3页
第3页 / 共45页
网络故障分层诊断_第4页
第4页 / 共45页
网络故障分层诊断_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《网络故障分层诊断》由会员分享,可在线阅读,更多相关《网络故障分层诊断(45页珍藏版)》请在金锄头文库上搜索。

1、网络故障分层诊断制作人:邹绍军 指导老师:沈奕佳老师1OSI的体系结构23本次课主要讲的内容: 1.网络故障发生位置? 2.网络故障的分类 3.故障诊断的一般步骤 4.网络的分层诊断技术5. 网络故障诊断及维护 6.经典案例解析4网络故障通常有以下几种可能 : 物理层问题:物理设备相互连接失败或 者硬件及线路本身的问题; 数据链路层问题:网络设备的接口配置 问题; 网络层问题;网络协议配置或操作错误; 传输层问题:设备性能、通信拥塞及差 错问题; 高层问题:包括操作系统,应用接口、 驱动程序及各种应用程序错误。5网络故障的分类 根据网络故障的性质分为:1)物理故障;2)逻辑故障。 根据网络故障

2、的对象分为:1) 线路故障;2)路由故障;3)主机故障。6物理类故障物理故障定义:一般是指线路或设备出现物理类问题 或说成硬件类问题。具体指的是设备或 线路损坏、插头松动等情况。1 线路故障 2 端口故障3 集线器或路由器故障4 主机物理故障7逻辑类故障逻辑故障中最常见的情况就是配置 错误,因为网络设备的配置原因而导致 的网络异常或故障。1 路由器逻辑故障2 一些重要进程或端口关闭 3 主机逻辑故障 8故障诊断的一般步骤1. 故障的准确定位 2. 准确收集与故障相关信息 3. 考虑故障的可能原因 4. 确定解决方案 5. 实施解决方案 6. 测试验证 7. 记录解决方案 8. 确定预防措施91

3、 故障的准确定位故障的定位就是要清楚故障的性质 及其影响,将故障的范围缩小到一个网 段,某一个节点或网络设备。然后确定 故障是否会出现在其他节点上,故障是 局限于一个节点还是某个网络设备102准确收集与故障相关信息u观察网络设备的指示灯 u设备以前工作是否正常 u故障发生的时间 u运行环境是否发生了改变 u不要忽视一些明显的人为错误113考虑故障的可能原因确定了故障区域及范围,收集了相关故 障现象及信息后,就可以根据故障现象及信 息,利用软硬件帮助功能,考虑引起故障的 可能原因,并通过分析,推断出最后产生故 障的可能原因,并初步识别出故障的基本类 型。把所有可能的原因按可能性大小一一排 列记录

4、成事件列表,逐一排查,首先用一个 最可能的故障原因进行诊断活动,这样可以 比较容易恢复到故障的原始状态,相比而言 ,如果一次同时考虑一个以上的故障原因, 试图返回故障原始状态就困难多了。124 确定解决方案 在执行解决方案前,还需考虑以下几方 面问题: 所确定的原因是否真是故障原因,需要 相应的诊断结果或报告作支撑。 是否可以对设定的解决方案进行预先的 测试,并制定故障的诊断计划。 实现解决方案预定的结果是怎样的? 所制定的解决方案对于网络的其他部分 有没有影响?13在实施解决方案前做好以下准备u保存全部的网络设备配置文件。 u对服务器及重要的客户段的配置文件进 行备份记录。 u记录网络的基本

5、拓扑结构,设备的物理 位置以及各设备之间线路的连接关系、 端口号等。 u建立最终的基准,以便对新旧结果进行 对比,同时在需要恢复时可以作为比较 的依据。145 实施解决方案在实施解决方案时,可能还需要分成 很多步骤来操作,所以需要认真做好每 一步测试和观察。在测试过程中,每次 只能完成一项测试,每改变一个参数都 要确认其结果并记录下来,并分析结果 确定问题是否解决,如果没有解决,继 续下去,直到故障现象消失。156 测试验证故障是否真正解决及排除,要通过网 络管理员及用户的多方验证。对于网络管理员而言,主要通过查看 有关网络设备是否正常工作,通过网络管 理软件综合分析网络各项运行参数。对于用户

6、而言,主要是观察日常的各 项网络服务是否正常,网络的使用性能。 这个过程是一个持续的过程,需要大量时 间去完成。167 记录解决方案故障排除后,需要把故障的解决方 案,实施解决方案过程中的测试步骤及 相关结果记录成文档,进而积累实际故 障解决经验。作为网络管理员,在这方 面应该养成良好的习惯。 。178 确定预防措施完成了故障的排除和文档记录后, 就应该着手于预防措施,防范于故障的 再次发生。(目的)根据故障产生的各 种原因,有针对性地制定相应的网络管 理方案并实施,观察方案的运行效果, 把被动的网络管理方式变成主动地网络 管理方式18网络的分层诊断技术五层协议的层次结构把每层功能及职 责范围

7、定义得非常清晰,为管理员分析和 排查故障提供了非常好的组织方式。由于 各层相对独立,按层排查能够有效地发现 和隔离故障,因而一般使用逐层分析和排 查的方法。通常有两种逐层排查方式:一种是从低层开始排查,适用于物理网络 不够成熟稳定的情况,如组建新的网络、 重新调整网络线缆、增加新的网络设备;19网络的分层诊断技术另一种是从高层开始排查,适用于 物理网络相对成熟稳定的情况,如硬件 设备没有变动。无论哪种方式,最终都能达到目标, 只是解决问题的效率有所差别。 20网络故障统计据统计,出网络故障通常发生在网络 五层模型的下三层,即物理层、链路层 和网络层。21网络故障诊断及维护网络故障诊断形式:软件

8、形式工具: 比如操作系统提供 的网络诊断命令及专业管理软件。使 用简单,方便,成本低,但诊断不能 深入网络内部,具体反映各项网络参 数,功能有限。硬件形式工具:比如各种网络万用 表、网络协议分析仪等。功能强大, 能够对网络进行系统全面深入的诊断 ,但使用较复杂,成本较高。221 物理层 (1)线路方面故障 (2)端口设置方面的故障 (3)集线器故障 (4)电源方面的故障 (5)网卡故障 网卡参数设置错误 在同一网段的网络设备的参数设置要一致 对网卡的干扰 网卡驱动不正23经典案例1故障现象:某进出口公司开通DDN(Digital Data Network,数字数据网)专线后部分用户 抱怨数据交

9、换的速度变慢,且经常有连接 中断的现象。网络支持人员虽经多方查找 仍不得要领,故请求网络医院出诊援救。 24经典案例1(续)故障排除:该公司的网络为lOBase -T局域网,此次 只增加了DDN设备和路由器,其他配置基 本不变。故将网络测试仪F68X从最低楼层 的某个用户端接入网络进行观察,平均流 量为1. 20/0,未发现异常。改用流量发送 功能作流量逐级递增的体能测试,也未发 现任何异常。表面上看,该网段似乎没有 什么问题。为快速定位网络故障,将流量 发送到其他网段,同时观察网络状况。随 着发送流量的增加, 1分钟后发现错误帧25经典案例1(续)帧类型为FCS错误帧,并指示FCS帧来 自第

10、二层的某个用户。显然,只据此现象 就判断故障原因为该工作站的网卡损坏或 网卡驱动程序错误,似乎显得“证据不足” ,因为整个楼层的用户反映的故障现象是 相同的。继续观察到5分钟,发现FCS错 误帧数量增加为10个用户左右,由此可 以断定不是某个工作站的问题。为此,令 其他楼层多个用户与故障楼层用户交换数 据(比如复制文件), 26经典案例1(续)结果发现多个FCS帧错误。打开交换机端 口工作表观察,本楼层的记录中也显示 FCS帧错误,而其他的交换机端口工作 表中没有FCS错误记录,这说明是本网 段内存在着线缆超长的链路。再试着向 Internet某个已知用户发送流量,并且 进行ICMP Ping

11、测试,结果发现损失率 为90%左右。由于刚才本网段内的体能 测试未发现异常,所以只能是集线器与 交换机连接的单条链路有问题。测试该 电缆,长度指示为175 m!27经典案例1(续)由于175 m超常链路在集线器和交换 机之间,所以本网段内的用户在交换数 据时可以顺利进行。但与其他网段的用 户交换数据时就可能出问题。 一周后该公司重新划分网段施工结 束,用户来电报告一切正常。 28经典案例2故障现象:某网吧老板打电话给网络公司的技术人 员说,网吧局域网内出现频繁断网的情 况。技术人员打车到达现场后询问了网 吧业主故障发生前的一些情况,业主反 应闲来无事,看见交换机灰尘太多,于 是分片进行了除尘,

12、全部干完以后玩了 十几分钟后就发生这样的情况了,每次 掉线以后重新启动所有设备只能维持一 小会,然后就是断网,找了半天原因也 没找到,于是打电话报修。 29经典案例2(续)故障排除:首先观察交换机,发现网吧内所有的 交换机网络指示灯都在以相同的频率在闪 ,断开局域网,使用笔记本直接接在路由 器上进行上网测试,一切正常,故障显然 出在局域网内,把所有交换机之间的级联 线断开,先插上主交换机,无异常,再一 台一台的接入分交换机,接到第三台的时 候故障出现了,到那个交换机上查网线, 为了快速排除故障,那台交换机上的所有 网线都被拔了下来,然后一个一个插回30经典案例2(续)去,最后发现其中一根网线是

13、级联线, 被人插在了同一个交换机上造成数据回 路,拔掉这根网线后网络恢复正常。 故障总结:故障处理完之后询问业主为什么这么 插,业主说当时也没注意,看见有水晶 头的网线就往交换机上插,不知道这根 网线是干啥的。技术人员告诉业主以后 再动网线的时候最好有个技术在场的情 况下再动。 312 数据链路层数据链路层的故障一般包括以下几个方: 1)数据链路层帧的问题,通常的帧错发、 重发、丢失及帧碰撞等。 2)数据帧的流量控制及差错控制。 3)链路层地址的设置。 4)链路层协议的匹配问题,在相互连接的 两端口应该使用同一种协议封装。 5)链路通信的时钟同步问题。 6)数据终端设备(DTE)在数据链路层驱

14、 动程序的加载问题。32经典案例3故障现象:某校网络教室中的计算机是通过校 园网中的代理服务器共享上网的。一天 ,上网后不久,发现计算机浏览 Internet的速度很慢,以为是开启程序 太多引起计算机的内存不足,就重新启 动机器。可重启后还是老样子,换一台 机器上网也是如此。 33经典案例3(续)故障排除:由于多台计算机都出现了网速很慢的 毛病,因此初步判断是代理服务器出问题 了。检查代理服务器,发现服务器鼠标和 键盘都无法响应,出现了死机故障。没办 法,只得按下Reset键重新启动系统,可 在快进入系统界面时又死机了。难道是服 务器操作系统崩溃了?立即用先前备份的 Ghost镜像将系统分区恢

15、复了一遍,再次 启动机器,不料还是老样子。看来并非软 件故障。或者可能是由于34经典案例3(续)很久没有打开机箱清理,计算机内部灰尘积 聚太多,配件昼夜运转在散热不良的环境 中,引起CPU怠工了吧?拿来螺丝刀正想 打开机箱查个究竟,发现机箱后面板网卡 口上的黄灯急速闪烁着,再看看机柜内的 交换机,所有的指示灯也同样都异常急速 地闪烁着。网络故障莫不是由数据阻塞引 起的?试着关闭交换机电源,稍等一下再 重新打开,然后再次启动服务器。这次服 务器竟然能正常启动了,通过各终端访问 Intenet,一切恢复了正常。 35经典案例3(续)故障总结: 此次由交换机数据阻塞引起的网络故 障,由于没有首先检查

16、交换机,使本来 只需开关一下交换机电源就能解决的问 题,却走了不少弯路。由此提醒大家: 检查网络故障时,千万不要把目光只停 留在网络的某一个节点上,而要对整个 链路系统做综合观察,才能少走弯路。 363 网络层网络层提供建立、保持和释放网络层连 接的手段,包括路由选择、流量控制、传 输确认、中断、差错及故障恢复等。排除网络层故障的基本方法是沿着从源到 目标的路径,查看路由器路由表,同时检 查路由器接口的IP地址。如果路由没有在 路由表中出现,应该通过检查来确定是否 已经输入适当的静态路由、默认路由或者 动态路由。然后手工配置一些丢失的路由 ,或者排除一些动 态路由选择过程的故障 ,包括RIP或者GRP路由协议出现的故障37经典案例4故障现象:某一技术人员接到一电话,对方很 着急的说网吧一个劲的断线,查不出原 因,请技术人员去协助处理故障。 38经典案例4(续)故障排除:打车到达现场以后,进入机房,发现 主交换机和光纤收发器指示灯都在以极快 的频率闪,说明流

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号