BFD与IGP快速收敛应用测试

上传人:飞*** 文档编号:42915914 上传时间:2018-06-04 格式:DOC 页数:12 大小:129.50KB
返回 下载 相关 举报
BFD与IGP快速收敛应用测试_第1页
第1页 / 共12页
BFD与IGP快速收敛应用测试_第2页
第2页 / 共12页
BFD与IGP快速收敛应用测试_第3页
第3页 / 共12页
BFD与IGP快速收敛应用测试_第4页
第4页 / 共12页
BFD与IGP快速收敛应用测试_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《BFD与IGP快速收敛应用测试》由会员分享,可在线阅读,更多相关《BFD与IGP快速收敛应用测试(12页珍藏版)》请在金锄头文库上搜索。

1、BFD 与与 IGP 快速收敛应用测试快速收敛应用测试目前对网络稳定性影响较大的一般是链路中断、节点失效等故障,而常规的慢 Hello 机制检测耗时较长,且常用 IGP(ISIS 和 OSPF)在默认配置情况下,收敛速度很慢,一般需要几十秒钟,会造成骨干电路的大量数据丢失,从而对用户的正常上网带来较大的影响。以 cisco 路由器为例,默认配置情况下 OSPF 和 ISIS 路由协议的 hello time 和 dead time参数如下:可见,在默认配置情况下,故障时 OSPF 和 ISIS 最坏需要 30 秒/40 秒才能完成网络重新收敛。在没有传输网络 APS(automatic pro

2、tection switching)保护的情况下,显然这种慢速收敛机制会大幅度降低网络的整体性能,从而降低用户可感知的网络质量。一般情况下,我们希望能在保证网络性能稳定的前提下,提供尽可能快速的流量保护机制。首先,需要明白网络的恢复周期是什么,可以用下来的图来进行简单说明:从恢复周期图可以看出 IGP 的收敛时间组成,大体上分为一下几个主要部分: 失效链路检测时间 报告拓扑变化的新 LSA/LSP 的泛洪时间 各路由器的路由表计算时间(包括 SPF 计算时间和路由表计算及线卡 FIB 更新时间)从实际情况来看,为了加快流量保护速度,IGP 收敛时间的和两部分可以进一步优化,目前业内主要采取的优

3、化措施是使用 BFD 检测、IGP 快速收敛和 MPLS FRR 等相关技术。其中 MPLS FRR 超出本文讨论范围,请另外查询相关资料。2、BFD 技术简介BFD(双向转发检测)是一个简单的“Hello”协议,主要用于对相邻转发引擎之间通道故障提供轻负荷、持续时间短的检测,并将检测结果及时通知 IGP。在很多方面,它与普通路由协议的邻居检测功能类似,一对系统在邻居间的会话通道上周期性的发送检测报文,如果超过 dead time 的时间内没有收到对端的 hello 报文,则认为链路发生故障,并发布拓扑变更信息,启动网络收敛过程。当然,为了减少负荷,系统之间的发送和接收速率需要协商。然而,与以

4、往的其他“Hello”检测机制相比,BFD 只检测下一跳设备连接状态,具有轻负荷、灵敏度高、适应范围广的检测特点。BFD 能够在系统之间的任何类型通道上进行故障检测,这些通道包括直接的物理链路、虚电路、隧道、MPLS LSP、多跳路由通道,以及非直接的通道(如跨接二层以太网)。同时正是由于 BFD 实现故障检测的简单、单一性,致使 BFD 能够专注于转发故障的快速检测,帮助网络以良好 QoS 实现各类业务的传输。BFD 的定位是更多的绑定到转发平面,从而脱离具体的网络协议,使网络快速检测缺陷、实现电信级倒换成为可能;加上 BFD 处理的低开销使得 BFD 具有很好的扩展性和更广的适用性。目前

5、BFD 支持 OSPF、ISIS、BGP 等全部主流路由协议。当邻居关系建立后,路由器将告诉 BFD 协议去检测邻接连接状态。BFD 检测报文在路由器的 FIB 表中具有高的优先级,并且通过 unicast 形式相互传播,可保证监测链路拥塞时也不会影响 BFD 报文的传送。BFD 协议可分为两种工作模式:异步模式、查询模式,另外还有一种辅助回声功能,它可以与这两种模式结合起来使用。异步模式和查询模式的本质区别在于检测的位置不同,异步模式下本端按一定的发送周期发送 BFD 控制报文,需要在远端检测本端系统发送的BFD 控制报文;而在查询模式下检测本端发送的 BFD 控制报文是在本端系统进行的。B

6、FD 已实现协议国际标准化,现在使用版本是 draft-ietf-bfd-base-02.txt,目前主流网络设备已基本全部支持,并可实现不同厂家设备间协议互通。3、IGP 快速收敛技术简介为解决 IGP 默认配置情况下收敛速度慢的问题,业界提出了各种解决方案,主要分为以下几部分:1、I-SPF(Incremental SPF)I-SPF 是指增量路由计算,顾名思义它每次只对变化的一部分路由进行计算,而不是对全部路由重新计算。I-SPF 除了第一次计算时需要计算全部节点外,每次只计算影响的节点,而最后生成的最短路径树(shortest path tree,SPT)与原来的算法所计算的结果相同,

7、大大降低了 CPU 的占用率,提高了网络收敛速度。2、 PRC(Partial Route Calculation)部分路由计算 PRC 的原理与 I-SPF 相同,都是只计算变化的那一部分。但 PRC 不需要计算节点路径,而是根据 I-SPF 算出来的 SPT 来更新叶子(路由)。PRC 和 I-SPF 配合使用可以将网络的收敛性能进一步提高,它是原始 SPF 算法的改进,所以已经代替了原有的算法。3、LSP 快速扩散快速扩散LSP(OSPF 协议中叫 LSA,ISIS 协议中叫 LSP,为简化说明,下文统一用 LSP 来表示)快速扩散特性改进了传统 LSDB 使用计时器同步方式,在收到一个

8、或多个比较新的 LSP 时,在路由计算之前,先将小于指定数目的 LSP 扩散出去,加快 LSDB 的同步过程。这种方式在很大程度上可以提高整个网络的收敛速度。4、 智能定时器智能定时器为了加快网络收敛速度,又不至因网络变化频繁造成 CPU 资源耗尽,传统 SPF 计算前默认需要等待 5 秒用于收集 LSA/LSP 信息,而且连续两次 SPF 计算间隔为 10 秒。然而通常情况下,一个正常运行的网络是稳定的,发生大量的网络变动的几率很小,路由器不会频繁的进行路由计算,所以第一次触发的时间可以设置的非常短(毫秒级)。如果拓扑变化比较频繁,智能定时器会随着计算次数的增加,间隔时间也会逐渐延长,避免占

9、用大量的 CPU 资源。Cisco 路由器上用于动态计算的这种定时器的算法基于指数 back-off,并采用三个独立参数来进行速度与性能的调整。与 SPF 智能定时器类似的还有 LSA/LSP 生成智能定时器。这种指数增加算法有助于快速响应,同时还可以在网络元素不稳定时确保网络稳定。ISIS 协议的命令语法如下(OSPF 语法类似):Router isislsp-gen-interval A B Cspf-interval X Y Z下图描述了各参数表示的时间关系。以上述第一句命令为例,语法中的参数 B 是指路由器在检测到丢失路由邻居关系后,等待多长时间后发出一个新的 LSP,以毫秒为单位。如

10、果发生第二次状态改变,路由器等待 C 毫秒。如果发生第三次状态改变,路由器等待 2C 毫秒,然后是 4C 毫秒,直到到达最大值 A 秒。至此,如果链路状态持续反复变化,则两个 LSP 发出的时间为 A 秒。然后,如果链路保持稳定状态超过 2A 秒,路由器恢复到初始状态行为。4、网络部署为便于说明,我们假设在纯数据业务的情况下,要求网络能够达到这样的性能指标:链路中断后流量倒换时间小于 300ms。为了达到上述目的,需要进行以下几方面的优化部署工作:启用 BDP 进行链路/节点有效性的快速检测调整 IGP 收敛性能的相关参数,加快收敛速度需要注意的是,对于链路失效,尽管失效链路的每端同时发出 L

11、SP,但收到其中一个LSP 就足以将该链路排除在 SPF 计算外。而路由器在 SPT 计算中考虑一条新启用链路前,总是检查该链路是否由链路两端同时通告,这被称为双向连接性检查。4.1、BFD 快速检测机制配置根据总体性能指标要求,我们希望用在链路检测上的时间不要超过指标时间的一半,即 150ms,这样可设置 BFD 的 hello 报文周期为 50ms,连续丢失 3 个报文即认为链路失效。当然,如果路由器性能支持,也可以设置 BFD 的 hello 报文周期为 30ms,连续丢失 5 个报文即认为链路失效,这样准确程度会更高些。不过要知道,一般来说路由器会在多个接口上同时启用 BFD 机制,h

12、ello 报文周期越短,虽然检测精度会提高,但是对路由器性能影响也同样增大,尤其是网络核心路由器。以 ISIS 路由协议为例,相关配置如下:Cisco IOS 的配置:的配置:router isis ispbfd all-interfaces #在接口上启用 bfd 检测功能exitint g1/1bfd neighbor 192.168.0.1 #对端接口地址,有些设备默认可不配置本命令bfd interval 50 min_rx 50 multiplier 3 #每 50ms 发送 bfd 报文,连续 3 次未收到认为链路失效对端路由器接口配置为:int g1/1bfd neighbor

13、192.168.0.2 #对端接口地址bfd interval 50 min_rx 50 multiplier 3 #意义同上Cisco IOS XR 的配置:的配置:router isis ispinterface g0/11/5/5 bfd minimum-interval 50 # hello 报文发送时间间隔为 50msbfd multiplier 3 # 连续丢失 3 个 bfd hello 报文即认为链路 downbfd fast-detect ipv4 #启用 address-family ipv4 的 bfd 检测功能由于我们已经在路由器接口上启用了 BFD 检测,因此就不需要

14、再调整 ISIS 的默认hello time 和 dead time 数值。4.2、ISIS 快速收敛配置前面 BFD 检测已经占用了 150ms 的时间,为了能达到业务指标要求,ISIS 的收敛时间不能超过 150ms。根据平时网络监控统计数据,正常情况下 SPF 计算时间小于 100ms(与具体网络环境有关,下同),LSP 的传播时间小于 20ms,各相关参数的选择不能超过上述限制。据此我们把智能定时器的各时间参数定义如下:Cisco IOS 路由器的配置:路由器的配置:router isis ispispf level-2 #启用 level 2 的 ispf 功能lsp-gen-int

15、erval 5 20 100 #LSP 初始产生时间 20ms,后续递增间隔 100ms,最大间隔时间 5 秒。spf-interval 5 50 200 #SPF 初始时间 50ms,后续递增间隔 200ms,最大间隔时间5 秒。fast-flood 6 #在进行 SPF 计算先,先 flood 6 个 LSP。Cisco IOS XR 的配置:的配置:router isis isplsp-gen-interval initial-wait 20 secondary-wait 100 maximum-wait 5000address-family ipv4 unicast ispfspf-i

16、nterval initial-wait 50 secondary-wait 200 maximum-wait 5000exitint g0/11/5/5lsp fast-flood threshold 6从实际情况来看,在网络规模比较小的情况下,可以不使用 PRC 计算功能。这里设置 LSP 初始等待 20ms,主要是为了避免链路因不稳定而在短时间内产生多个LSP,从而造成 SPF 的多次计算,初始等待一个较短的时间可以大幅度降低这种可能性。另外,SPF 计算初始等待 50ms,是为了收集网络其他设备发布的 LSP,获得网络内完整的LSP 信息,初始时间应大于 LSP 初始等待时间(20ms)+ LSP 在网络内的传播时间(最大20ms),这样可以保证进行 SPF 计算时,网络已趋于稳定。上述部署配置中,在没有

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号