11、OSPF GR

OSPF GR

随着路由设备普遍采用了控制和转发分离的技术,在网络拓扑保持稳定的情况下,控制层面的重启并不会影响转发层面,转发层面仍然可以很好地完成数据转发任务,从而保证业务不受影响。

GR技术保证了在重启过程中转发层面能够继续指导数据的转发,同时控制层面邻居关系的重建以及路由计算等动作不会影响转发层面的功能,从而避免了路由振荡引发的业务中断,提高了整网的可靠性。

基本概念

GR是Graceful Restart的简称,又被称为平滑重启,是一种用于保证当路由协议重启时数据正常转发并且不影响关键业务的技术。

如果没有特殊说明,以下所说GR均表示RFC3623所规定的GR技术。

GR技术是属于高可靠性(HA,High Availability)技术的一种。HA是一整套综合技术,主要包括冗余容错、链路保证、节点故障修复及流量工程。GR是一种冗余容错技术,目前已经被广泛的使用在主备切换和系统升级方面,以保证关键业务的不间断转发。

和GR相关的概念如下:

  • Grace-LSA

    OSPF通过新增Grace-LSA来支持GR功能。这种LSA用于在开始GR和退出GR时向邻居通告GR的时间、原因以及接口地址等内容。

  • 路由器在GR中的角色

    • Restarter:重启路由器。可以通过配置支持完全GR或者部分GR。

    • Helper:协助重启路由器。可以通过配置支持有计划GR、无计划GR或者通过策略有选择支持GR。

  • GR的原因

    • Unknown:未知原因导致的GR操作。

    • Software restart:通过命令行主动触发的GR操作。

    • Software reload/upgrade:软件重启或升级导致的GR操作。

    • Switch to redundant control processor:异常主备倒换导致的GR操作。

  • GR的持续时间

    GR持续时间最长不超过1800秒。GR成功或失败都可以提前退出,不必等到超时才退出。

GR的分类

  • 完全GR(Totally GR):指当有一个邻居不支持GR功能时,整个路由器退出GR状态。

  • 部分GR(Partly GR):指当有一个邻居不支持GR时,仅该邻居所关联的接口退出GR,其它接口正常进行GR过程。

  • 有计划GR(Planned GR):指手动通过命令使路由器执行重启或主备倒换。在进行重启或主备倒换前Restarter会先发送Grace-LSA。

  • 非计划GR(UnPlanned GR):与Planned GR的区别在于,路由器是由于故障等原因进行重启或主备倒换,并且在主备倒换前不会事先发送Grace-LSA,而是直接开始主备倒换,在备板正常Up后才进入GR过程。以下的步骤同Planned GR。

GR的过程

  • GR开始

    对于Planned GR,主备倒换命令执行后,Restarter会首先向每个邻居发送一个Grace-LSA,通知邻居GR的开始以及GR的周期、原因等,然后进行主备倒换。

    对于UnPlanned GR,则不发送这个Grace-LSA。

    当备板正常Up后,立即发送一个Grace-LSA,通知邻居自己进入GR,包括GR的周期、原因等。然后会再向每个邻居连续发送5个Grace-LSA。(连续发送5个是为了确保邻居收到该Grace-LSA。此为各厂商实现方案,非协议规定)。

    此时发送的Grace-LSA是为了告知邻居自己进入GR状态,邻居会在GR期间保持与Restarter的邻居关系,让其它路由器感知不到Restarter的倒换。

  • GR过程

    图1 OSPF GR过程

  • GR退出

    表1 GR退出原因

    GR执行情况

    Restarter

    Helper

    GR成功

    Restarter在GR超时前与主备倒换前的所有邻居都重新建立好邻居关系。

    收到Restarter发送的Age为3600秒的Grace-LSA时与Restarter的邻居关系为Full状态。

    GR失败

    • GR超时并且邻居关系尚未完全恢复。

    • Helper发送的Router-LSA或Network-LSA导致Restarter端进行双向检查时失败。

    • Restarter接口状态变化。

    • Restarter收到Helper发送的1-way Hello报文。

    • Restarter收到同一网段上另一台路由器产生的Grace-LSA。同一网段同一时间只能有一台路由器做GR。

    • Restarter同一个网段的邻居之间存在DR/BDR不一致的情况(拓扑变化)。

    • 在邻居关系超时前没有收到Restarter发送的Grace-LSA。

    • Helper接口状态发生变化。

    • 收到其它路由器发送的与Helper本地数据库不一致的LSA。(可以通过配置不进行严格LSA检查排除这种情况。)

    • 同一网段上同一时间收到两台路由器发送的Grace-LSA。

    • 与其它路由器邻居关系变化。

有无GR技术的比较

表2 有无GR技术的比较

无GR技术的主备倒换

有GR技术的主备倒换

  • OSPF邻居重建

  • 路由重新计算

  • 转发表变化

  • 整网感知路由变化,路由短时振荡

  • 转发流量丢失,业务中断

  • OSPF邻居重建

  • 路由重新计算

  • 转发表保持不变

  • 除主备倒换设备的邻居外的其他路由器感知不到路由变化

  • 转发流量零丢失,业务不受影响

posted @ 2024-04-15 15:57  博雅塔之客  阅读(32)  评论(0编辑  收藏  举报