论文阅读：Blink-Fast Connectivity Recovery Entirely in the Data Plane

在网络中，链路故障的发生在所难免，为了降低故障带来的影响，就需要重新路由，将数据传输到合适的链路上。当因为链路故障发生处的不同，也有不同的解决方法。

AS（Autonomous System）内发生的故障如下图：

这种情况有现有的如下几种重路由方案：

上述的几种重路由可以达到亚秒级的重路由

如上几种重路由的方法有两个共同点：

当故障发生在AS外时，如下图所示：

现有也有几种解决方案：

SWIFT是优化了BGP的解决方案，SWIFT为了缩短收敛时间，利用一些已更新的BGP更新（例如，它们共享相同的AS-PATH）这一事实，从收到的一些BGP更新中预测了整个远程失败的程度。但是，SWIFT的基本问题是，在相应的数据平面故障后，而第一次BGP更新可能需要O（分钟）才能传播。

综上，现有得方案在解决远程故障是很缓慢的，所需要的时间是分钟级，主要原因是要靠控制面来驱动重路由。

Blink:一个数据驱动的快速重路由框架，并基于可编程数据平面构建，目的为了实现远程故障亚秒级的收敛。

Blink利用TCP事件信号直接在数据平面上检测故障的发生。

TCP流在中断时表现的可预测的行为：在时间上按指数间隔反复传输相同的报文，而当多个流混合时，TCP流中断的重传行为变会变成明显的故障特征信号。

posted @ 2019-12-24 11:22 Smnouy 阅读(441) 评论(1) 收藏举报

刷新页面返回顶部

Smnouy