Data Plane

2015-2018,部分关于SDN数据平面的故障恢复文献粗读

SHEAR: A highly available and flexible network architecture marrying distributed and logically centralized control planes

  • International Conference on Network Protocols
  • 2016
  • 问题:传统网络中检测故障方法笨重,而全部替换成SDN网络成本太大;
  • 提出一种混合的网络架构,在传统网络中使用少量(2%-10%)的OpenFlow交换机代替传统交换机,将一个网络划分为几个域并使用传统的STP来定位故障,之后交给控制器处理;

Enhanced fast failover for software-defined smart grid communication networks

  • IEEE Global Communications Conference
  • 2016
  • 问题:第一个针对智能电网提出的恢复策略;
  • 在特定的应用场景(自动化基站,大范围监控,保护和控制)中实现两张恢复策略:中心控制、本地控制;

Scalable Multi-Failure Fast Failover via Forwarding Table Compression

  • the Symposium on SDN Research
  • 2016
  • 问题:在使用本地备用路径策略时,过多较少使用的备用流表项会降低TCAM的可用空间;
  • 分析了故障恢复的方法,并以此提出一种针对故障恢复的流表项压缩算法,使得能够使用更少的流表项来处理更多的故障;

Path switching: reduced-state flow handling in SDN using path information

  • Conference on Emerging Networking Experiments and Technologies
  • 2015
  • 在SDN网络中一直实现基于路径的源路由,在数据包中加入该包的路由信息。只在摘要中提到failover mechanisms,其他内容和failover没什么关系;
  • IEEE International Conference on Communications
  • 2016
  • 问题:将链路的阻塞也看成一种故障处理;
  • 监控各个端口的流量并设置阈值,通过为每个<源,目的>预设置多个路径来实现负载均衡和快速故障恢复;

Fast Detection of Alternative Route under Unknown Failure on SDN Network

  • IEEE Global Communications Conference
  • 2017
  • 问题:传统的备用路径只是绕过故障点,而没有考虑数据流对时延的要求;
  • 在使用Dijkstra算法发现基于<源,目的>的备用路径后,再进行剪枝来筛选出最符合要求的路径;

Troubleshooting Data Plane With Rule Verification in Software-Defined Networks

  • IEEE Transactions on Network and Service Management
  • 2018
  • 问题:探测故障的探针一次只能检测很有限的流规则,或者只能检测出某条链路故障而不能定位故障的具体位置。因此,确定故障位置或者故障的流规则需要大量的计算时间;
  • 提出一直关于流规则的模型,针对每个交换机来最小化需要的探针数量。貌似没有恢复部分,纯的故障位置发现;

DEMUR: Dependable Multipath Routing in Software Defined Networking for ISP Backbone

  • IEEE Global Communications Conference
  • 2017
  • 问题:多径路由中,各个路径的时延差距过大,导致目的节点需要大量空间来存储前到的数据包;
  • 提出的方法能一定程度提供网络恢复能力;

A declarative failure recovery system in software defined networks

  • IEEE International Conference on Communications
  • 2016
  • 问题:故障恢复时,需要针对不同应用实施不同的恢复方法;
  • 两种故障恢复方法:控制器处理、本地流表项处理各有优劣。故障时,根据不同流对资源的需求,实行各自的策略,需要由网络操作员设置;

Generalized Recovery From Node Failure in Virtual Network Embedding

  • IEEE Transactions on Network and Service Management
  • 2017
  • 问题:在虚拟网络中,一个物理节点或链路故障可能会影响多个虚拟网络;
  • 提出两种贪婪方法:优先数量或者虚拟节点优先级来重映射虚拟网;

The show must go on: Fundamental data plane connectivity services for dependable SDNs

  • computer communications
  • 2017
  • 提出问题:本地的故障恢复流表或组表必须预先配置,没有发送故障时的信息;有可能会将流引到其他的故障点;
  • 提出三种基于OpenFLow协议的机制:无状态,标记,有状态;在数据平面实现inband network traversals。三种方法都能找打需要的路径,不过各有缺点:路径长度、新增的流表数、数据包头需要的标记数;

Surviving Multiple Failures in Multicast Virtual Networks With Virtual Machines Migration

  • IEEE TRANSACTIONS ON NETWORK AND SERVICE MANAGEMENT
  • 2016
  • 问题:考虑组播虚拟网中,某个物理节点或链路故障;
     重新映射整个组播树,需要大量时间和计算;
     备用的节点可能存在资源不足;
  • 对组播树中的其他节点进行筛选和排序(根据资源,和故障的节点等),选择合适的节点代替故障节点;
posted @ 2018-09-16 21:56  孙敏铭  阅读(684)  评论(0编辑  收藏  举报