MPLS基础与工作原理

MPLS Fundamental

History of WAN Protocol

  • 1970年代之前
    • 第一个 WAN 用于将办公室与终端连接到大型机和小型计算机系统。
    • 它是从办公室到数据中心的点对点连接。
    • 随着用户采用个人计算机和客户端服务器应用程序,点对点架构继续为行业服务。
    • 当时使用的X.25 协议和 T1/E1 电路速率为1.5Mbps。
  • 1980 年代末和 1990 年代初
    • 帧中继(X.25 的简化版本)作为一种更灵活的方式出现,可将办公室和分支机构位置连接到数据中心,通过 T1/T3 电路运行,提供高达 45Mbps 的速度。
    • 企业迅速采用帧中继,随后是异步传输模式 (ATM)。
      • ATM 的功能类似于帧中继,但 ATM 旨在为在同一网络上运行的语音、视频和数据提供更好的体验。 并且提供了高达 622Mbps的速率。
  • 2000年代初
    • MPLS 最初由服务提供商部署,这些服务提供商在从传统的基于电路的网络架构过渡时也采用了 MPLS。
    • 数据包被分配标签并根据标签头做出转发决策(在早期,这样的转发数据方式是更快的)。
  • 2000 年代中后期
    • 互联网作为企业 WAN 连接的一种选择迅速出现。
    • 互联网带宽既便宜又充足。
    • 许多企业使用蜂窝服务作为 ISP 的备用连接。
  • 2010年代
    • SD-WAN(软件定义广域网)。

Multiprotocol Label Switching(MPLS)

  • MPLS 是一种数据包转发方法,它根据标签而不是数据包的第三层目的地做出转发决策。

    • 对于今天的路由器,MPLS 并不比传统的 IP 路由快多少。
  • MPLS 旨在支持(传输)许多不同的第三层协议。

    • 例如单播路由、多播路由、VPN、流量工程 (TE)、QoS 和 MPLS 上的任何传输 (AToM)
  • MPLS名词介绍

    • LSR = 标签交换路由器(Label Switching Router)
    • LIB = 标签信息库(Label Information Base)
    • LFIB = 标签转发信息库(Label Forwarding Information Base)
    • LDP = 标签交换协议(Label Distribution Protocol)
    • LSP = 标签交换路径(Label Switched Path)
    • CE = 客户边界(Customer Edge)
    • PE = 运营商边界(Provider Edge)
    • P = 运营商路由器(Provider Router)
    • LER = 标签交换路由器(Label Edge Router)

MPLS is not VPN

  • MPLS是一个基于标签的最短路径路由流量的技术
  • VPN则是一个概念——基于公有网络的专有网络连接。

这篇文章将着重讨论MPLS Layer 3 VPN——即基于MPLS + VRF的VPN( IPv4-over-MPLS )。以及其他MPLS相关技术。

LSR Control Plane & Data Plane

标签交换路由器分为控制层面和数据层面。

在传统IP路由中,路由器通过路由协议生成路由表(控制层面),再由路由表生成转发表用于硬件转发数据(例如Cisco的CEF技术)。

在运行MPLS的路由器上,LDP用于和其他运行MPLS的路由器交换标签并生成LIB(控制层面),LIB会生成基于标签进行转发的表项——LFIB(数据层面)。

LSRs in MPLS Domain

在下面这张图中,R1与R5是边界LSR(数据流量为从左向右)。边界LSR需要同时为IP与MPLS路由。

  • 在MPLS域的边缘,为进入MPLS的数据包添加标签(称为ingress LSR)。

  • 在MPLS域的边缘,为离开MPLS的数据包弹出标签(称为egress LSR)。

R2、R3和R4均为中间LSR(Intermediate LSR)。

  • 位于MPLS域内,主要使用标签信息转发数据包。

LSP

Label-Switched Path(LSP)标签交换路径是标记数据包通过MPLS域的累计标记路径。

这是一条单向路径。因此源与目的地的来回路径可能是不一致的。

沿着该路径,每个路由器都会检查标签来做出转发决定,移除或添加标签(如果需要),然后转发数据包。

下面这张图简单的解释了MPLS是如何完成数据的转发的。

  • 在192.168.0.0/24向10.0.0.0/24方向转发数据时,边界LSR首先为10.0.0.0/24分配了标签87,并将带有标签87的数据包转发至R2(此时开始使用标签进行转发)。
  • 在转发数据至R2时,中间LSR将进站标签为87的标签替换为11,并继续转发至R3(此时使用的表均为LFIB)。
  • 像如此转发数据至R5,R5发现出站标签为空,则将标签弹出,进入FIB进行IP路由

Label

要深入理解MPLS的转发机制,绕不开的是MPLS中的标签(Label)如何被利用于转发,如何产生,以及如何交换这三个问题。

为了能够让MPLS工作,每一个数据包都需要插入标签(准确说,实际插入的是一个Label Stack)。标签被插入在二层帧头和三层包头之间(准确说,应该是插入在二层帧头之后,因为MPLS能够承载多种协议)。

标签大小为4个字节并包含不同字段:

  • Label
    • 前 20 位用于定义标签编号。
  • EXP(TC)
    • 接下来的 3 位(EXP)用于QoS和ECN(显式拥塞通知)。
  • S
    • 1 位(S)字段用于定义标签是否是堆栈中的最后一个标签。
    • 普通的MPLS只有一层标签,但MPLS VPN则有两层标签,MPLS TE则有三层标签。
  • TTL
    • 最后 8 位(TTL)类似于IP TTL。

Label Stack

在MPLS中,一个数据包不止可以携带一个标签,而且可以携带一叠标签,如下图。

可见多个MPLS shim组成了一个MPLS label stack。

具体label stack的排序如下图。可见,在栈底的shim的S字段为 1,所以可见的是该标签为栈底标签。

Cisco定义Label stack中的label数量没有上限。

Assign Label to Network

启用了MPLS的路由器会为所有他们已知的网络分配标签(不包括BGP路由)。系统会为路由随机分配一个编号,这个编号仅具有本地意义。

例如在下图中,假设下面5个路由器运行OSPF获得了10.0.0.0/24这个网段,它们各自都给该网段分配了一个编号。

LDP

LDP(Label distribution protocol)标签分发协议。

如下图,假设R4需要将10.0.0.0/24网段的数据转发给R5。

  • 那么R4必须要知道R5针对于10.0.0.0/24所分配的标签(因为R5只有自己认识收到数据包的标签才能进行下一步转发)。
  • 且在转发数据包的过程中需要将R5分配给10.0.0.0/24网段的标签放入其中。
  • 因此R4与R5之间需要使用LDP来交换互相的标签。
  • 那么一旦在接口上启用了MPLS,LDP Hello数据包就会从接口发出,发送到多播地址224.0.0.2,使用UDP 646端口。
    • Hello包中携带了LDP ID,LDP ID类似于Router ID,它唯一标识了邻居和Label Space。而Label Space分为两种。
      • Per platform(平台式),在所有接口上,对于相同网络发布的标签也是相同的。
      • Per interface(接口式),在不同的接口上,对于相同网络发布的标签是不同的。
  • 当路由器通过组播地址发现对方后,会使用TCP 646端口建立TCP链接,形成LDP TCP会话,以便交换标签信息。
    • 在两台路由器建立LDP TCP会话时,必须有一方为活动路由器。
    • 活动路由器负责建立TCP会话,LDP ID较大的路由器会被选择为活动路由器。

在上文中,我们可以得知,上面的R1至R5使用LDP交换了对于10.0.0.0/24这一网段的标签信息,那么此时会引申出一个问题——在一台路由器上收到了一个网络的多个标签,路由器会怎么处理呢?

下面我们来探究这个问题,在下图中,标识了各个路由器的LIB(标签信息库)。

  • 各个路由器通过LDP都收到了各自邻居针对10.0.0.0/24的标签信息,并记录在了LIB中,然而LIB并不是直接用于转发数据的。需要通过LIB+RIB得出数据真正的转发路径。

路由器是如何通过LIB+RIB确定出真正的转发路径呢?具体步骤如下。

  • 首先MPLS网络中需要运行路由协议来传递路由信息,从而形成RIB(路由信息库)。
  • 其次运行MPLS后,LDP开始工作,当形成LIB后,通过RIB确定正确的转发路径,并载入LFIB中。使用R4和R5举例。
    • 当形成LFIB时,R4通过查询RIB得知,去往10.0.0.0/24网段需要将路由转发给R5。
    • 此时R5也通过LDP将自身对于10.0.0.0/24网段的标签传递到R4上。
    • R4将自身针对该网段和下一跳路由器针对该网段的标签相结合写入LFIB中。
    • 那么前往10.0.0.0/24的数据就能够通过LFIB进行转发。
      • 至此,当R4收到标签为65的数据包时,将会弹出标签65,压入标签23,并将其转发给R5。
  • MPLS域中的所有路由器重复上述的过程,就能够确立出一条正确的转发路径。
  • 至此,除了Edge LSR需要进行IP路由,中间LSR可以全部通过MPLS进行数据转发。
    • Edge LSR的FIB略有不同,因为运行了MPLS,FIB中并没有路由的下一跳信息,而是打上标签或移除标签。

Egress LSR Double Lookup

例如R5收到10.0.0.0/24的数据包时需要做两次查找,首先查找LFIB表,其次查找FIB表。

首先是因为它收到了一个带有Label的数据帧,它需要查找LFIB表,但由于没有Label Out,它必须弹出标签并继续查找FIB表来转发数据。

这样的效率并不高。

Penultimate Hop Popping(PHP)

Penultimate Hop Popping 倒数第二跳(又称次末跳弹出)是一种优化机制,如下图所示。

当启用PHP后,R5并不会将之前一样向R4宣告自己的标签,而是宣告了弹出(POP)这个动作。那么R4就会在转发的过程中,将剩余的标签弹出(需要注意的是,它只会弹出一层标签,如果Label Stack中还有剩余标签并不会被弹出),并转发给R5。

那么当R5收到不附带标签的数据包后,就会直接查询FIB进行转发,免去了查询LFIB的动作,提高了效率。

实际上呢,R5告诉R4自己是10.0.0.0/24网络的LSP的末端,并且R4应该弹出标签,并且将无标签的数据包转发给R5。

posted @ 2022-05-17 14:03  ZywOo  阅读(1125)  评论(0编辑  收藏  举报