IRF简介
IRF(Intelligent Resilient Framework,智能弹性架构)是H3C自主研发的软件虚拟化技术。它的核心思想是将多台设备连接在一起,进行必要的配置后,虚拟化成一台设备。
使用这种虚拟化技术可以集合多台设备的硬件资源和软件处理能力,实现多台设备的协同工作、统一管理和不间断维护。
IRF的优点
1)简化管理:IRF形成之后,用户通过任意成员设备的任意端口都可以登录IRF系统,对IRF内所有成员设备进行统一管理。
2)1:N备份:IRF由多台成员设备组成,其中,主设备负责IRF的运行、管理和维护,从设备在作为备份的同时也可以处理业务。一旦主设备故障,系统会迅速自动选举新的主设备,以保证业务不中断,从而实现了设备的1:N备份。
3)跨成员设备的链路聚合:IRF和上、下层设备之间的物理链路支持聚合功能,并且不同成员设备上的物理链路可以聚合成一个逻辑链路,多条物理链路之间可以互为备份也可以进行负载分担,当某个成员设备离开IRF,
其它成员设备上的链路仍能收发报文,从而提高了聚合链路的可靠性。
4)强大的网络扩展能力:通过增加成员设备,可以轻松自如地扩展IRF的端口数、带宽。因为各成员设备都有CPU,能够独立处理协议报文、进行报文转发,所以IRF还能轻松自如的扩展处理能力。
IRF的基本概念
1.成员设备的角色:
主设备:负责管理和控制整个IRF。
从设备:处理业务、转发报文的同时作为主设备的备份设备运行。当主设备故障时,系统会自动从从设备中选举一个新的主设备接替原主设备工作。
2.成员优先级
成员优先级是成员设备的一个属性,主要用于角色选举过程中确定成员设备的角色。优先级越高当选为主设备的可能性越大。
设备的缺省优先级均为1,如果想让某台设备当选为主设备,则在组建IRF前,可以通过命令行手工提高该设备的成员优先级。
3.MAD
IRF链路故障会导致一个IRF分裂成多个新的IRF。这些IRF拥有相同的IP地址等三层配置,会引起地址冲突,导致故障在网络中扩大。MAD(Multi-Active Detection,多Active检测)机制用来进行
IRF分裂检测、冲突处理和故障恢复,从而提高系统的可用性。
4.角色选举
角色选举中按照如下优先级顺序选择主设备:
1)当前的主设备优先,即IRF不会因为有新的成员设备加入而重新选举主设备即使新的成员设备有更高优先级。该规则不适用于IRF形成时,此时所有加入的设备都认为自己是主设备。
2)成员优先级大的设备。
3) 系统运行时间长的设备。在IRF中,运行时间的度量精度为10分钟,即如果设备的启动时间间隔小于等于10分钟,则认为它们运行时间相等。
4) CPU MAC地址小的设备。
通过以上规则选出的最优成员设备即为主设备,其它成员设备均为从设备。
IRF建立时,所有从设备必须重启加入IRF。
独立运行的IRF合并时,竞选失败方的所有成员设备必须重启加入获胜方。
5.IRF 的连接拓扑
IRF 的连接拓扑有两种:链形连接和环形连接,如图所示。
• 链形连接对成员设备的物理位置要求比环形连接低,主要用于成员设备物理位置分散的组网。
• 环形连接比链形连接更可靠。因为当链形连接中出现链路故障时,会引起IRF 分裂;而环形连接中某条链路故障时,会形成链形连接,IRF 的业务不会受到影响。
6.IRF 中的配置文件同步
IRF 技术使用了严格的配置文件同步机制,来保证IRF 中的多台设备能够像一台设备一样在网络中工作,并且在主设备出现故障之后,其余设备仍能够正常执行各项功能。
• IRF 中的从设备在启动时,会自动寻找主设备,并将主设备的当前配置文件同步到本地并执行;如果IRF中的所有设备同时启动,则从设备会将主设备的起始配置文件同步至本地并执行。
IRF从设备上的原配置文件还在,但不再生效,除非设备恢复到独立运行模式。
• 在 IRF 正常工作后,用户所进行的任何配置,都会记录到主设备的当前配置文件中,并同步到IRF 中的各个设备执行。、
通过即时的同步,IRF 中所有设备均保存相同的配置文件,即使主设备出现故障,其它设备仍能够按照相同的配置文件执行各项功能。
7.MAD功能
IRF 链路故障会导致一个IRF 变成多个新的IRF。这些IRF 拥有相同的IP 地址等三层配置,会引起地址冲突,导致故障在网络中扩大。为了提高系统的可用性,当IRF 分裂时我们就需要一种机制, 能够检测出网络中同时存在多个IRF,
并进行相应的处理,尽量降低IRF 分裂对业务的影响。MAD(Multi-Active Detection,多Active 检测)就是这样一种检测和处理机制。MAD 主要提供分裂检测、冲突处理和故障恢复功能。
1)分裂检测
通过 LACP(Link Aggregation Control Protocol,链路聚合控制协议)、BFD(Bidirectional Forwarding Detection,双向转发检测)、ARP(Address Resolution Protocol,地址解析协议)或者ND(NeighborDiscovery,邻居发现)
来检测网络中是否存在多个IRF。同一IRF 中可以配置一个或多个检测机制。
2)冲突处理
IRF 分裂后,通过分裂检测机制IRF 会检测到网络中存在其它处于正常工作状态的IRF。
• 对于 BFD MAD 和LACP MAD 检测,冲突处理方式为:
a. 比较两个IRF 中成员设备的数量,数量多的IRF 继续工作,数量少的迁移到Recovery 状态(即禁用状态)。
b. 如果成员数量相等,则主设备成员编号小的IRF 继续工作,其它IRF 迁移到Recovery 状态。
• 对于 ARP MAD 和ND MAD 检测,冲突处理方式为: a. 主设备成员编号小的IRF 继续工作;其它IRF 迁移到Recovery 状态。
IRF 迁移到Recovery 状态后会关闭该IRF 中所有成员设备上除保留端口以外的其它所有业务端口,以保证该IRF 不能再转发业务报文。
3)MAD 故障恢复
IRF 链路故障导致IRF 分裂,从而引起多Active 冲突。因此修复故障的IRF 链路,让冲突的IRF 重新合并为一个IRF,就能恢复MAD 故障。
IRF 链路修复后,系统会自动重启处于Recovery 状态的IRF。重启后,原Recovery 状态IRF 中所有成员设备以从设备身份加入原正常工作状态的IRF,原Recovery 状态IRF 中被强制关闭的业务接口会自动恢复到真实的物理状态,整个IRF 系统恢复。
MAD检测机制
1.设备支持的MAD 检测方式有:LACP MAD 检测、BFD MAD 检测、ARP MAD 检测和ND MAD 检测。
2.LACP MAD 检测
LACP MAD 检测通过扩展LACP 协议报文实现,通常采用如图所示的组网:
• 每个成员设备都需要连接到中间设备。
• 成员设备连接中间设备的链路加入动态聚合组。
• 中间设备需要支持扩展LACP 报文。
开启LACP MAD 检测后,成员设备通过LACP 协议报文和其它成员设备交互DomainID 和ActiveID 信息。
• 如果 DomainID 不同,表示报文来自不同IRF,不需要进行MAD 处理。
• 如果 DomainID 相同,ActiveID 也相同,表示没有发生多Active 冲突。
• 如果 DomainID 相同,ActiveID 不同,表示IRF 分裂,检测到多Active 冲突。
3.BFD MAD 检测
BFD MAD 检测通过BFD 协议实现。我们可以使用以太网端口或管理用以太网口来实现BFD MAD检测。
使用管理用以太网口实现BFD MAD时必须使用中间设备(如图1-9所示),并请注意如下组网要求:
• 每台成员设备都使用管理用以太网口和中间设备建立BFD MAD 检测链路。
• 为每台成员设备的管理用以太网口配置MAD IP 地址。
使用以太网端口实现BFD MAD 时,请注意如下组网要求:
• 不使用中间设备时,每台成员设备必须和其它所有成员设备之间建立BFD MAD 检测链路(如图1-10 所示)。使用中间设备时(如图1-9 所示),每台成员设备都需要和中间设备建立BFD MAD 检测链路。
• 用于 BFD MAD 检测的以太网端口加入同一VLAN 或同一三层聚合组,在该VLAN 接口视图或三层聚合接口视图下为每台成员设备配置MAD IP 地址。
需要注意的是:
• 建议首选管理用以太网口实现BFD MAD。
• BFD MAD 检测链路和BFD MAD 检测VLAN 或BFD MAD 检测三层聚合接口必须是专用的,不允许配置任何其它特性。
• MAD IP 地址应该为同一网段内的不同IP 地址。
• 两台以上设备组成IRF 时,请优先采用中间设备组网方式,避免特殊情况下全连接组网中可能出现的广播环路问题。
• 使用三层聚合接口配置BFD MAD 时,聚合成员端口的个数不能超过聚合组最大选中端口数。否则,由于超出聚合组最大选中端口数的成员端口无法成为选中端口,会使BFD MAD 无法正常工作,工作状态显示为Faulty。
BFD MAD 实现原理如下:
• 当 IRF 正常运行时,只有主设备上配置的MAD IP 地址生效,从设备上配置的MAD IP 地址不生效,BFD 会话处于down 状态;(使用display bfd session 命令查看BFD 会话的状态。
如果Session State 显示为Up,则表示激活状态;如果显示为Down,则表示处于down状态)。
• 当 IRF 分裂形成多个IRF 时,不同IRF 中主设备上配置的MAD IP 地址均会生效,BFD 会话被激活,此时会检测到多Active 冲突。
4.ARP MAD 检测
ARP MAD 检测是通过使用扩展ARP 协议报文交互IRF 的DomainID 和ActiveID 实现的。
使用管理用以太网口实现ARP MAD 时必须使用中间设备(如图1-11 所示),并请注意如下组网要求:
• 每台成员设备都使用管理用以太网口连接到中间设备。
• 在中间设备上,所有连接成员设备的端口需要加入同一VLAN。
使用以太网端口实现ARP MAD 时,可以使用中间设备,也可以不使用中间设备。
• 使用中间设备时,每台成员设备都需要和中间设备建立连接,如图1-11 所示。IRF 和中间设备之间需要运行生成树协议。可以使用数据链路作为ARP MAD 检测链路。
• 不使用中间设备时,每台成员设备必须和其它所有成员设备之间建立ARP MAD 检测链路。
开启 ARP MAD 检测后,成员设备通过ARP 协议报文和其它成员设备交互DomainID 和ActiveID信息。
• 如果 DomainID 不同,表示报文来自不同IRF,不需要进行MAD 处理。
• 如果 DomainID 相同,ActiveID 也相同,表示没有发生多Active 冲突。
• 如果 DomainID 相同,ActiveID 不同,表示IRF 分裂,检测到多Active 冲突。
5.ND MAD 检测
ND MAD 检测是通过扩展ND 协议报文内容实现的,即使用ND 的NS 协议报文携带扩展选项数据来交互IRF 的DomainID 和ActiveID。
我们可以使用以太网端口或管理用以太网口实现ND MAD 检测。
使用管理用以太网口实现ND MAD时必须使用中间设备(如图1-12所示),并请注意如下组网要求:
• 每台成员设备都使用管理用以太网口连接到中间设备。
• 在中间设备上,所有连接成员设备的端口需要加入同一VLAN。
使用以太网端口实现ND MAD 时,可以使用中间设备,也可以不使用中间设备。
• 使用中间设备时,每台成员设备都需要和中间设备建立连接,如图1-12 所示。IRF 和中间设备之间需要运行生成树协议。
• 不使用中间设备时,每台成员设备必须和其它所有成员设备之间建立ND MAD 检测链路。
开启 ND MAD 检测后,成员设备通过ND 协议报文和其它成员设备交互DomainID 和ActiveID 信息。
• 如果 DomainID 不同,表示报文来自不同IRF,不需要进行MAD 处理。
• 如果 DomainID 相同,ActiveID 也相同,表示没有发生多Active 冲突。
• 如果 DomainID 相同,ActiveID 不同,表示IRF 分裂,检测到多Active 冲突。
IRF和MAD配置,以S6520X-54QC-EI举例
1.交换机A配置
1)修改交换机的优先级
irf member 1 priority 32
2)选定IRF物理端口并关闭这些端口
int range Ten-GigabitEthernet1/0/47 to Ten-GigabitEthernet1/0/48
shutdown
3)配置IRF端口1/1,并将它与物理端口Ten-GigabitEthernet1/0/47和Ten-GigabitEthernet1/0/48绑定
irf-port 1/1
port group interface Ten-GigabitEthernet1/0/47
port group interface Ten-GigabitEthernet1/0/48
4)开启Ten-GigabitEthernet1/0/47~Ten-GigabitEthernet1/0/48端口,并保存配置。
int range Ten-GigabitEthernet1/0/47 to Ten-GigabitEthernet1/0/48 undo shutdown qu sa fo
5)激活IRF端口下的配置
irf-port-configuration active
6)其他常用配置
irf mac-address persistent timer irf auto-update enable undo irf link-delay
2.交换机B配置
1)将Device B的成员编号配置为2,并重启设备使新编号生效。
[FC-RX_5F-Core]irf member 1 renumber 2
Renumbering the member ID may result in configuration change or loss. Continue? [Y/N]:y
2)将堆叠线连接交换机1、2的Ten-GigabitEthernet1/0/47、Ten-GigabitEthernet1/0/48
3)配置irf序号
irf member 2 priority 1
4)同交换机A配置IRF接口
3.Device A和Device B间将会进行主设备竞选,竞选失败的一方将重启,重启完成后,IRF形成。
4.堆叠检测配置
vlan 4094 des irf int range Ten-GigabitEthernet1/0/44 Ten-GigabitEthernet2/0/44 port link-mode bridge port access vlan 4094 undo stp enable int vlan 4094 mad bfd enable mad ip address 10.130.209.9 255.255.255.252 member 1 mad ip address 10.130.209.10 255.255.255.252 member 2
5.查看irf配置
[FC-RX_5F-Core]dis irf configuration MemberID NewID IRF-Port1 IRF-Port2 1 1 Ten-GigabitEthernet1/0/25 disable Ten-GigabitEthernet1/0/26 2 2 disable Ten-GigabitEthernet2/0/25 Ten-GigabitEthernet2/0/26
[FC-RX_5F-Core]dis irf link Member 1 IRF Port Interface Status 1 Ten-GigabitEthernet1/0/25 UP Ten-GigabitEthernet1/0/26 UP 2 disable -- Member 2 IRF Port Interface Status 1 disable -- 2 Ten-GigabitEthernet2/0/25 UP Ten-GigabitEthernet2/0/26 UP
[FC-RX_5F-Core]dis irf topology Topology Info ------------------------------------------------------------------------- IRF-Port1 IRF-Port2 MemberID Link neighbor Link neighbor Belong To 2 DIS --- UP 1 f010-90db-7402 1 UP 2 DIS --- f010-90db-7402
dis dev man --可看到主从设备硬件信息
dis irf --可看到master、standby信息