[翻译]基于NRZ和PAM4的以太网接口上的自动协商和link training培训
Ethernet AN-LT
副标题:基于NRZ和PAM4的以太网接口上的自动协商和link training培训
一、介绍:
以太网是我们在过去40年里所依赖的通信的支柱。从高速交易数据中心到本地的Wi-Fi热点,以太网网络结构是我们所使用的技术的基础。消费者已经开始期待着能够即时、不间断地获得基于云计算的服务,如社交媒体、流媒体视频、电子商务、在线银行业务等。实际上,“云”是一个由数据中心组成的全球网络,它不断努力以更少的中断提供更多的带宽,以便更多的企业能够为更多的客户提供更多的服务。
自2002年批准IEEE 802.3ae 10Gb/s规范以来,以太网格局迅速扩大,成功部署25G/s和100Gb/s(IEEE802.3b-2016),现在使用脉冲幅度调制x4(PAM4)和100/200和400Gb/s(IEEE802.3cd-2018和802.3bs - 2017)。采用已经广泛到生态系统的各个方面,IEEE标准机构继续扩展更高的数据速率,以支持对更低端口计数的更大带宽的需求。
这些进步为在#下一代以太网生态系统中建立物理链接带来了一系列新的挑战。在可以启动任何通信之前,必须设置具有匹配配置的链接端点。这可以是一个固定的设置,但在某些情况下,终点会相互“协商”,以找到两端都支持的最佳可能配置。这被称为“自动协商”(AN)。
对于数据中心的大多数机架内通信应用程序,铜电缆——直连电缆(DAC)——是事实上的标准,因为它们是短程、高速通信的一种具有成本效益的解决方案。当使用dac时,重要的是传输信号的特性被微调以通过链路传输。为了实现这一点,端点通过交换训练序列(TS)数据包来执行“链路训练”(LT)。
正如AN的进步所指出的,有新的和重要的增加,以实现最佳的帧传输。今天观察到的一个常见问题是从AN完成到TS开始的过渡过程中的简单时间不匹配。如果时间太长,链接将超时并再次恢复到AN。要确定这些事务是否符合相关的规范,需要使用新的方法和工具。
二、The NRZ and PAM4 Line Code
Figure 1: PAM4 and NRZ line code and eye diagrams
许多以太网连接都是基于非返回到零(NRZ)行代码,即每个时钟符号传输1位。到目前为止,这已经被用于服务器的速度高达25 Gbps。用当前标准定义的100 Gbps以太网连接在4-25Gbps服务器上聚合——甚至更早的标准定义了在10-1010Gbps服务器上发送的100GbE。更高的传输速率可以通过发送信号作为更高的倍数25 Gbps的服务器,但希望减少频谱带宽和数量的服务器用于信号驱动一个新的高速信号:PAM4(脉冲振幅调制),编码两位在一个符号通过使用4信号水平。这提供了53.125 Gbps的服务器,符号率(或波特率)为26.5625Gbaut。为简单起见,这些服务器通常被称为50 Gbps或25g波特服务器。图1说明了NRZ和PAM线代码之间的区别
使用PAM4信令,400GbE接口可以用8个50 Gbps服务器实现,200GbE接口可以用4个50 Gbps服务器实现。同时,还定义了具有两个50 Gbps服务器的100GbE接口和具有一个50 Gbps服务器的50GbE接口的新版本。图2表示了在新的IEEE标准802.3bs和802.3cd中定义的接口。大多数是基于PAM4行代码;然而,也有一个400GE接口定义,使用16-25 Gbps服务器与NRZ行代码。该配置适用于光互连,未被广泛采用。
图2:IEEE802.3bs和802.3cd的概述,以及以太网技术联盟的接口技术
使用PAM4行码传输50 Gbps的信息需要与使用NRZ行码发送的25 Gbps大致相同的带宽。然而,如图1所示,PAM4信号水平是NRZ信号水平的三分之一。这意味着PAM4的信噪比(SNR)显著降低,这将导致比NRZ编码的信号有更多的误差。为了弥补这一点,在指定PAM4信令的标准中,必须进行强正向纠错(FEC)。必须与PAM4行代码一起使用的FEC是里德-所罗门RS(5440,5140)“KP”RS-FEC。RS-FEC和BASE-R FEC变体可能应用于或不应用于传统的NRZ基信号,这取决于在AN期间所表示的适用的支持操作。
三、Forward Error Correction (FEC)
以太网引入以太网,以提高损耗和误码率,以支持铜互连,对关键任务网络特别有用。对于25GbE、50GbE和100GbE应用程序中的NRZ信令,在AN对话框中设置FEC能力位,这将指示它是否被端口请求和支持,如图3所示。链接伙伴可能支持Firecode FEC,又名BASE-R FEC,Reed Solomon(RS528-FEC或RS-KR),或者根本不支持FEC(当低延迟是关键的,并且允许潜在的损耗连接时是可取的)。
通过IEEE 802.3cd和PAM4信令,FEC在所有铜互连中都是强制性的,对于某些光纤传输实现是可选的。尽管信号频率相似——25GbE的25.78125GBd和50GbE的26.5625GBd——PAM4信号的使用影响了BER,需要大多数所有的互连来实现FEC。对于PAM4信号,使用了比RS-KR更强的FEC:ReedSolomonRS544-FEC(RS(5440,5140))或RSKP。
我们可以用传统的信号完整性工具和流量生成器来计算误码率,但是我们不能从这些工具中确定的是互联媒体上的链接参与者之间的关系。这与100/200/400GbE的聚合物理链接相结合,其中每个物理车道将具有不同的误码率特性。
准确的链接训练和使用FEC是建立和保持最优链接条件的关键组成部分。当查看FEC时,我们将查看如下表所示的几个变量。
四、Auto negotiation – AN
Figure 4: Auto-Negotiation page information exchanged by link participants
自动协商最初是为以太网设计的。除了为链路参与者交换速度能力之外,AN已经发展为今天的以太网,包括额外的配置信息,以建立可靠和一致的连接。AN允许在一个链路的终点的设备协商共同的传输参数能力,如速度和双工模式,交换扩展的页面信息和媒体信令支持。在更高的速度和信号传输下,选择FEC可能是相关的。
IEEE已经为NRZ定义了基于25/50/100GbE的自动协商,以包括如图4所示的大量配置参数。对于基于PAM4的200GE、100GE和50GE电气接口,只有速度本身可以自动协商,因为KP RS-FEC是强制性的,与双工模式无关。电气接口由相应的IEEE 802.3和以太网技术联盟规范定义,该规范包括自动协商的扩展定义。
在自动协商过程中,链路的端点共享它们的能力,并选择它们所支持的最高性能的传输模式,如图5所示。
图5:自动协商流程流程图
自动协商在IEEE 802.3第73条中有定义,该条款在IEEE 802.3cd和以太网联盟400GBASECR8/KR8规范中有所更新。他们将以下基于PAM4的费率添加到那些可以自动协商的费率中:
• 400 G, 8 lanes: 400GBASE-KR8 or 400GBASE-CR8
(highest priority) – Ethernet Consortium only
• 200 G, 4 lanes: 200GBASE-KR4 or 200GBASE-CR4
• 100 G, 2 lanes: 100GBASE-KR2 or 100GBASE-CR2
• 50 G, 1 lane: 50GBASE-KR or 50GBASE-CR
如上所述,光学接口未定义自动协商;它仅定义为铜电缆(-CR)和电气背板(-KR)。这适用于IEEE 802.3第73条(范围从1G到200G)和以太网联盟400GBASE-CR8/KR8规范中定义的所有速率。
使用传统的物理层检查工具和技术,我们可以确定SERDES是否驱动了正确的电信号,并在规格参数范围内,进行时间计算,并大致了解被检查设备的物理健康状况。然而,传统的信号完整性测试工具无法向我们“显示”基础信息和扩展页面信息的内容,如图6所示在链接启动期间由组件共享。如果存在建立链接的问题,而这些问题是由于一个不一致的结果,那么工程师实际上是盲目的,并且没有能力确定原因。
Figure 6: Auto-Negotiation Extended Base Page
图6:自动协商扩展的基本页
五、Link Training-LT
Figure 7: Training Sequence page information
一旦链接中的端口完成了必要的AN信息交换并达成协议,链接合作伙伴就会进入下一步,即训练序列交换(TS)。TS函数是至关重要的,以调整信道的最佳传输。25GbE NRZ信号的训练成为必要的,而高速PAM4信号只增加了复杂性和必要性。
PAM4符号通过铜(电气)电缆是相当具有挑战性的,因为符号在通过电缆时会相互影响。这可以通过Tx均衡器进行部分补偿,其中发送符号(主)的幅度根据紧邻前(前)和后(后)符号进行调整。“主”设置将控制整个信号的整体放大/振幅。除此之外,还有任何前后前/后的设置,如图7和图8所示。
该线路的两个终点可以自动进行“Tx均衡器”的调整,该过程被称为“链接训练”。通过链路训练,链路上的发射器和接收器进行通信,以调整“均衡器”设置。这在IEEE 802.3cd第136.8.11条中定义了基于200GE、100GE和50GE PAM4的信号。
Figure 8: Tuning of Transmitted Signals
NRZ和PAM4的链接训练都将运行几秒钟。当链路处于正常运行状态时,接收器将继续调整其设置。在链路训练之后,接收器将在正常运行过程中以非干扰的方式不断调整其接收器特性。
Figure 9 - Transition from AN to TS, determine delta time from AN
在链路训练期间,链路的两个终点将交换如图10所示的信号。它包含:
帧标记:允许接收器识别的开始链接训练信号
系数更新:建议新的“均衡器”设置发射机的另一端链接(链接伙伴)
状态报告:当前“均衡器”设置的发射机发送信号和握手
训练模式:一个测试模式,接收机将使用来确定是否更新设置提高传输质量
Figure 10: Link Training Process
No Auto negotiation, No Link Training
没有自动协商,没有链接培训
在某些情况下,自动协商和链路训练不需要建立一个通信路径:高速光收发器和接口通常只以一种速度运行,所以不需要协商这个路径。链路培训只需要电气接口——在某些情况下(例如使用短电缆时),仅使用通信路径中终端设备的默认设置就可以运行。IEEE802.3的规范允许在这些情况下通过电气接口进行强制连接.
No Auto negotiation, Link Training
虽然链路培训对于使一些电气接口工作至关重要,但如果链路速度是固定的,或者如果可以在链路的两个终点手动设置,则可能不需要自动协商。
Auto negotiation and Link Training
自动协商和链接培训原则上是两个独立的过程。但是,当两者都完成时,必须首先进行自动协商,以确定链接的总体模式,然后执行链接训练。在这里,您可以得到图11中所示的序列。
Figure 11: Auto-Negotiation and Link Training sequence
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 使用C#创建一个MCP客户端
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 按钮权限的设计及实现