存储网络交换机SNS2124联链路未配置TRUNK导致性能问题

问题描述

   某局点使用华为存储对接Oracle数据库后,主机时延60ms,上层响应慢业务无法访问。经排查组网后,确认华为存储与主机经过多个交换机,其中交换机级联链路未配置Trunk。

SNS2124(以及SNS2224&SNS2248&SNS3096&SNS5192&SNS5384)交换机在多链路级联未配置trunk时,一个session仅选择其中一条级联链路,多个session在多条链路上均衡而非基于Frame的均衡,一个FC连接的IO,只会选择其中一条级联链路进行下发。

无Trunking模式,多个session选择路由到同一个级联链路时,可能形成一条路径拥塞,而其他路径负载却很低,单个级联链路成为瓶颈:

 

Trunking模式,Trunking以帧为单位,将流量均衡分不到不同的路径上,所有路径都有机会参与全部会话的数据传输,且数据帧会优先在低负载的路径上进行下发:

 

 

因此,在存储业务网络流量较大时,无Trunking模式会可能导致链路拥塞,出现性能问题。

处理过程

1、对比主机性能数据及存储性能数据,确认IO时延主要耗时不在存储内; 

2、并通过portperfshow监控光交检查组网情况,确认有级联端口存在瓶颈:

 

 

如上图,单个8GB FC端口的带宽已经达到700m以上,说明级联端口存在瓶颈;

3、通过光交命令islshow及trunkshow命令确认级联配置情况,配置了trunk的情况应当如下,islshow将标识聚合后的带宽,其他情况表示未成功配置trunk:

 

 

至此,确认根因为级联链路未配置TRUNK,且链路带宽达到瓶颈。

解决方案

调整组网,对多条级联链路配置trunk(需要license支持),具体配置参考对应版本光交的ISL Tunking管理指导。

 

转自:https://support.huawei.com/enterprise/zh/knowledge/EKB1100055673

posted @ 2022-02-11 13:44  pipci  阅读(539)  评论(0编辑  收藏  举报