存储网络交换机SNS2124联链路未配置TRUNK导致性能问题
问题描述
某局点使用华为存储对接Oracle数据库后,主机时延60ms,上层响应慢业务无法访问。经排查组网后,确认华为存储与主机经过多个交换机,其中交换机级联链路未配置Trunk。
SNS2124(以及SNS2224&SNS2248&SNS3096&SNS5192&SNS5384)交换机在多链路级联未配置trunk时,一个session仅选择其中一条级联链路,多个session在多条链路上均衡而非基于Frame的均衡,一个FC连接的IO,只会选择其中一条级联链路进行下发。
无Trunking模式,多个session选择路由到同一个级联链路时,可能形成一条路径拥塞,而其他路径负载却很低,单个级联链路成为瓶颈:
Trunking模式,Trunking以帧为单位,将流量均衡分不到不同的路径上,所有路径都有机会参与全部会话的数据传输,且数据帧会优先在低负载的路径上进行下发:
因此,在存储业务网络流量较大时,无Trunking模式会可能导致链路拥塞,出现性能问题。
处理过程
1、对比主机性能数据及存储性能数据,确认IO时延主要耗时不在存储内;
2、并通过portperfshow监控光交检查组网情况,确认有级联端口存在瓶颈:
如上图,单个8GB FC端口的带宽已经达到700m以上,说明级联端口存在瓶颈;
3、通过光交命令islshow及trunkshow命令确认级联配置情况,配置了trunk的情况应当如下,islshow将标识聚合后的带宽,其他情况表示未成功配置trunk:
至此,确认根因为级联链路未配置TRUNK,且链路带宽达到瓶颈。
解决方案
调整组网,对多条级联链路配置trunk(需要license支持),具体配置参考对应版本光交的ISL Tunking管理指导。
转自:https://support.huawei.com/enterprise/zh/knowledge/EKB1100055673