光纤交换机端口故障排查
1、定位问题
设备正常状态下通过switchshow可以看到状态是online、设备的WWN(L_Port和NPIV除外)和端口类型。
- 使用admin用户登录交换机
- 输入switchshow检查设备端口的状态是否是online
- 输入portcfgshow,检查端口配置是否正常
- 输入porterrshow,检查端口错误计数器是否正常
- 输入portlogdump port,检查端口login相关日志,重点是event(SPEE、INTR)和CMD(NC、AC)
Brocade_5300:admin> switchstatusshow【查看整个交换机的状态】
Brocade_5300:admin> portcfgshow
默认情况端口速率和端口类型初始化都是自适应(portcfgspeed可以查看端口速率)。如果端口有锁定为L_Port,那么这个端口就只能用于连接loop类型设备,可以通过portcfgdefault重置端口。
Brocade_5300:admin> porterrshow
检查输出结果是否有较高的error计数器(比如CRC错误或者ENC_OUT错误),只有在不停稳步增长的错误才能确认链路有问题。一般可以5分钟看一次。
- Tx和Rx分别代表发送和接受的帧数量
- Crc_err代表CRC校验错误的帧数量。如果这个错误数量一直在上升,那么这个链路应该有物理故障。需要检查光纤线,SFP,HBA卡等。
8GB平台请先检查portcfgshow里面fill word是否是3。
- Enc_out错误与帧本身没有关系,通常代表代表一个primitive signal或者sequence有错误。通常确认是否光纤线有问题的方法是5-10分钟抓取一次porterrshow结果,如果看到crc_err计数器一直上升,那么光纤线或者HBA卡有硬件问题。
- Disc_c3代表class 3类型FC帧有丢包现象,一般是由于帧在交换机buffer里面超时导致。当ISL链路过载或者不稳定时候会有这个问题。
一般结合两个或者两个以上错误指标来诊断问题,必要时候需要参考portstatsshow结果。
Brocade_5300:admin> portstatsshow 0
Brocade_5300:admin> portlogdump 0 |grep -E "SPEE|INTR"
如果有event是pstate并且cmd是AC这行,那么代表端口初始化成功。初始化成功后,设备要么是F_Port或者E_Port取决于端口的另外一端设备。
如果端口对端是主机或者存储,那么端口就是F_Port;如果是另外一台交换机,那么端口就是E_Port
转自:https://www.cnblogs.com/liuxing0007/p/11017787.html