NFS共享磁盘异常
NFS共享磁盘异常
故障描述
数据库所挂载的nfs存储网络链路出现中断,所有挂载NFS存储节点所对应的服务均出现异常。
故障原因
根据哈希算法特性,若业务流量五元组一致(源地址、源端口、目的地址、目的端口、协议),则这部分流量将被发送至同一条链路,不会进行负载分担。由于短时间内开通大量与**平台业务相关策略工单,部分业务流量hash至NAS存储的同一链路,在业务流量高峰时段,单条网络链路利用率过高,网络不稳定,导致主机丢失挂载的共享存储目录。
处理过程
强制卸载NFS共享存储;然后通过可以ping通的共享存储IP:10.21.51.90进行NFS存储挂载;
在重启**平台管控服务,开发项目组验证业务恢复正常
改进建议
增加对共享磁盘的监控项;将所有挂载点均换成高可用挂载点,避免出现单点故障影响业务