随笔分类 -  故障集锦

摘要:OSB集群故障2 故障现象 SOA管控平台监控的服务器发生异常,服务器列表采集时间异常服务器列表如下:osb_server20_1 Machine20 UNKNOWN UNKNOWNosb_server21_1 Machine21 UNKNOWN UNKNOWNosb_server22_1 Mach 阅读全文
posted @ 2022-10-20 11:37 机猿巧合 阅读(54) 评论(0) 推荐(0) 编辑
摘要:JMS故障2 故障描述 集成平台JMS故障出现互相漂移,漂移后有一台主机无法正常提供服务 该主机中对应的省份所订阅JMS的服务中断 故障处理过程 集成平台开发反馈JMS出现互相漂移现象,且漂移后无法正常提供服务; 未排查出确定原因,在经过授权后进行重启两个故障节点,优先恢复业务; 经过排查为集群中某 阅读全文
posted @ 2022-10-20 11:36 机猿巧合 阅读(26) 评论(0) 推荐(0) 编辑
摘要:集成平台JMS故障 故障描述 集成平台业务通信中断 业务不可用 故障处理过程 发现134机器无法登陆,监控脚本报错,weblogic控制台页面显示该主机状态为SHUTDOWN, 私有云团队对134机器排查时发现,虚拟化控制台显示该主机黑屏且无法操作,通过授权后对这台机器进行重启,准备恢复这台主机; 阅读全文
posted @ 2022-10-20 10:54 机猿巧合 阅读(77) 评论(0) 推荐(0) 编辑
摘要:集成平台JMS故障 故障描述 集成平台业务通信中断 业务不可用 故障处理过程 发现134机器无法登陆,监控脚本报错,weblogic控制台页面显示该主机状态为SHUTDOWN, 私有云团队对134机器排查时发现,虚拟化控制台显示该主机黑屏且无法操作,通过授权后对这台机器进行重启,准备恢复这台主机; 阅读全文
posted @ 2022-10-17 16:27 机猿巧合 阅读(19) 评论(0) 推荐(0) 编辑
摘要:OSB集群有异常 故障描述 集群共计14台机器,单台机器故障告警 故障原因 调用**平台的其它系统报文大小超过限制,引起集群内部迁移,osb_server2 在迁移过程中JVM回收异常,导致长时间不响应外部请求,进而引起该节点无法正常提供服务。 故障恢复 重启OSB1集群server2节点,故障恢复 阅读全文
posted @ 2022-10-17 10:26 机猿巧合 阅读(45) 评论(0) 推荐(0) 编辑
摘要:NFS共享磁盘异常 故障描述 数据库所挂载的nfs存储网络链路出现中断,所有挂载NFS存储节点所对应的服务均出现异常。 故障原因 根据哈希算法特性,若业务流量五元组一致(源地址、源端口、目的地址、目的端口、协议),则这部分流量将被发送至同一条链路,不会进行负载分担。由于短时间内开通大量与**平台业务 阅读全文
posted @ 2022-10-17 10:18 机猿巧合 阅读(109) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示