故障公告:黑色星期四(暂时恢复正常)
非常非常抱歉,今天上午园子又出现大范围故障,由此给您很大的麻烦,请您谅解。
问题非常非常奇怪,是上周四故障(故障公告:高并发下全线崩溃)的重演。
目前来看似乎是 k8s 集群的网络通信出现了问题,k8s 集群是我们用阿里云服务器自己搭建的。
故障还在进一步排查中。。。
抱歉抱歉抱歉。。。
更新:
13:25 完成了重启 k8s 集群所有 worker 节点服务器(共23台)
...... 继续故障
15:00 再次尝试进行数据库服务器(阿里云RDS SQL Server实例)的主备切换后暂时恢复正常。上午故障时进行过多次主备切换,未能恢复,今天下午在几乎绝望时再次尝试主备切换,切换完成后突然恢复正常。