【Azure 微服务】记一次错误的更新Service Fabric 证书而引发的集群崩溃而只能重建
问题描述
错误的操作步骤:
1)更新Service Fabric 的证书,制定了次要证书(Secondary),但是只修改了Service Fabric Cluster证书,而没有指定VMSS(虚拟机规模集)的证书
2)在Azure Service Fabric 的门户中的Certificates页面,点击主从切换后,发现_Node_0就Down
3)[错误步骤] 为了解决#2的问题,把当前的SF通过ARM模板重新部署了一次,导致问题严重,所有Node都Down了,这时候,Service Fabric Explorer工具还是可以打开的
4) 重启了VMSS,发现问题更加严重,Service Fabric Explorer也无法打开
问题分析
面对以上的问题,因为集群已经损坏,无法连接到Service Fabric Explorer上查看Eorror/Waining信息,所以最快的办法就是新建Service Fabric Cluster,在新建Cluster的时候同时就选择新证书。
正确的替换证书的步骤
使用ARM Teamplate修改证书:(Service Fabric, 使用ARM Template方式来更新SF集群的证书(Renew SF Certificate) )
使用PowerShell命令修改证书:(因证书过期导致Service Fabric集群挂掉(升级无法完成,节点不可用))
如果替换证书后,打开Service Fabric Explorer出现“证书无效错误”
出现该问题的原因是:
- 本地安装的证书与Service Fabric Explorer的域名不一致所致,但是他们的签名Thumbprint (指证书中的Thumbprint 和在SF Cluster中配置的Thumbprint )一样。
- 这个报错并不会影响Service Fabric 运行,可以忽略。
当在复杂的环境中面临问题,格物之道需:浊而静之徐清,安以动之徐生。 云中,恰是如此!