【故障公告】数据库服务器今年第六次 CPU 100% 故障
自9月第五次数据库服务器 CPU 100% 故障之后,今天下午又出现数据库服务器 CPU 100% 故障,是今年的第六次。
自从园子2013年搬上阿里云,几乎每年都会遇到数据库服务器 CPU 100% 问题,但今年创造了新记录,一年还未结束,却已遭遇六次,最困难的一年,连故障也过来凑热闹。
今天的故障发生于 14:28~14:50 期间,我们在 14:30 左右发现故障,立即采用故障处理三板斧之第一斧——重启RDS实例,重启后恢复正常,但很快又出现 CPU 100%,紧接着采用故障处理三板斧之第二斧——主备切换,切换完成后恢复正常。
我们租用的阿里云 RDS 规格是 SQL Server 2016 标准版-高可用系列-16核32G,这个 CPU 100% 问题很奇怪,可能是因为一只老鼠坏了一锅汤——参数嗅探问题造成 SQL Server 缓存了性能极差的执行计划,但我们不能确认就是这个原因,可能要等以后自己用阿里云服务器部署 SQL Server 才能验证。
这次故障给大家带来了麻烦,请大家谅解。
更新:接下来我们会对故障期间性能差的 SQL 进行优化。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Deepseek官网太卡,教你白嫖阿里云的Deepseek-R1满血版
· 2分钟学会 DeepSeek API,竟然比官方更好用!
· .NET 使用 DeepSeek R1 开发智能 AI 客户端
· DeepSeek本地性能调优
· autohue.js:让你的图片和背景融为一体,绝了!
2020-11-09 上周热点回顾(11.2-11.8)
2015-11-09 上周热点回顾(11.2-11.8)
2009-11-09 上周热点回顾(11.2-11.8)