云上的芯脏病:奇怪的阿里云 RDS 数据库突发 CPU 近 100% 问题

最近遇到了奇怪的阿里云 RDS 数据库突发 CPU 近 100% 问题,遇到了3次。

第一次是10月12日(周六)凌晨 3:24 负载极低的时候开始出现,早上发现后进行了主备切换,恢复了正常。

第二次也是出现在10月12日,就在主备切换后不久,发现后又进行了主备切换,切换回之前出问题的服务器,恢复了正常。

第三次是昨天(10月18日)23:15 开始出现,今天早上(也是周六)发现后,再次通过主备切换恢复了正常。

阿里云 RDS 型号用的是 SQL Server 2016 标准版,是9月份从 SQL Server 2008 R2 升级上来的,配置是 16核CPU,32G内存,比升级之前的配置上了一个档次。

问题非常奇怪,目前还没找到线索,有待进一步观察。

我们没向阿里云提交工单,因为之前每次遇到类似的问题,阿里云都是让我们优化 SQL ,而没有一次是通过优化 SQL 解决的。

非常抱歉,这个突发的云上芯脏病问题给您带来了麻烦,请您谅解。

posted @   博客园团队  阅读(3154)  评论(20编辑  收藏  举报
编辑推荐:
· 从二进制到误差:逐行拆解C语言浮点运算中的4008175468544之谜
· .NET制作智能桌面机器人:结合BotSharp智能体框架开发语音交互
· 软件产品开发中常见的10个问题及处理方法
· .NET 原生驾驭 AI 新基建实战系列:向量数据库的应用与畅想
· 从问题排查到源码分析:ActiveMQ消费端频繁日志刷屏的秘密
阅读排行:
· Windows桌面应用自动更新解决方案SharpUpdater5发布
· 我的家庭实验室服务器集群硬件清单
· C# 13 中的新增功能实操
· Supergateway:MCP服务器的远程调试与集成工具
· Vue3封装支持Base64导出的电子签名组件
历史上的今天:
2015-10-19 上周热点回顾(10.12-10.18)
2014-10-19 云计算之路-阿里云上:地域与可用区
点击右上角即可分享
微信分享提示