【故障公告】阿里云 RDS 数据库突发 CPU 近 100% 引发全站故障

今天晚上9点我们收到阿里云的告警通知:

【阿里云监控】华东1(杭州)-云数据库RDS版<cnblogsdb> [instanceId=xxx] 于21:00 发生告警, 前往诊断 CPU使用率平均值(98.25>=80 ), 持续时间4分钟, rds_CpuUsage

收到通知后,我们立即登录阿里云 RDS 控制台进行主备库切换,等主备库完成切换后一看并没有切换过来,赶紧再次进行切换,第2次切换成功了,切换完成后 CPU 立刻降至正常水平,全站恢复正常。

这次故障发生时间是8月20日20:55~21:14,由此给您带来麻烦,请您谅解。

上次发生同样故障是6月24日,详见 【故障公告】阿里云 RDS 实例 CPU 100% 故障引发全站无法正常访问

阿里云数据库专家分析后怀疑是“LINQ 生成的 SQL 存在问题,导致概率性 SQL Server 出现参数嗅探问题”。

我们会进一步分析并优化这次引发参数嗅探问题的 SQL 语句。

posted @   博客园团队  阅读(5487)  评论(23编辑  收藏  举报
编辑推荐:
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· DeepSeek 解答了困扰我五年的技术问题
· 为什么说在企业级应用开发中,后端往往是效率杀手?
阅读排行:
· 2分钟学会 DeepSeek API,竟然比官方更好用!
· .NET 使用 DeepSeek R1 开发智能 AI 客户端
· DeepSeek本地性能调优
· autohue.js:让你的图片和背景融为一体,绝了!
· 10亿数据,如何做迁移?
历史上的今天:
2018-08-20 上周热点回顾(8.13-8.19)
2014-08-20 [致歉]2:05-6:35部分站点出现故障,给您带来麻烦,请谅解
2012-08-20 上周热点回顾(8.13-8.19)
点击右上角即可分享
微信分享提示