云计算之路-阿里云上:14:20-14:55博客后台2台服务器都CPU 100%引发的故障
2017年6月20日更新:今天我们最终发现,CPU 100%问题是博客后台程序所引用的开源组件 HtmlSanitizer 在处理特定html字符串时引起的,升级至最新版3.4.156可解决这个问题。
非常抱歉,今天下午14:20-14:55期间,由于同一个负载均衡中的2台服务器都出现CPU 100%问题,造成博客后台无法正常访问,由此给您带来了很大很大的麻烦,请您谅解。
博客后台是CPU消耗很低的应用,这2台服务器通常CPU占用在5%左右,之前从来没有出现CPU 100%的问题(所以连云监控都没添加CPU监控报警)。这次问题很突然,我们发现问题后,远程连接不上服务器,只能通过阿里云控制台重启服务器,重启后立马恢复正常。
对于问题的具体原因,目前还没找到,我们正在进一步排查,也反馈给了阿里云,阿里云也在排查。
对于这次故障,我们会吸取教训,采取改进措施:
1)加强监控
2)采用 Docker 进行容器化部署:在更多服务器上用更多容器运行,避免2台服务器同时出问题引发故障,但这要等我们完成博客后台向 ASP.NET Core 的迁移。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· DeepSeek 解答了困扰我五年的技术问题
· 为什么说在企业级应用开发中,后端往往是效率杀手?
· 2分钟学会 DeepSeek API,竟然比官方更好用!
· .NET 使用 DeepSeek R1 开发智能 AI 客户端
· autohue.js:让你的图片和背景融为一体,绝了!
· 10亿数据,如何做迁移?
· 推荐几款开源且免费的 .NET MAUI 组件库
2014-06-09 [网站公告]18:07-18:20阿里云SLB故障造成网站不能正常访问
2014-06-09 上周热点回顾(6.2-6.8)
2010-06-09 解决jQuery冲突问题