网站故障公告4:最新进展——也许还是虚拟机惹的祸
继续说抱歉!今天虽然在访问次高峰期访问速度表现不错,但是在访问最高峰期还是没扛得住。
继续努力解决问题!这是我们唯一的选择。“他说风雨中这点痛算什么,擦干泪,不要问为什么。。。”
RDS的原因已经排除。故障的重要特征已锁定。在访问速度慢的时候,云服务器的TCP连接数特别高;Requests/s波动很大(见下图),在0~上百之间跳动;IIS同时连接数(来自负载均衡)由平时的100以下剧增至2000以上;加上昨天的创建数据库连接的超时问题(今天由于在连接字符串中设置了Connect Timeout=150,连接超时未出现)。这些现象说明了云服务器的TCP连接处理能力急剧下降。
我们猜测在访问高峰期,云服务器的并发连接数超过一定的阈值时,云服务器的网络吞吐能力会急剧下降。
怎么解决这个问题?目前最快最有效的方法就是向负载均衡中填更多的云服务器,减少单台云服务器的并发连接。明天还要准备更多的云服务器,只要一出现问题,就向负载均衡中填云服务器。
相关博文:
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· DeepSeek 解答了困扰我五年的技术问题
· 为什么说在企业级应用开发中,后端往往是效率杀手?
· 2分钟学会 DeepSeek API,竟然比官方更好用!
· .NET 使用 DeepSeek R1 开发智能 AI 客户端
· autohue.js:让你的图片和背景融为一体,绝了!
· 10亿数据,如何做迁移?
· 推荐几款开源且免费的 .NET MAUI 组件库