云计算之路-阿里云上：OCS问题的进展以及11:30-11:50遇到的问题

阿里云云服务器性能监控图

（上图是今天出问题期间Web服务器性能监控图，紫色表示的是Request Execution Time）

昨天我们发布了一篇博客分享了我们这两天遇到的OCS（开放缓存服务）问题，详见云计算之路-阿里云上：愚人节被阿里云OCS愚。

后来，阿里云确认了问题的原因：在OCS升级过程中造成了写入的缓存数据过期时间丢失，只需删除这些有问题的缓存数据就不会再出现这个问题。

今天一大早访问低峰的时候，我们进行了清空OCS实例缓存的操作，解决了OCS缓存不能过期的问题。

今天中午11:30左右，园子访问速度突然变慢，上Web服务器一看——就看到了上面的性能监控器，大量请求执行缓慢。当时看到这样的图，真的很心痛——每个跳高的紫色都代表着用户的不满、愤怒，都是对用户体验的极大伤害，我们性能优化的一切努力都是为了降低这个紫色。而云基础实施服务的一点问题就会让我们的努力付之流水。

心痛归心痛，面对问题，唯一的选择是解决问题。

再看上面的性能监控图，Web服务器的CPU占用是正常的（红色线条），说明问题不在云服务器。

接着看数据库服务器（RDS）的状况——

阿里云RDS监控图

（上图是RDS数据库连接数的监控数据）

出问题期间，RDS的数据库连接数突然飙上去了，这是一个很重要的线索——根据我们的应用场景，只有缓存服务出问题或者缓存命中率急骤下降，才能造成这样的数据库连接数突增。

而出现这样的问题，不仅仅是给数据库带来压力造成性能下降，更糟糕的是在从数据库中读取数据后还要再写入缓存，这也带来额外的性能影响。如果缓存一直有问题，就会不断地进行这样的循环：读缓存->没命中->读数据库->写缓存。。。这样一折腾，网站访问速度会大受影响

出问题时的场景很可能就是这样，所以我们不得不把怀疑对象又放到了阿里云OCS上。

紧接着就是查看应用程序的日志，我们在应用中进行了这样的记录——只要读取缓存超过100毫秒，就记录日志。出人意料的是日志中几乎没有超过100毫秒的缓存读取记录，也就是说出问题期间读取OCS缓存的速度是很快的。

难道也不是OCS引起的问题？。。。

关于缓存，还有一个我们不能忽视的地方——缓存命中率。

如果假设当时OCS的缓存命中出了问题——缓存中有数据却读取不到或者数据没有真正写入缓存，问题期间所发生的现象就都得到了合理的解释。

但是由于OCS管理控制台查看不到历史监控数据，看不到出问题期间的缓存命中率，我们无法验证这个猜测。只能等待阿里云的排查，目前阿里云还在排查中。

11:50左右，一切又恢复了正常。

在出问题的期间，给大家带来了麻烦，望大家谅解！

posted @ 2014-04-02 14:19 博客园团队阅读(3017) 评论(3) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】博客园社区专享云产品让利特惠，阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· DeepSeek 解答了困扰我五年的技术问题
· 为什么说在企业级应用开发中，后端往往是效率杀手？

阅读排行：
· 2分钟学会 DeepSeek API，竟然比官方更好用！
· .NET 使用 DeepSeek R1 开发智能 AI 客户端
· autohue.js：让你的图片和背景融为一体，绝了！
· 10亿数据，如何做迁移？
· 推荐几款开源且免费的 .NET MAUI 组件库

历史上的今天：
2012-04-02 上周热点回顾（3.26-4.1）
2009-04-02 博客园电子期刊2009年3月刊发布

公告

阿里云特惠

昵称：博客园团队
园龄： 16年7个月
粉丝： 9208
关注： 100

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔分类

随笔档案

合作伙伴

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:字节豆包，来园广告（MarsCode 编程助手已支持 DeepSeek）
如果支持VS就好了，而不是VS CDOE
--fxyc87
2. Re:字节豆包，来园广告（MarsCode 编程助手已支持 DeepSeek）
@天悠写Go的体验确实比通义千问好...
--whytc
3. Re:字节豆包，来园广告（MarsCode 编程助手已支持 DeepSeek）
@皮卡丘(≧▽≦)/ 确实卡,32G内存的开发机都带不动它,卡顿得要死要活,还是Disable掉了....
--bloodish
4. Re:博客园 & 1Panel 以及 Halo 联合终身会员上线
@JavAndroidJSql 博客园员工少没人手, 以前有个园有开发的客户端....
--天湛蓝
5. Re:博客园 & 1Panel 以及 Halo 联合终身会员上线
@吾乃零陵上将军邢道荣哈哈, 我也发现了, 闪存是是小年轻们的地盘, 哈哈,其实博客园可以在这一块好好耕耘的....
--天湛蓝
6. Re:感谢「河南图奕网络」赞助园子，成为第一家创始赞助商
没有需求的可以去他们家网站逛逛，增加点人气
--龙飞天汉
7. Re:上周热点回顾（2.10-2.16）
全是deepseek
--zj2001
8. Re:致园友们的一封检讨书：都是我们的错
1111111111111111111111111111
--rick吊的一逼
9. Re:致园友们的一封检讨书：都是我们的错
11111111111111111111111111111111

111111211111111111111111111111111111111111111111
--rick吊的一逼
10. Re:感谢「河南图奕网络」赞助园子，成为第一家创始赞助商
越来越好🥹
--tingfengkiss