程序员修神之路--高并发下为什么更喜欢进程内缓存
菜菜哥,告诉你一个好消息
YY妹子,什么好消息,你有男票了?
不是啦,我做的一个网站,以前经常由于访问量太大而崩溃,现在我加上了缓存,很稳定啦
加的什么缓存呢?
我用的redis,号称业界最快的缓存组件了
你觉得现在的缓存操作应该是最快的了吗?
是的,我觉得没有缓存能比这种模式更快了
你先停停,我给你先讲个故事
进程内缓存是指缓存和应用程序在相同地址空间。即同一个进程内。分布式缓存是指缓存和应用程序位于不同进程的缓存,通常部署在不同服务器上。
从前有个机构,机构的主人叫做 CPU,这个机构专门派仆人取一些东西然后做相应的处理。下面是这个机构日常的场景。
cpu
赶紧去我的仓库L1缓存取点东西
仆人
主人你要的东西,那里离我们最近,所以很快,但是空间比较小。
cpu
你丫还挺快,只用了大约一秒
cpu
赶紧去仓库 L2缓存取点东西
仆人
主人你要的东西,那里离我们也很近,比L1缓存远一点,但是也很快,空间比较小,但是比L1缓存的空间大。
cpu
速度还可以,大约20秒就回来了
cpu
街上有一个地方叫内存,赶紧去取点东西
仆人
主人你要的东西,内存这个地方空间很大呀,就是稍微远了点
cpu
居然用了5分钟,等你这段时间我都刷了好几个段子了
cpu
有一个叫做磁盘的小镇,赶紧去取点东西
仆人
主人你要的东西,磁盘这个地方空间太大呀,取点东西很慢呀
cpu
居然用了5天,等你这段时间我都能报团来一个周边游了
cpu
有一个叫做互联网的国度,赶紧去取点东西
仆人
主人你要的东西,互联网太远了,取点东西太费劲了
cpu
居然用了15天,等你去互联网取东西,简直就是在浪费我的生命
当我做完一个委托人的任务,切换到另外一个委托人的任务时候,我需要把上一个委托人的一些信息先记录下来,然后还需要把新委托人的信息读取一遍,这个过程我是很耗时的,大约需要一个小时呢
通过以上不正经的小故事,我们可以了解到cpu取各个设备数据的大体差距。至于YY妹子的问题,大家也应该了解了。
1. 首先把数据从磁盘加载到内存做缓存,这个是对的。毕竟磁盘的IO速度比内存要慢的多。就拿我们现在使用的大多数PC机以及服务器来说,磁盘往往是性能的瓶颈。
2. 如果有条件或者框架支持可以实现进程内缓存,我还是推荐使用进程内缓存,毕竟类似Redis这样的kv存储和应用程序多数情况不在一台服务器上,虽然局域网的速度肉眼看起来非常快,但是对于cpu来讲,还是让cpu休了一个大假。
至于什么情况下适合应用进程内缓存,我觉得有几点需要注意:
1. 相同的请求或者设置的相同缓存key的请求每次都是同一个服务器上的同一个程序去处理,这样这个请求的缓存正常情况下只会产生一份。 如果每次请求都会路由到不同的服务器,便会产生多个缓存的副本,维护这些缓存数据的一致性是需要代价的。
2. 当有新的服务器节点加入或者服务器节点退出的时候,不能发生雪崩现象,所有缓存请求都穿透到达数据库,那是比较要命的。比如可以看一下菜菜以前的文章:分布式缓存的一条明路(附代码)
3. 如果缓存的处理服务器发生变化,比如:由于某种原因,开始请求是由服务器A来处理,后来A服务器down了,现在由服务器B来处理,在缓存转移的过程中,必须能保证数据的正确性和一致性。
4. 程序的进程内缓存必须有过期策略,在有限内存大小的情况下,合理的使用。推荐使用LRU淘汰算法来保证内存不会撑爆。
5. 系统的并发量及其大,对性能的要求及其高,可以考虑使用进程内缓存。
6. 如果是小部分只读数据,并且访问量比较大,例如经常使用的字典数据等,可以考虑使用进程内缓存。
相对于分布式缓存,比如Redis,进程内缓存有哪些优势呢?
1. 进程内缓存性能比较高,延迟会更小,更节省带宽,毕竟分布式缓存网络调用的性能和本地调用比起来慢太多,
2. 由于和应用程序位于同一进程,共享相同的虚拟内存,所以在状态维护上更容易一些,
3. 其次进程内的缓存不设计到网络传输,所以没有序列化的过程,在性能上更胜一筹。
4. 进程内缓存的数据类型几乎可以是语言级别支持的任意类型,数据类型设计上比大多数分布式缓存设备支持要灵活许多。
在应对高并发的情况下,如果有适当的环境菜菜还是觉得进程内缓存为首选,另外一点程序要尽量避免线程切换,尽量异步化。如果可以最好能预估出缓存数据的大小,避免内存泄漏等现象发生。
当然分布式缓存有自己的优势,在监控,容灾,扩展性,易用性等方面更胜一筹。至于用进程内还是分布式缓存,没有定论,能解决业务痛点就是最好的结果
程序如果要想最大程度的提升并发量,缩短响应时间, 就把用户需要的数据放在离用户最近的地方