技术架构（6）-分布式缓存

什么是缓存

缓存是为了提高IO操作效率，提升数据读取命中率的一类硬件或者软件。在应用开发中，缓存通常是指将磁盘数据放在内存中的一类软件产品。

单体架构中用到的单机缓存把数据库的数据放到本地内存中，可以把数据写到HashMap，也可以写到成熟的缓存产品中。本地缓存不需要网络交互、序列化和反序列化，所以效率非常高。但它也存在一些制约。

在这些制约因素下，随着分布式技术的发展，出现了分布式缓存。

分布式缓存虽然叫分布式，实际上是一个集中的缓存，只是它支持用多台服务器来扩展性能。

数据的写操作同时更新数据库和缓存时，这不是一个原子操作，任何一方发生错误都会导致数据不一致。

通常的做法是，写入操作只写数据库，同时删除缓存。读取的时候，先读缓存，如果没有命中就把数据库的数据写入缓存再返回。

在写入数据时，如果写数据库成功，但删除缓存失败，也会导致不一致。这个时候，要对缓存的数据设置过期时间，失效之后再次访问时，会去数据库同步数据。

某个缓存失效了，这时候恰好有这个数据的大并发查询过来，所有请求直接打到数据库上，数据库就崩了，这个叫击穿。

搜索的数据根本不存在，就会越过缓存去查数据库，这叫穿透。如果有人恶意去频繁查询不存在的数据，会导致压力全部打到数据库上。

布隆过滤器。核心思想是不保存实际数据，而是在内存中创建定长的位图（bitmap），通过多次Hash，给多个对应的位打标志，用0和1来标记数据是否存在。优点是空间效率和查询时间都比一般的算法要好的多，缺点是有一定的误识别率和删除困难。

当多个缓存同时失效，或者缓存本身出问题了，导致大量查询请求打到数据库上，会宕机，这叫雪崩。

关注度特别高的数据，即使放在缓存，它也扛不住巨大的流量，比如关于明星的吃瓜新闻，抵不住几千万人都去访问，这就是缓存热点。

这个知识点其实有大量的内容可以学习，我这里只列出了关键点，没有展开。

posted on 2022-07-19 10:53 别样风景天阅读(165) 评论(0) 收藏举报

刷新页面返回顶部