Redis大key问题总结
概述
redis 中的大key 主要包括以下几个部分(超过M级别的):
- 单个简单的key存储的value很大
- hash, set,zset,list 中存储过多的元素
- 一个集群存储了上亿的key
大key有什么影响
我们都知道,redis的一个典型特征就是:核心工作线程是单线程。单线程中请求任务的处理是串行的,前面完不成,后面处理不了,同时也导致分布式架构中内存数据和CPU的不平衡。
- 执行大key命令的客户端本身,耗时明显增加,甚至超时
- 执行大key相关读取或者删除操作时,会严重占用带宽和CPU,影响其他客户端
- 大key本身的存储带来分布式系统中分片数据不平衡,CPU使用率也不平衡
- 大key有时候也是热key,读取操作频繁,影响面会很大
- 执行大key删除时,在低版本redis中可能阻塞线程
这样看来大key的影响还是很明显的,最典型的就是阻塞线程,并发量下降,导致客户端超时,服务端业务成功率下降。
大key是如何产生的
大key的产生往往是业务方设计不合理,没有预见vaule的动态增长问题:
- 一直往value塞数据,没有删除机制,迟早要爆炸
- 数据没有合理做分片,将大key变成小key
如何找到大key
①:增加内存&流量&超时等指标监控
由于大key的value很大,执行读取时可能阻塞线程,这样Redis整体的qps会下降,并且客户端超时会增加,网络带宽会上涨,配置这些报警可以让我们发现大key的存在。
②:bigkeys命令
使用bigkeys命令以遍历的方式分析Redis实例中的所有Key,并返回整体统计信息与每个数据类型中Top1的大Key
③:redis-rdb-tools
使用redis-rdb-tools离线分析工具来扫描RDB持久化文件,虽然实时性略差,但是完全离线对性能无影响。redis-rdb-tools是由Python写的用来分析Redis的rdb快照文件用的工具,它可以把rdb快照文件生成json文件或者生成报表用来分析Redis的使用详情。
④:集成化可视化工具
基于某些公有云或者公司内部架构的redis一般都会有可视化的页面和分析工具,来帮助我们定位大key,当然页面底层也可能是基于bigkeys或者rdb文件离线分析的结果。
如何解决大key问题
根据大key的实际用途可以分为两种情况:可删除和不可删除。
可删除
如果发现某些大key并非热key就可以在DB中查询使用,则可以在Redis中删掉:
当Redis版本大于4.0时,可使用UNLINK命令安全地删除大Key,该命令能够以非阻塞的方式,逐步地清理传入的Key。
Redis UNLINK 命令类似与 DEL 命令,表示删除指定的 key,如果指定 key 不存在,命令则忽略。UNLINK 命令不同与 DEL 命令在于它是异步执行的,因此它不会阻塞。UNLINK 命令是非阻塞删除,非阻塞删除简言之,就是将删除操作放到另外一个线程去处理。
当Redis版本小于4.0时,避免使用阻塞式命令KEYS,而是建议通过SCAN命令执行增量迭代扫描key,然后判断进行删除。
Redis Scan 命令用于迭代数据库中的数据库键。SCAN 命令是一个基于游标的迭代器,每次被调用之后, 都会向用户返回一个新的游标, 用户在下次迭代时需要使用这个新游标作为 SCAN 命令的游标参数, 以此来延续之前的迭代过程。
压缩和拆分key
- 当vaule是string时,比较难拆分,则使用序列化、压缩算法将key的大小控制在合理范围内,但是序列化和反序列化都会带来更多时间上的消耗。
- 当value是string,压缩之后仍然是大key,则需要进行拆分,一个大key分为不同的部分,记录每个部分的key,使用multiget等操作实现事务读取。
- 当value是list/set等集合类型时,根据预估的数据规模来进行分片,不同的元素计算后分到不同的片。
一般是采用多台 Redis, 分别去存储用户的数据,从而实现内存数据的扩容.对于用户而言:会将 Redis 分片的多个 Redis 当作一个整体,不在乎数据存在那个中,只在乎能不能存储。Redis的大key问题,无论在面试还是工作中都很常见,好好理解一波,非常值得。