面试题 四 redis线上为什么不能使用 keys *命令

Redis现如今使用的场景越来越多?如何批量删除key呢?

参考

有人说用KEYS命令,刚开始学Redis的时候就是用这个命令列出库中键。

KEYS命令要谨慎使用。
为何?客观别急,我们先一步步来看。

KEYS 命令
Warning: consider KEYS as a command that should only be used in production environments 
with extreme care. It may ruin performance when it is executed against large databases. 
This command is intended for debugging and special operations, such as changing your 
keyspace layout. Don't use KEYS in your regular application code. If you're looking for
 a way to find keys in a subset of your keyspace, consider using sets.

上面是官方文档声明,KEYS命令不能用在生产的环境中,这个时候如果数量过大效率是十分低的。同时也不要用KEYS正则匹配,官方建议直接用集合类型。

有人说 KEYS相当于关系性数据的库的 select *,在生产环境几乎是要禁用的。

KEYS命令的性能随着数据库数据的增多而越来越慢
KEYS命令会引起阻塞,连续的 KEYS命令足以让 Redis 阻塞
试想如果Redis阻塞超过10秒,如果有集群的场景,可能导致集群判断Redis已经故障,从而进行故障切换;

以上的情况严重会导致应用程序出现雪崩的情况。

然而,网上很多都是这么写的 redis-cli --raw keys "key前缀*" | xargs redis-cli del,千万别照炒,拿到生产环境上做实验。

顺便普及下xargs命令,这是Linux下的一个命令 。

xargs命令是给其他命令传递参数的一个过滤器,也是组合多个命令的一个工具。它擅长将标准输入数据转换成命
令行参数,xargs能够处理管道或者stdin并将其转换成特定命令的命令参数。xargs也可以将单行或多行文本输
入转换为其他格式,例如多行变单行,单行变多行。xargs的默认命令是echo,空格是默认定界符。这意味着通过
管道传递给xargs的输入将会包含换行和空白,不过通过xargs的处理,换行和空白将被空格取代。xargs是构建
单行命令的重要组件之一。
SCAN 命令

Redis从2.8版本开始支持scan命令,SCAN命令的基本用法如下:

复杂度虽然也是 O(n),通过游标分步进行不会阻塞线程;
有限制参数 COUNT ;
同 keys命令 一样提供模式匹配功能;
服务器不需要为游标保存状态,游标的唯一状态就是 scan 返回给客户端的游标整数;
scan用法
SCAN cursor [MATCH pattern] [COUNT count]
  1. 第一个遍历是 cursor 值为0,然后将返回结果的第一个整数作为下一个遍历的游标,如果最后返回的到cursor的值为0就代表结束。
  2. 第一个遍历是 cursor 值为0,然后将返回结果的第一个整数作为下一个遍历的游标,如果最后返回的到cursor的值为0就代表结束。
127.0.0.1:6379> scan 0 MATCH tony* 
1) "42"
2)  1) "tony25"
    2) "tony2519"
    3) "tony2529"
    4) "tony2510"
    5) "tony2523"
    6) "tony255"
    7) "tony2514"
    8) "tony256"
    9) "tony2511"
   10) "tony15"
127.0.0.1:6379> scan 42 MATCH tony* COUNT 1000
1) "0"
2)  1) "tony3513"
    2) "tony359"
    3) "tony4521"
    4) "tony356"
    5) "tony30"
    6) "tony320"
    7) "tony3"
    8) "tony312"

返回分为两个部分如上面的代码中,

  1. 代表下一次迭代的游标,
  2. 代表本次迭代的结果集,注意如果返回游标为0就代表全部匹配完成。
批量删除scan命令

因为KEYS命令的时间复杂度为O(n),而SCAN命令会将遍历操作分解成m次,然后每次去执行,从而时间复杂度为O(1)。也解决使用keys命令遍历大量数据而导致Redis服务器阻塞的情况。所以建议使用下边的指令进行批量的删除操作:

redis-cli --scan --pattern "key前缀*" | xargs -L 1000 redis-cli del

总结

因为Redis是但线程的KEYS在某种情况下会阻塞。有个真实真案件小哥哥生产用KEYS,最终导致服务宕机。后果很严重,产生的经济损失就不说了。

切记严重会导致程序的雪崩,删除的时候用SCAN命令,看完这篇文章应该都记住了。

Redis开发的建议

1、 数据分离

不要什么都往Redis中放,尽量放些QPS比较高的数据,内存的开销很昂贵的,可以考虑硬盘存放。

2、分业务

不同的实例单独放这样存取的时候方便些,故障的时候也不会影响其他的实例。

3、压缩

redis中有很大的单个key的值建议压缩成二进制存放。

4、失效时间

redis中设置key的失效时间,如果不设置会一直占用着内存,而且key的失效时间应该根据业务场景来设置。

5、容量

占用内存不要太大10-20G,其次键的数量控制在1千万以内。

6、监控

运维合理的监控好数据,做好Redis安全漏洞的防护和灾备。
posted @ 2020-12-11 11:10  wzqwer  阅读(1882)  评论(0编辑  收藏  举报