Redis 排序功能 -- SORT
在 Redis 的 5 种数据类型中,说到排序就会想起有序集合,有序集合通过给每个元素设定一个分数用于排序存储。
有序集合常见的使用场景是大数据排序,如游戏的玩家排行榜,所以很少会需要获得键 中的全部数据。
不过有序集合要给每个元素都要设定一个分数,有些时候显得太过于麻烦了。
除了使用有序集合外,我们还可以借助 Redis 提供的 SORT
命令来解决排序问题。
sort 命令
SORT命令可以对列表类型、集合类型和有序集合类型键进行排序,并且可以完成与关系数据库中的连接查询相类似的任务。
在列表中使用
redis 127.0.0.1:6379> LPUSH mylist 4 2 5 1 3 7
(integer) 6
redis 127.0.0.1:6379> SORT mylist
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
6) "7"
redis 127.0.0.1:6379>
在集合中使用
redis 127.0.0.1:6379> sadd myset 2 8 5 6 9
(integer) 5
redis 127.0.0.1:6379> SORT myset
1) "2"
2) "5"
3) "6"
4) "8"
5) "9"
redis 127.0.0.1:6379>
在有序集合中使用
在对有序集合类型排序时会忽略元素的分数,只针对元素自身的值进行排序
redis 127.0.0.1:6379> zadd myzset 50 2 40 3 20 1 60 6
(integer) 4
redis 127.0.0.1:6379> zrange myzset 0 -1 withscores
1) "1"
2) "20"
3) "3"
4) "40"
5) "2"
6) "50"
7) "6"
8) "60"
redis 127.0.0.1:6379> SORT myzset
1) "1"
2) "2"
3) "3"
4) "6"
redis 127.0.0.1:6379>
ALPHA 参数:排序字母
除了可以排列数字外,SORT命令还可以通过ALPHA参数实现按照字典顺序排列非数字元素
redis 127.0.0.1:6379> LPUSH mylistalpha a c e d B C A
(integer) 7
redis 127.0.0.1:6379> SORT mylistalpha
(error) ERR One or more scores can't be converted into double
redis 127.0.0.1:6379> SORT mylistalpha ALPHA
1) "A"
2) "B"
3) "C"
4) "a"
5) "c"
6) "d"
7) "e"
redis 127.0.0.1:6379>
中可以看到如果没有加ALPHA参数的话,SORT命令会尝试将所有元素转换 成双精度浮点数来比较,如果无法转换则会提示错误。
DESC 和 LIMIT 参数
SORT命令的 DESC 参数可以实现倒序排序
redis 127.0.0.1:6379> SORT mylist desc
1) "7"
2) "5"
3) "4"
4) "3"
5) "2"
6) "1"
redis 127.0.0.1:6379>
使用 LIMIT 分页显示
LIMIT offset count :跳过前面 offset 个元素(从第 offset+1 个开始),取 count 个元素。
redis 127.0.0.1:6379> SORT mylist desc LIMIT 0 2
1) "7"
2) "5"
redis 127.0.0.1:6379>
BY 参数:自定义排序
假如有一张表的数据的这样的:
uid | user_name_ | user_level_ |
---|---|---|
1 | admin | 9999 |
2 | jack | 10 |
3 | peter | 25 |
4 | mary | 70 |
对于上表中的数据,很多情况下在Redis 中的存储方式是:使用列表存储 uid,再分别用字符串存储 user_name_ {uid} 和 user_level_ {uid}
# admin
redis 127.0.0.1:6379> LPUSH uid 1
(integer) 1
redis 127.0.0.1:6379> SET user_name_1 admin
OK
redis 127.0.0.1:6379> SET user_level_1 9999
OK
# jack
redis 127.0.0.1:6379> LPUSH uid 2
(integer) 2
redis 127.0.0.1:6379> SET user_name_2 jack
OK
redis 127.0.0.1:6379> SET user_level_2 10
OK
...
默认情况下,SORT uid
直接按 uid
中的值排序:
redis 127.0.0.1:6379> SORT uid
1) "1" # admin
2) "2" # jack
3) "3" # peter
4) "4" # mary
通过使用 BY
选项,可以让 uid
按其他键的元素来排序。
比如说, 以下代码让 uid
键按照 user_level_{uid}
的大小来排序:
redis 127.0.0.1:6379> SORT uid BY user_level_*
1) "2" # jack , level = 10
2) "3" # peter, level = 25
3) "4" # mary, level = 70
4) "1" # admin, level = 9999
user_level_*
是一个占位符, 它先取出 uid
中的值, 然后再用这个值来查找相应的键。
比如在对 uid
列表进行排序时, 程序就会先取出 uid
的值 1
、 2
、 3
、 4
, 然后使用 user_level_1
、 user_level_2
、 user_level_3
和 user_level_4
的值作为排序 uid
的权重。
BY参数的语法为 BY 参考键。
其中参考键可以是字符串类型键或者是散列类型键的某个字段(表示为键名->字段名)。
如果提供了 BY 参数,SORT 命令将不再依据元素自身的值 进行排序,而是对每个元素使用元素的值替换参考键中的第一个“*”并获取其值,然后依据该值对元素排序。
GET 参数:获取外部键
使用 GET
选项, 可以根据排序的结果来取出相应的键值。
比如说, 以下代码先排序 uid
, 再取出键 user_name_{uid}
的值:
redis 127.0.0.1:6379>SORT uid GET user_name_*
1) "admin"
2) "jack"
3) "peter"
4) "mary"
redis 127.0.0.1:6379>
通过组合使用 BY
和 GET
, 可以让排序结果以更直观的方式显示出来。
而且可以同时使用多个 GET
选项, 获取多个外部键的值。
比如说, 以下代码就按 uid
分别获取 user_level_{uid}
和 user_name_{uid}
:
redis 127.0.0.1:6379> SORT uid GET user_level_* GET user_name_*
1) "9999" # level
2) "admin" # name
3) "10"
4) "jack"
5) "25"
6) "peter"
7) "70"
8) "mary"
redis 127.0.0.1:6379>
GET
有一个额外的参数规则,那就是 —— 可以用 #
获取被排序键的值。
以下代码就将 uid
的值、及其相应的 user_level_*
和 user_name_*
都返回为结果:
redis 127.0.0.1:6379> SORT uid GET # GET user_level_* GET user_name_*
1) "1" # uid
2) "9999" # level
3) "admin" # name
4) "2"
5) "10"
6) "jack"
7) "3"
8) "25"
9) "peter"
10) "4"
11) "70"
12) "mary"
redis 127.0.0.1:6379>
通过将一个不存在的键作为参数传给 BY
选项, 可以让 SORT
跳过排序操作, 直接返回结果。
这种用法在单独使用时,没什么实际用处。
不过,通过将这种用法和 GET
选项配合, 就可以在不排序的情况下, 获取多个外部键, 相当于执行一个整合的获取操作(类似于 SQL 数据库的 join
关键字)。
redis 127.0.0.1:6379> SORT uid BY not-exists-key GET # GET user_level_* GET user_name_*
1) "4" # id
2) "70" # level
3) "mary" # name
4) "3"
5) "25"
6) "peter"
7) "2"
8) "10"
9) "jack"
10) "1"
11) "9999"
12) "admin"
redis 127.0.0.1:6379>
STORE 参数:保存排序结果
默认情况下, SORT
操作只是简单地返回排序结果,并不进行任何保存操作。
通过给 STORE
选项指定一个 key
参数,可以将排序结果保存到给定的键上。
如果被指定的 key
已存在,那么原有的值将被排序结果覆盖。
# 测试数据
redis 127.0.0.1:6379> RPUSH mynum 1 3 5
(integer) 3
redis 127.0.0.1:6379> RPUSH mynum 2 4 6
(integer) 6
redis 127.0.0.1:6379> LRANGE mynum 0 -1
1) "1"
2) "3"
3) "5"
4) "2"
5) "4"
6) "6"
redis 127.0.0.1:6379> SORT mynum STORE sorted-nums
(integer) 6
redis 127.0.0.1:6379> LRANGE sorted-nums 0 -1
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
6) "6"
redis 127.0.0.1:6379>
可以通过将 SORT 命令的执行结果保存,并用 EXPIRE 为结果设置生存时间,以此来产生一个SORT 存。
这样就可以避免对 SORT 操作的频繁调用:只有当结果集过期时,才需要再调用一次 SORT 操作。
小总结
SORT是Redis中最强大最复杂的命令之一,如果使用不好很容易成为性能瓶颈。
SORT命 令的时间复杂度是O(n+mlog(m)),其中n表示要排序的列表(集合或有序集合)中的元素个 数,m表示要返回的元素个数。
所以开发中使用SORT命令时需要注意以下几点。
(1)尽可能减少待排序键中元素的数量(使N尽可能小)。
(2)使用LIMIT参数只获取需要的数据(使M尽可能小)。
(3)如果要排序的数据数量较大,尽可能使用STORE参数将结果缓存。