redis-哈希

作者：零壹技术栈
链接：https://zhuanlan.zhihu.com/p/46442196
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

大部分编程语言都提供了哈希（hash）类型，它们的叫法可能是哈希、字典、关联数组。在 Redis 中，哈希类型 是指键值本身又是一个 键值对结构。

哈希形如 value={ {field1，value1}，...{fieldN，valueN} }，Redis 键值对 和 哈希类型 二者的关系如图所示：

哈希类型中的 映射关系 叫作 field-value，这里的 value 是指 field 对应的值，不是键对应的值。

正文

1. 相关命令

1.1. 基本命令

1.1.1. 设置值

hset key field value

下面为 user：1 添加一对 field-value，如果设置成功会返回 1，反之会返回 0。

127.0.0.1:6379> hset user:1 name tom
(integer) 1

此外 Redis 提供了 hsetnx 命令，它们的关系就像 set 和 setnx 命令一样，只不过 作用域 由键变为 field。

1.1.2. 获取值

hget key field

下面操作用于获取 user：1 的 name 域（属性） 对应的值。

127.0.0.1:6379> hget user:1 name
"tom"

如果键或 field 不存在，会返回 nil：

127.0.0.1:6379> hget user:2 name
(nil)
127.0.0.1:6379> hget user:1 age
(nil)

1.1.3. 删除field

hdel key field [field ...]

hdel 会删除 一个或多个 field，返回结果为 成功删除 field 的个数，例如：

127.0.0.1:6379> hdel user:1 name
(integer) 1
127.0.0.1:6379> hdel user:1 age
(integer) 0

1.1.4. 计算field个数

hlen key

例如键 user：1 有 3 个 field：

127.0.0.1:6379> hset user:1 name tom
(integer) 1
127.0.0.1:6379> hset user:1 age 23
(integer) 1
127.0.0.1:6379> hset user:1 city chengdu
(integer) 1
127.0.0.1:6379> hlen user:1
(integer) 3

1.1.5. 批量设置或获取field-value

hmget key field [field ...] hmset key field value [field value ...]

hmset 和 hmget 分别是 批量设置 和获取 field-value，hmset 需要的参数是 key 和多对 field-value，hmget 需要的参数是 key 和多个 field。例如：

127.0.0.1:6379> hmset user:1 name tom age 12 city chengdu
OK
127.0.0.1:6379> hmget user:1 name city
1) "tom"
2) "chengdu"

1.1.6. 判断field是否存在

hexists key field

例如 user：1 包含 name 域，所以返回结果为 1，不包含时返回 0：

127.0.0.1:6379> hexists user:1 name
(integer) 1

1.1.7. 获取所有field

hkeys key

hkeys 命令应该叫 hfields 更为恰当，它返回指定 哈希键 所有的 field，例如：

127.0.0.1:6379> hkeys user:1
1) "name"
2) "age"
3) "city"

1.1.8. 获取所有value

hvals key

下面操作获取 user：1 的全部 value：

127.0.0.1:6379> hvals user:1
1) "tom"
2) "12"
3) "chengdu"

1.1.9. 获取所有的field-value

hgetall key

下面操作获取 user:1 所有的 field-value：

127.0.0.1:6379> hgetall user:1
1) "name"
2) "tom"
3) "age"
4) "12"
5) "city"
6) "chengdu"

在使用 hgetall 时，如果 哈希元素 个数比较多，会存在阻塞 Redis 的可能。如果开发人员只需要获取部分 field，可以使用 hmget，如果一定要获取全部 field-value，可以使用 hscan 命令，该命令会 渐进式遍历 哈希类型。

1.2. 不常用命令

1.2.1. 键值自增

hincrby key field hincrbyfloat key field

hincrby 和 hincrbyfloat，就像 incrby 和 incrbyfloat 命令一样，但是它们的 作用域 是 field。

1.2.2. 计算value的字符串长度

hstrlen key field

例如 hget user:1 name 的 value 是 tom，那么 hstrlen 的返回结果是 3。

127.0.0.1:6379> hstrlen user:1 name
(integer) 3

下面是 哈希类型命令 的 时间复杂度，开发人员可以参考此表选择适合的命令。

2. 内部编码

哈希类型 的 内部编码 有两种：

2.1. ziplist（压缩列表）

当 哈希类型 元素个数小于 hash-max-ziplist-entries 配置（默认 512 个）、同时 所有值 都小于 hash-max-ziplist-value 配置（默认 64 字节）时，Redis 会使用 ziplist 作为哈希的 内部实现，ziplist 使用更加 紧凑的结构 实现多个元素的 连续存储，所以在 节省内存 方面比 hashtable 更加优秀。

2.2. hashtable（哈希表）

当 哈希类型 无法满足 ziplist 的条件时，Redis 会使用 hashtable 作为哈希的 内部实现，因为此时 ziplist 的 读写效率 会下降，而 hashtable 的读写 时间复杂度 为 O（1）。

下面的示例演示了 哈希类型 的 内部编码，以及相应的变化。

当 field 个数 比较少，且没有大的 value 时，内部编码 为 ziplist：

127.0.0.1:6379> hmset hashkey f1 v1 f2 v2
OK
127.0.0.1:6379> object encoding hashkey
"ziplist"

当有 value 大于 64 字节时，内部编码 会由 ziplist 变为 hashtable：

127.0.0.1:6379> hset hashkey f3 "one string is bigger than 64 byte...忽略..."
OK
127.0.0.1:6379> object encoding hashkey
"hashtable"

当 field 个数超过 512，内部编码 也会由 ziplist 变为 hashtable：

127.0.0.1:6379> hmset hashkey f1 v1 f2 v2 f3 v3 ... f513 v513
OK
127.0.0.1:6379> object encoding hashkey
"hashtable"

3. 适用场景

如图所示，为 关系型数据表 的两条 用户信息，用户的属性作为表的列，每条用户信息作为行。

使用 Redis 哈希结构 存储 用户信息 的示意图如下：

相比于使用 字符串序列化 缓存 用户信息，哈希类型 变得更加直观，并且在 更新操作 上会 更加便捷。可以将每个用户的 id 定义为 键后缀，多对 field-value 对应每个用户的属性，类似如下伪代码：

public UserInfo getUserInfo(long id) {
    // 用户id作为key后缀
    String userRedisKey = "user:info:" + id;
    // 使用hgetall获取所有用户信息映射关系
    Object userInfoMap = redis.hgetAll(userRedisKey);
    UserInfo userInfo;
    if (userInfoMap != null) {
        // 将映射关系转换为UserInfo
        userInfo = transferMapToUserInfo(userInfoMap);
    } else {
        // 从MySQL中获取用户信息
        userInfo = mysql.get(id);
        // 将userInfo变为映射关系使用hmset保存到Redis中
        redis.hmset(userRedisKey, transferUserInfoToMap(userInfo));
        // 添加过期时间
        redis.expire(userRedisKey, 3600);
    }
    return userInfo;
}

3.1. 哈希结构与关系型表

需要注意的是 哈希类型 和 关系型数据库 有两点不同之处：

哈希类型 是 稀疏的，而 关系型数据库 是 完全结构化的，例如 哈希类型 每个键可以有不同的 field，而 关系型数据库 一旦添加新的列，所有行 都要为其 设置值（即使为 NULL），如图所示：

关系型数据库 可以做复杂的 关系查询，而使用 Redis 去模拟关系型复杂查询 开发困难，维护成本高。

3.2. 几种缓存方式

到目前为止，我们已经能够用 三种方法 缓存 用户信息，下面给出三种方案的 实现方法 和 优缺点分析。

3.2.1. 原生字符串类型

给用户信息的每一个属性分配 一个键。

set user:1:name tom
set user:1:age 23
set user:1:city beijing

优点：简单直观，每个属性都支持 更新操作。
缺点：占用 过多的键，内存占用量 较大，同时用户信息 内聚性比较差，所以此种方案一般不会在生产环境使用。

3.2.2. 序列化字符串类型

将用户信息 序列化 后用 一个键 保存。

set user:1 serialize(userInfo)

优点：简化编程，如果合理的使用 序列化 可以 提高内存利用率。
缺点：序列化 和 反序列化 有一定的开销，同时每次 更新属性 都需要把 全部数据 取出进行 反序列化，更新后 再 序列化 到 Redis 中。

3.2.3. 哈希类型

每个用户属性使用一对 field-value，但是只用 一个键 保存。

hmset user:1 name tom age 23 city beijing

优点：简单直观，如果使用合理可以 减少内存空间 的使用。
缺点：要控制和减少哈希在 ziplist 和 hashtable 两种 内部编码 的转换，hashtable 会消耗 更多内存。

小结

本文介绍了 Redis 中的 哈希结构 的一些 基本命令、内部编码 和 适用场景。最后对比了 关系型表 和 哈希结构 的区别，以及几种 存储方式 的优缺点。

参考

《Redis 开发与运维》

posted @ 2020-02-04 10:48 FFLYY 阅读(126) 评论(0) 编辑收藏举报

刷新页面返回顶部

FFLYY