Redis之字典

字典

字典,类似于map,是一种用于保存键值对(key-value)的抽象数据结构

在redis的字典中,每个键都是独一无二的。

字典在Redis中的应用非常广泛,比如Redis的底层数据结构就是使用字典来实现的,对数据库的增删改查也是构建在对字典的操作之上的。

举个🌰,当我们执行命令:

set msg "hello world"

在数据库中创建了一个键为"msg",值为"hello world"的键值对

除了用来表示数据库之外,字典还是哈希键的底层实现之一,当一个哈希键包含的键值对比较多,又或者键值对中的元素都是比较长的字符串时,Redis就会使用字典作为哈希键的底层实现。

字典的实现

哈希表

typedef struct dictht {

    // 哈希表数组
    dictEntry **table;

    // 哈希表大小
    unsigned long size;

    // 哈希表大小掩码,用于计算索引值
    // 总是等于 size - 1
    unsigned long sizemask;

    // 该哈希表已有节点的数量
    unsigned long used;

} dictht;

可以看到,哈希表中有一个table,table中存放着dictEntry,每个dictEnty存放着一个键值对

哈希表节点

typedef struct dictEntry {

    // 键
    void *key;

    // 值
    union {
        void *val;
        uint64_t u64;
        int64_t s64;
    } v;

    // 指向下个哈希表节点,形成链表
    struct dictEntry *next;

} dictEntry;

需要注意的是,dictEntry中有一个属性是next,指向下一个哈希表节点,可以将多个哈希值相同的键值对链接在一起,形成链表。

由于dictEntry中并没有存储尾节点信息,为了快速插入,redis是将新的节点插在已有节点的头部(跟Java中Hashmap不同!)

字典

typedef struct dict {

    // 类型特定函数
    dictType *type;

    // 私有数据
    void *privdata;

    // 哈希表
    dictht ht[2];

    // rehash 索引
    // 当 rehash 不在进行时,值为 -1
    int rehashidx; /* rehashing not in progress if rehashidx == -1 */

} dict;

ht是一个包含两个哈希表的数组,一般情况下字典只使用ht[0],只有在对ht[0]的哈希表进行rehash时才会使用ht[1]

rehash

随着操作的不断执行,哈希表保存的键值对会逐渐增多或者减少,为了让哈希表的负载因子( 哈希表已保存的节点数目/哈希表的size)维持在一个合理的范围之内,会对哈希表的大小进行相应的扩展和收缩,此时需要进行rehash

步骤如下:

1.为ht[1]哈希表分配空间

2.将保存在ht[0]中的所有键值对rehash到ht[1]上,rehash指重新计算键的哈希,然后放在指定索引位置

3.当ht[0]所有的键值对都迁移到ht[1]之后,释放ht[0],将ht[1]设置为ht[0],并重新创建一个空白哈希表h[1]

需要注意的是,rehash的过程不是一次性完成,而是采用渐进的方式。想象如果字典中保存有大量的键值对,如果需要一次性将这些键值对全部rehash到ht[1]中,会导致服务器在一段时间内停止服务。因此redis采用渐进式的rehash过程。首先为ht[1]分配空间,把rehashidx置为0表示rehash开始,在rehash期间每次对字典执行添加,删除,查找或更新的操作时,会将rehashidx索引处的键值对rehash,同时rehashidx++。所有键值对都完成rehash后,把rehashidx置为-1。在rehash的过程中,对字典执行的删除,查找,更新操作会同时在两个哈希表上进行,但对字典进行的添加操作只会在ht[1]上进行

posted @ 2021-09-29 21:49  刚刚好。  阅读(363)  评论(1编辑  收藏  举报