redis 系列5 数据结构之字典(上)
一. 概述
字典又称符号表(symbol table),关联数组(associative array), 映射(map),是一种用于保存键值对(key-value pair)的抽象数据结构。在字典中,一个key和一个value进行关联称为键值对。在字典中每个键都是唯一的,程序可以在字典中根据键查找关联的值,或通过键更新删除值等操作。在C语言中并没有内置这种数据结构,因此Redis构建了自己的字典实现。在Redis中应用广泛, 对数据库的增,删,查,改 都是构建在对字典的操作之上的。
-- 例1 127.0.0.1:6379> set msg "hello world" OK 127.0.0.1:6379> get msg "hello world"
在例1中数据库创建一个键为"msg",值为"hello world"的键值对,这个键值对就是保存在数据库的字典里面。字典还是哈希键的底层实现之一,当哈希键包含的键值对比较多,或者键值对中的元素都是比较长的字符串时,Redis就会使用字典作为哈希键的底层实现。
-- 例2: website是一个包含3个键值对的哈希键(也叫哈希表),哈希键(key)为 website,哈希键的节点键是:数据库名字,哈希键的节点值是:网址 127.0.0.1:6379> hmset website redis "Redis.io" mariadb "mariadb.org" mongodb "mongodb.org" OK 127.0.0.1:6379> hlen website (integer) 3 127.0.0.1:6379> hgetall website 1) "redis" 2) "Redis.io" 3) "mariadb" 4) "mariadb.org" 5) "mongodb" 6) "mongodb.org"
在例2中,website哈希键的底层实现就是一个字典。字典中包含了3个键值对。字典除了用来实现数据库和哈希键之处,Redis在后续学习中会看到各种不同应用。
二. 字典的实现
一个哈希(键)表里面可以有多个哈希节点(key-vlaue), 每个哈希节点保存了字典的一个键值对。下面三个小节将分别介绍Redis的哈希表,哈希表节点,以及字典的实现。
2.1 哈希表定义
typedef struct dictht { //哈希表数组,C语言中,*号是为了表明该变量为指针,有几个* 号就相当于是几级指针,这里是二级指针,理解为指向指针的指针 dictEntry **table; //哈希表大小 unsigned long size; //哈希表大小掩码,用于计算索引值 unsigned long sizemask; //该哈希已有节点的数量 unsigned long used; }dictht;
上面table属性是一个数组,数组中的每个元素都是一个指向dict.h/dictEntry结构的指针,每个dictEntry结构保存着一个键值对,size属性记录了哈希表的大小,也是table数组的大小,而used属性则记录哈希表目前已有节点(键值对)的数量。sizemask属性的值总是等于 size-1(从0开始),这个属性和哈希值一起决定一个键应该被放到table数组的哪个索引上面。
例如:上面例2中,哈希表叫website, 对应一个dictht 结构,键值对table数组值是[3], 哈希表size值是3,索引值sizemask值是2,已有节点数量used值是3。
2.2 哈希表节点定义 (键值对)
//哈希表节点定义dictEntry结构表示,每个dictEntry结构都保存着一个键值对。 typedef struct dictEntry { //键 void *key; //值 union{ void *val; uint64_tu64; int64_ts64; }v; // 指向下个哈希表节点,形成链表 struct dictEntry *next; }dictEntry;
上面dictEntry 结构中,key属性保存着键值中的键,而v属性则保存着键值对中的值,其中键值(v属性)可以是一个指针,或uint64_t整数,或int64_t整数。 next属性是指向另一个哈希表节点的指针,这个指针可以将多个哈希值相同的键值对连接在一起,解决键冲突问题。
下图通过next指针,将两个索引值相同(索引是2)的键k1和k0连接在一起。
2.3 字典定义
// Redis中的字典由dict.h/dict结构表示 typedef struct dict { //类型特定函数 void *type; //私有数据 void *privdata; //哈希表 dictht ht[2]; // rehash 索引 int trehashidx; }dict;
type属性和privdata属性是针对不同类型的键值对,为创建多态字典而设置的,type属性是一个指向dictType结构的指针,每个dictType用于操作特定类型键值对的函数,Redis会为用途不同的字典设置不同的类型特定函数。 而privdata属性则保存了需要传给给那些类型特定函数的可选参数。
typedef struct dictType { //计算哈希值的函数 unsigned int (*hashFunction) (const void *key); //复制键的函数 void *(*keyDup) (void *privdata,const void *key); //复制值的函数 void *(*keyDup) (void *privdata,const void *obj); //复制值的函数 void *(*keyCompare) (void *privdata,const void *key1, const void *key2); //销毁键的函数 void (*keyDestructor) (void *privdata, void *key); //销毁值的函数 void (*keyDestructor) (void *privdata, void *obj); }dictType;
ht属性是一个包含两个项的数组,数组中的每个项都是一个dictht哈希表, 一般情况下,字典只使用ht[0] 哈希表, ht[1]哈希表只会对ht[0] 哈希表进行rehash时使用。另一个和rehash有关的属性是rehashidx,它记录了rehash目前的进度,如果目前没有进行rehash,值为-1。下面图是一个没有进行rehash的字典。
rehash是指渐进式的哈希,一张表是旧表,一张表是新表,当hashtable的大小需要动态改变的时候,旧表中的元素就往新开辟的新表中迁移,当下一次变动大小,当前的新表又变成了旧表,以此达到资源的复用和效率的提升。