围着灰机转圈圈

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

我知道点redis-数据结构与对象(对象)-对象存储

在前面的数个章节里,我们陆续介绍了Redis用到的所有数据结构,比如SDS、双端链表、字典等。Redis并没有直接使用这些数据结构来实现键值对数据库,而是基于这些数据结构创建了一个对象系统。

8.1 对象的类型和编码

redis中的每个对象都由一个redisObject结构表示,该结构中和保存数据有关的三个属性分别是type、encoding、ptr:

typedef struct redisObject {
	
	// 类型
	unsigned type:4;
	
	// 编码
	unsigned encoding:4;
	
	// 指向底层实现数据结构的指针
	void *ptr;
	
	//...
	
} robj;

8.1.1 类型

对象的type属性记录了对象的类型,这个属性的值可以是以下列表中的一种:

  1. REDIS_STRING --> 字符串对象
  2. REDIS_LIST --> 列表对象
  3. REDIS_HASH --> 哈希对象
  4. REDIS_SET --> 集合对象
  5. REDIS_ZSET --> 有序集合对象

对于redis中保存的键值对来说,key总是一个字符串对象,value可以是stringlisthashsetzset的一种,因此:当我们称呼一个数据库键为『字符串键』时,我们指的是其对应的value是字符串对象。

TYPE命令的实现方式也与此类似,当我们对一个数据库键执行TYPE命令时,命令返回的结果为其对应的value类型。

redis> SADD fruits apple banana cherry
(integer) 3

redis> TYPE fruits
set

8.1.2 编码和底层实现

对象的prt指针指向对象的底层实现数据结构,而这些数据结构由对象的encoding属性决定。encoding属性记录了对象所使用的编码,也就是说对象使用什么数据结构作为对象的底层实现。

使用OBJECT ENCODING命令可以查看一个数据库键的值对象的编码:

redis> SADD numbers 1 3 5
(integer) 3

redis > OBJECT ENCODING numbers
"intset"

通过encoding属性来设定对象所使用的编码,而不是为特定类型的对象关联一种固定的编码,几大地提升了Redis的灵活性和效率,因为Redis可以根据不同的使用场景为一个对象设置不同的编码,从而优化对象在某一场景下的效率。

8.2 字符串

字符串对象的编码可以是intraw或者embstr

int

如果一个字符串对象保存的是整数值,并且这个整数值可以用long类型来表示。那么字符串对象会将整数值保存在ptr属性中,并且encoding = int

raw

如果一个字符串对象保存的是一个字符串值,并且这个字符串长度>32B,那么字符串对象将使用一个SDS来保存,并且encoding = raw

embstr

如果一个字符串对象保存的是一个字符串值,并且这个字符串长度<=32B,那么字符串对象将使用一个SDS来保存,并且encoding = embstr

embstr编码是专门用于保存短字符串的一种优化编码方式,这种编码和raw编码一样,都是用redisObjectSDS结构,但是raw编码会调用2次内存分配分别创建redisObjectSDS结构,而embstr编码会调用一次内存分配函数来分配一块连续的空间,空间中依次包含redisObjetsds结构。

8.2.1 编码转换

int编码的字符串对象和embstr编码的字符串对象在条件满足的情况下,会被转换为raw编码的字符串对象。

另外,因为redis没有为embstr编码的字符串对象编写任何相应的修改程序,所以embstr编码的字符串对象实际上是只读的。当我们对embstr编码的字符串对象执行任何修改命令时,程序回先将对象的编码从embstr转换为raw。因为这个原因,embstr编码的字符串对象,在执行修改命令之后,总会变成一个raw编码的字符串对象。

8.3 列表对象

列表对象的编码可以是ziplist或者linkedlist

ziplist

zip编码的列表对象使用压缩列表作为底层实现,每个压缩列表的节点(entry)保存了一个列表元素。

linkedlist

linkedlist编码的列表对象使用双端链表作为底层实现,每隔双端链表节点(node)都保存了一个字符串对象而每个字符串对象都保存了一个列表元素。

8.3.1 编码转换

当列表对象可以同时满足一下两个条件时,列表对象使用ziplist编码(不能满足这两个条件的列表对象使用linkedlist对象编码。):

  • 列表对象保存的所有字符串元素的长度都小于64字节;
  • 列表对象保存的元素数量小于512个;

以上两个条件的上限是可以修改的,通过在配置文件中对list-max-ziplist-valuelist-max-ziplist-entries进行配置即可。

8.4 哈希对象

哈希对象的编码可以是ziplist或者hashtable

ziplist

ziplist编码的哈希对象使用压缩列表作为底层实现,每当有新的键值对要加入到哈希对象时,程序会先将保存了键的压缩列表节点推入到压缩列表表尾,然后再将保存了值的压缩列表节点推入到压缩列表表尾,因此:

  • 保存了同一个键值对的两个节点总是紧挨在一起,保存键的节点在前,保存值的节点在后;
  • 先添加到哈希对象中的键值对会被放在压缩列表的表头方向,而后来添加到哈希对象的键值对会被放在压缩列表的表尾方向。

hashtable

hashtable编码的哈希对象使用字典作为底层实现,哈希对象中的每个键值对都使用一个字典键值对来保存:

  • 字典的每隔键都是一个字符串对象,对象中保存了键值对的键;
  • 字典的每个值都是一个字符串对象,对象中保存了键值对的值。

8.4.1 编码转换

当哈希对象同事满足一下两个条件时,哈希对象使用ziplist编码(不能满足这两个条件的哈希对象使用hashtable编码):

  • 哈希对象保存的所有键值对的键和值的字符串长度都小于64字节;
  • 哈希对象保存的键值对数量小雨512个;

以上两个条件的上限是可以修改的,通过在配置文件中对hash-max-ziplist-valuehash-max-ziplist-entries进行配置即可。

8.5 集合对象

集合对象的编码可以是intset或者hashtable.

intset

intset编码的集合对象使用整数集合作为底层实现,集合对象包含的所有对象都被保存在整数集合里面。

hashtable

hashtable编码的集合对象使用字典作为底层实现,字典的每个键都是一个字符串对象,每个字符串对象包含了一个集合元素,而字典的值全部被设置为NULL。

8.5.1 编码转换

当集合对象同时满足一下两个条件时,对象使用intset编码(不能满足这两个条件的集合对象需要使用hashtable编码):

  • 集合对象保存的所有元素都是整数值;
  • 集合对象保存的元素数量不超过512个。

第二个条件的上限是可以修改的,通过修改配置项set-max-intset-entries.

8.6 有序集合对象

有序集合的编码可以使用ziplist或者skiplist.

ziplist

ziplist编码的有序集合对象使用压缩列表作为底层实现,每个集合元素使用两个紧挨在一起的压缩列表节点来保存,第一个节点保存元素的成员(member),而第二个元素则保存元素的分值(scope)。压缩列表内的集合元素按分值从小到大进行排列。

skiplist

skiplist编码的有序集合对象使用zset结果作为底层实现,一个zset结构同时包含一个字典和一个跳跃表

typedef struct set {

	zskiplist *zsl;
	
	dict *dict;

} zset;

zset结构中的zsl跳跃表按照分支从小到大保存了所有的集合元素,每个跳跃表节点都保存了一个集合元素:跳跃表节点的object属性保存了元素的成员,而跳跃表节点的score属性则保存了元素的分值。通过这个跳跃表,程序可以对有序集合进行范围型操作,比如ZRANKZRANGE等。

除此之外,zset结构中的dict字典,为有序集合创建了一个从成员到分值的映射,字典的每个键值对都保存了一个集合元素:字典的键保存了元素的成员,而字典的值保存了元素的分值。通过这个字典,程序可以用O(1)的复杂度查找给定成员的分值,比如ZSCORE.

8.6.1 编码转换

当有序集合对象可以同时满足一下两个条件时,对象使用ziplist编码(否则使用skiplist编码):

  • 有序集合保存的元素数量小于128个;
  • 有序集合保存的所有元素成员的长度都小于64字节。

这两个条件的上限是可以修改的,配置项:zset-max-ziplist-entrieszset-max-ziplist-value

posted on 2015-08-24 10:40  围着灰机转圈圈  阅读(1821)  评论(0编辑  收藏  举报