redis底层数据结构之压缩列表(ziplist)

压缩列表(ziplist)

压缩列表(ziplist)是redis 为了节约内存而开发的，由连续内存块组成的顺序型数据结构，适用于长度较小的值

存取的效率高，内存占用小，但由于内存是连续的，在修改的时候要重新分配内存

同时满足以下两个条件时，使用ziplist:

　　1) 元素长度都小于64Byte

　　2) 元素数量小于512个

1 压缩列表结构

struct ziplist<T> {
    int32 zlbytes;
    int32 zltail_offset;
    int16 zllength;
    T[] entries;
    int8 zlend;
}

其中:

zlbytes：整个压缩列表占用的字节数，占4Byte

zltail_offset：最后一个元素距离压缩列表起始位置的偏移量，用于快速定位到最后一个元素，占4Byte

zllength：压缩列表的元素个数，占2Byte

entries：压缩列表的元素，可以包含多个节点，每个节点可以保存一个字节数组或者一个整数值

zlend：压缩列表结束标志，值等于 0xFF，占1Byte

2 压缩列表节点结构

typedef struct zlentry { 
    unsigned int prevrawlensize, prevrawlen;
    unsigned int lensize, len;
    unsigned int headersize;
    unsigned char encoding;
    unsigned char *p;
} zlentry;

其中:

prevrawlen：前一个节点的长度

prevrawlensize：存储前一个节点长度(prevrawlen属性)所需的字节数

len：当前节点长度

lensize：储当前节点长度(len属性)所需的字节数

headersize：当前节点的header大小

encoding：节点的编码方式

p：指向节点的指针

虽然redis定义了节点zlentry结构体，但是redis却没有用zlentry结构来存储节点，因为，这个结构存小整数或短字符串太浪费空间

zlentry结构体在32位系统占用28Byte，在64位系统占用32Byte，这不符合压缩列表提高内存利用率的设计目的，因此，在redis中，并没有使用zlentry结构，而是定义了宏来表示压缩列表的节点

压缩列表的节点真正的结构如下图所示：

其中:

previous_entry_length：前一个节点的长度，占1Byte或5Byte

　　如果前一个节点的长度小于254Byte，则需要1Byte来保存前一个节点的长度

　　如果前一个节点的长度大于等于254Byte，则需要5Byte来保存前一个节点的长度，第一个Byte固定为0xfe(254)，后四个Byte表示前一个节点的长度

encoding：编码类型(字节数组，整数)，保存了content的数据类型和长度，占用1Byte、2Byte或者5Byte

content：节点数据，节点数据类型和长度由encoding决定

当前entry的总字节数 = 下一个entry的previous_entry_length的值 = previous_entry_length字节数 + encoding字节数 + content字节数

3 encoding编码类型

1) 字节数组类型

encoding	encoding长度	content字节数组长度	说明
00xxxxxx	1Byte	小于等于63(2^6-1)Byte	encoding的第一个字节最高两位是00，剩余的6位用来表示字节数组的长度
01xxxxxx\|xxxxxxxx	2Byte	小于等于16383(2^14-1)Byte	encoding的第一个字节最高两位是01，剩余的14位用来表示字节数组的长度
10xxxxxx\|xxxxxxxx\|xxxxxxxx\|xxxxxxxx\|xxxxxxxx	5Byte	小于等于4294967295(2^32-1)Byte	encoding的第一个字节最高两位是10，剩余的4Byte共32位(第一个字节剩余的6位舍弃)用来表示字节数组的长度

保存"redis"和"ab"两个字符串的示意图

其中:

字符串"redis"占7Byte = (previous_entry_length = 1Byte) + (encoding = 1Byte) + (content = 5Byte)

字符串"ab"占4Byte = (previous_entry_length = 1Byte) + (encoding = 1Byte) + (content = 2Byte)

2) 整数类型

encoding	encoding长度	content整数类型	说明
11000000	1Byte	2Byte的int16_t类型, -2^15~2^15-1	encoding的值恒为0xC0
11010000	1Byte	4Byte的int32_t类型,-2^31~2^31-1	encoding的值恒为0xD0
11100000	1Byte	8Byte的int64_t类型,-2^63~2^63-1	encoding的值恒为0xE0
11110000	1Byte	3Byte的整数,-2^23~2^23-1	encoding的值恒为0xF0
11111110	1Byte	1Byte的整数,-2^6~2^6-1	encoding的值恒为0xFE
1111xxxx	1Byte	无content字段	xxxx只能取0001~1101,表示0~12的整数,4位之和减去1表示真正的整数,此时不需要content
11111111	1Byte	无content字段	ziplist结束标志

保存2,10,1024三个整数的示意图

2,10的content不占用空间,1024的content占2字节

其中:

整数2占2Byte = (previous_entry_length = 1Byte) + (encoding = 1Byte) + (content = 0Byte)

整数10占2Byte = (previous_entry_length = 1Byte) + (encoding = 1Byte) + (content = 0Byte)

整数1024占4Byte = (previous_entry_length = 1Byte) + (encoding = 1Byte) + (content = 2Byte)

4 压缩列表示意图

存有字符串"redis"和整数2共2个节点的ziplist示意图如下:

type = REDIS_LIST 或 REDIS_ZSET

5 连锁更新现象

previous_entry_length 记录了上一个entry 的长度，极端情况下: 如果每个entry的长度都是250~253Byte，那么如果在头部插一个节点的长度大于254Byte的entry节点，那么后一个节点的previous_entry_length值就从1Byte变为 5Byte，那么后一个entry节点的长度就大于了254Byte，再后面一个entry节点的previous_entry_length值也需要更新，引发连锁反应，后面所有的entry节点变大，previous_entry_length也变大，此时会频繁的进行数据迁移，申请内存，销毁动作，使性能受到很大影响

连锁更新在最坏情况下需要对压缩列表执行 N 次空间重分配操作，而每次空间重分配的最坏复杂度为 O(N)，所以连锁更新的最坏复杂度为 O(N^2)

尽管连锁更新的复杂度较高，但它触发的概率很低

posted @ 2022-12-17 18:03 junffzhou 阅读(544) 评论(0) 收藏举报

刷新页面返回顶部

junffzhou