redis自学（4）ZipList

ZipList是一种特殊的“双端链表”，由一系列特殊编码的连续内存块组成。可以在任意一端进行压入/弹出操作，并且该操作的时间复杂度为O(1)。

ZipListEntry

ZipList中的Entry并不像普通链表那样记录前后节点的指针，因为记录两个指针要占用16个字节，浪费内存。而是采用了下面的结构：

Previous_entry_length:前一节点的长度，占1个或5个字节。

如果前一节点的长度小于254字节，则采用1个字节来保存这个长度值

如果前一节点的长度大于254字节，则采用5个字节来保存这个长度值，第一个字节为0Xfe,后四个字节才是真实长度数据

encoding:编码属性，记录content的数据类型（字符串还是整数）以及长度，占用1个、2个或5个字节

contents:负责保存节点的数据，可以是字符串或整数

ZipList中寻址方式：

正序寻址：当前元素加上自己的Previous_entry_length+encoding+contents的字节长度，就是下一个元素的地址。

倒序寻址，当前元素减去Previous_entry_length离的前一节点长度，就是上一个元素。

ZipList中所有存储长度的数值均采用小端字节序，即低位字节在前，高位字节在后。例如：数值0x1234,采用小端字节序后实际存储值为：0x3412。

Encoding编码

ZipListEntry中的encoding编码分为字符串和整数两种：

字符串：如果encoding是以“00”、“01”或者“10”开头，则证明content是字符串，不同的开头代表不同的字节长度

整数：如果encoding是以“11”开始，则证明content是整数，且encoding固定只占用1个字节。

不同的编码对应不同的整数类型，但是特别小的数据，则是使用1111xxxx来存储。表达范围从0001~1101，1~13，减一之后是0~12，使用这个的好处是省去了content，从而省去了一个字节。

ZipLise的目的是尽可能的节省内存，但是使用限制是只能前序或者后序遍历，所以数据特别多的时候，查询效率较低，所以使用的时候要对节点的个数进行限制。

ZipList的连锁更新问题

假设有N个连续的长度为250~253字节之间的entry，因此entry的Previous_entry_length属性用一个字节表示就行，但是如果往队首放一个大于253字节的entry，那么原先的元素就会变成第二个，而它的Previous_entry_length占中的字节也要改变，因为前一个大于253，所以它的Previous_entry_length占中字节是5，以此类推，下一个元素还要改，下下一个元素也是要改。

ZipList这种特殊情况下产生的连续多次空间扩展操作称之为连锁更新（Cascade Update）。新增、删除都可能导致连锁更新的发生。这种修改，每次都会往后迁移数据，而如果内存不足，就要申请新的内存，销毁，还有数据迁移的动作，但是下一个还是会发生，最影响性能。（因为要求有连续的长度为250~253字节之间的entry，所以概率很低，还有就是ZipList用的很多，修改影响较大，所以作者并未解决此问题）

posted @ 2024-02-23 16:09 蓝海的bug本阅读(106) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· redis自学（5）QuickList

· redis自学（9）List

· Redis基本数据结构ZipList

· redis数据结构

· Redis源码之ZipList压缩列表

公告

昵称：蓝海的bug本
园龄： 2年10个月
粉丝： 1
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

redis自学（4）ZipList

公告

搜索

常用链接

随笔档案

阅读排行榜

推荐排行榜