Redis 数据结构/内存模型

一、Redis为什么这么快

　　1. IO多路复用

　　　　A. IO指网络IO，多路指的是多个TCP连接(Socket或Channel)，复用指复用一个或多个线程；

　　　　B. select：一个线程处理多个客户端连接，又减少了系统调用的开销，即多个文件描述符只有一次select的系统调用 +n 次就绪状态的文件描述符的read系统调用

　　　　C. poll：

　　　　D. epoll：

二、数据结构

　　1. 分类　　

　　　　A. 简单动态字符串(sds)：获取字符串长度的时间复杂度为O(1)、杜绝了缓冲区溢出、减少内存重分配次数；

　　　　B. 链表(linkedlist)；

　　　　C. 字典(hashtable)：用于保存键值对的抽象数据结构；

　　　　D. 跳跃表(skiplist)：存储有序集合对象，查找上先从高Level查起，时间复杂度和红黑树相当，实现容易，无锁、并发性好；

　　　　E. 整数数组(intset)：用于保存整数值的集合抽象数据结构，不会出现重复元素，底层实现为数组；

　　　　F. 压缩列表(ziplist)：类似数组，通过一片连续的内存空间来存储数据，但它允许存储的数据大小不同，它的好处是更能节省内存空间。

　　2. 应用

　　　　A. 字符串类型(string)：int整数、embstr编码的简单动态字符串、raw简单动态字符串；

　　　　B. 列表类型(list)：ziplist(数据集比较少时使用，条件为列表中保存的单个数据小于64个字节，列表中数据个数小于512个)、linkedlist(数据量比较大时使用)；

　　　　C. 哈希类型(hash)：ziplist(数据量比较小时使用，条件为列表中保存的键和值的大小都小于64个字节，列表中键值对个数少于512个)、hashtable(数据量比较大时使用，对于hash冲突采用链表法解决)；

　　　　D. 集合类型(set)：intset(条件为存储的数据都是整数，存储的数据元素个数不超过512个)、hashtable(不满足intset时候使用)；

　　　　E. 有序集合类型(zset)：ziplist(数据量比较小时使用，条件为保存的数据小于64个字节，元素个数小于128个)、skiplist(不满足ziplist时候使用))。

三、内存模型

　　1. 当我们执行set hello world命令时，会有以下数据模型

　　　　A. sds：SDS(Simple Dynamic String)是Redis中一种数据结构，叫简单动态字符串，键hello是以SDS存储的，注意：Redis中字符串大多以SDS来存储；

　　　　B. redisObject：值world存储在redisObject中，实际上，redis的5中类型都是存在redisObject中，而redisObject中type字段指明了value对象的类型，ptr字段则指明了对象所在的地址，该对象非常重要，Redis对象的类型、内部编码、内存回收、共享对象等功能，都需要redisObject支持；

　　　　C. dictEntry：Redis给每个key-value键值对分配一个dictEntry，里面有着key和val的指针，next指向下一个dictEntry形成链表，这个指针可以将多个哈希值相同的键值对链接在一起；

　　　　D. 无论是dictEntry，还是redisobject、sds对象，都需要内存分配器(如jemalloc分配)内存进行存储，jemalloc在64位操作系统中，将内存空间划分为小、中、巨大三个范围，每个范围又划分了许多小的内存块单元，当Redis存储数据时，会选择大小最合适的内存块进行存储；

　　　　E. Redis支持的5种对象类型，每种结构都至少有两种编码。

　　2. 优化内存占用

　　　　A. 尽量使用整形替代字符串；

　　　　B. 尽可能使用共享对象；

　　　　C. 关注内存碎片比例；

可参考：IO多路复用

　　　　Redis使用的6种数据结构

　　　　Redis六种底层数据结构