Redis基础01-redis的数据结构

参考书:《redis设计与实现》

Redis虽然底层是用C语言写的,但是底层的数据结构并不是直接使用C语言的数据结构,而是自己单独封装的数据结构;
Redis的底层数据结构由,简单动态字符串,链表,字典,跳跃表,整数集合等几种数据结构组成;

1.简单动态字符串

1.定义:

  • 简单动态字符串:SDS(simple dynamic string)redis 自己构建的;数据结构如下:
struct sds{ 
     int free ; // 未使用长度 
     int len; //字符长度
     char buff[]; // 字符数组
}

结尾的一个字节不算在len的长度里面;

2.SDS和C字符串的差别

相同点:都是n+1的长度,都是以\0结尾;
不同点:

1.获取字符串长度复杂度不同;
2.杜绝缓存区溢出
3.减少字符修改造成的内存再分配次数;   
  - 3.1空间预分配;3.2惰性空间释放;
4.二进制安全;
5.兼容部分C字符串;

2.链表

1.链表和节点的实现

struct listNode{
    struct listNode *prev;
    struct listNode *next;
    void *value;
}

typeof struct list{
    listNode *head;//第一个
    listNode *tail;//最后一个节点
    unsigned int len;//长度
    void *(*dup)(void *ptr);//复制节点函数
    void (*free)(void *ptr);//节点值释放函数
    int (*match)(void *ptr,void *key)//节点比对函数
 
}list;
  • 特点:
    • 双端(链表带有pre和next两个指针);
       - 无环(表头的pre和表尾的next都是NULL);
    • 带表头指针和表尾指针;
    • 求链表长度计数器(len是链表节点的计数器),
    • 多态(dup,free,match三个属性设置特定类型,可以保存不同类型的值)

3.字典

1.定义及实

字典:又称符号表,关联数组或映射,是一种用于保存键值对的抽象数据结构;
在字典中,一个字和一个值进行关联,这些键和值就称为键值对;
redis的字典使用哈希表作为底层实现,一个哈希表里面可以有多个哈希表节点,而每个哈希表节点就保存了字典中的一个键值对
  • 哈希表
typedef struct dictht{
    dictEntry **table;//哈希表数组
    unsigined long size;//哈希表数组大小
    unsigined long sizemask;//哈希表大小掩码,值总是size-1
    unsigined long used;//哈希表数组已有节点的数量
}
  • 哈希表节点
typeof struct dictEntry{
    void *key;//键
    union{//值
        void *val;
        uint64_tu64;
        int64_ts64;
    } v;
    struct dictEntry *next;//指向另一个哈希表节点的指针,可以将多个哈希值相同的键值对连接在一次
}
  • 字典
typedef struct dist{
    dictype *type;//类型特定函数
    void  *privdata;//私有数据
    dictht ht[2];//哈希表
    in trehashidx;//rehash索引//当rehash不在进行时,值为-1
}dict;
typedef struc dictType{
    unsigned int (*hashFunction)(const void *key);//计算哈希值的函数
    void (keyDup)(void *privdata,const void *key);//复制键的函数
    void (valDup)(void *privdata,const void obj);
    int (keyCompare)(void *privdata,const void *key1,const void key2);
    void (keyDestructor)(void *privdata,void key);
    void (valDestructor)(void *privdata,void * obj);
} dictType ;
#### 2.哈希算法 ```算法来计算键的哈希值。 ```

3.解决键冲突

    当两个键或者两个以上键分配到redis同一索引的时候,就称为键冲突;

  • 使用链地址法来解决键冲突;

4.rehash重新散列

  • 目的:为了让平衡因子维持再一个合理的范围,k-v不会太多,也不会太少

5.渐进式rehash

  • 分步进行rehash,为字典分配两个哈希表,当对一个哈希表操作时,程序在指定的操作上,会把旧表中的数据带到新的哈希表。到某一点完全实现rehash.

4.跳跃表

 跳跃表 是一种有序数据结构,它可以在每个节点中维持多个只指向其他节点的指针,从而达到快速访问节点的目的。

 使用的场景:在redis中,一个是实现有序集合键;一个是集群节点中用作内部数据结构;

1.跳跃表节点

5.整数集合

 当一个集合质保和整数值元素,并且这个集合的元素数量不多时;

1.整数集合的实现

  • 整数集合是Redis用于保存整数值的集合抽象数据结构;
typedef struct intset{
    uint32_t encoding;//决定contents里面保存的数据类型
    uint32_t length;//整数集合包含的元素数量
    int8_t contents[];
}inset;

2.升级

当新元素比整数集合中所有元素的类型都要长时,整数集合需要先升级,再将元素保存到集合里面;
  • 步骤:1.根据新元素,扩展底层类型;2.将所有元素转换成新元素类型,并保证底层顺序不变;3.将新元素添加到底层里面;

- 优点:1.提高灵活性,如果是int_32的就存储相关的元素,如果有int_64的就升级;2.节省内存资源;

3.降级

整数集合不支持降级

6.压缩列表

是一种节约内存而开发的顺序型数据结构;
  • 使用场景:当一个列表项,只有少量数据,且数据比较小,小整数或者短字符的情况下;

1.压缩列表的构成

2.压缩列表节点的构成

  • previous_entry_length:记录前一个结点的长度;
  • encoding:记录content属性所保存的数据和长度;
  • content:保存节点的值;

3.连锁更新

每个previous_entry_length属性都记录前一个界定啊的长度:
如果节点小于254,则需要用1字节长的空间保存这个长度值;如果大于或等于254字节,则用5字节长的空间保存这个长度值
posted @ 2020-04-23 23:19  PerfectLi  阅读(184)  评论(0编辑  收藏  举报