【≅Redis】你知道Redis的字符串是怎么实现的吗?

Redis字符串的实现

Redis虽然是用C语言写的,但却没有直接用C语言的字符串,而是自己实现了一套字符串

Redis构建了一个叫做简单动态字符串(Simple Dynamic String),简称SDS

Redis的字符串也会遵守C语言的字符串的实现规则,即最后一个字符为空字符。然而这个空字符不会被计算在len里头

SDS的最厉害之处在于它的动态变化长度

假设s1 只有5个空闲位子,后面需要追加' world' 6个字符,很明显是不够的。那咋办?Redis会做以下三个操作:

  1. 计算出大小是否足够
  2. 开辟空间至满足所需大小
  3. 开辟与已使用大小len相同长度的空闲free空间(如果len < 1M)开辟1M长度的空闲free空间(如果len >= 1M)

这个实现跟Java的列表List实现很相似。

Redis字符串的性能优势

  • 快速获取字符串长度
  • 避免缓冲区溢出
  • 降低空间分配次数提升内存使用效率

快速获取字符串长度

由于在SDS里存了已使用字符长度len,所以当想获取字符串长度时直接返回len即可,时间复杂度为O(1)。如果使用C语言的字符串的话它的字符串长度获取函数时间复杂度为O(n),n为字符个数,因为它是从头到尾(到空字符'\0')遍历相加。

避免缓冲区溢出

对一个C语言字符串进行追加字符串的时候需要提前开辟需要的空间,如果不开辟空间的话可能会造成缓冲区溢出,而影响程序其他代码。

而对于Redis而言由于每次追加字符串时都会检查空间是否够用,所以不会存在缓冲区溢出问题

每次追加操作前都会做如下操作:

  • 计算出大小是否足够
  • 开辟空间至满足所需大小

降低空间分配次数提升内存使用效率

字符串的追加操作会涉及到内存分配问题,然而内存分配问题会牵扯内存划分算法以及系统调用所以如果频繁发生的话影响性能,所以对于性能至上的Redis来说这是万万不能忍受的。

所以采取了以下两种优化措施:

  • 空间与分配:对于追加操作来说,Redis不仅会开辟空间至够用而且还会预分配未使用的空间(free)来用于下一次操作。至于未使用的空间(free)的大小则由修改后的字符串长度决定
  • 惰性空间回收:Redis不会立即回收减少的部分,而是会分配给下一个需要内存的程序

 

参考:

 

posted @ 2023-03-17 10:44  残城碎梦  阅读(23)  评论(0编辑  收藏  举报