redis系列之------简单的动态字符串(SDS)

前言

Redis 没有直接使用 C 语言传统的字符串表示(以空字符结尾的字符数组,以下简称 C 字符串), 而是自己构建了一种名为简单动态字符串(simple dynamic string,SDS)的抽象类型, 并将 SDS 用作 Redis 的默认字符串表示。

个人感觉SDS类似于Java的ArrayList,大家可以拿两者对比一些,谁的效率更加高一点。

 

SDS定义

 1 struct sdshdr {
 2 
 3     // 记录 buf 数组中已使用字节的数量
 4     // 等于 SDS 所保存字符串的长度
 5     int len;
 6 
 7     // 记录 buf 数组中未使用字节的数量
 8     int free;
 9 
10     // 字节数组,用于保存字符串
11     char buf[];
12 
13 };

这里注意一下。C语言的char是占一个字节的。不像Java的char占两个字节。也就是只有八位,-127 - 128。

 

SDS相比于C字符串的优势

1. 常数复杂度获取字符串长度

  • 这个比较好理解,因为SDS里面有一个字段为len,可以直接获取长度

2. 减少修改字符串时带来的内存重分配次数

  • 因为传统的c字符串,不会自动扩容。而且其内存大小就等于字符串长度+1,因此,每修改一次字符串,都要重新分配一次内存,非常的耗费时间
  • SDS会自动扩容,并且会进行空间预分配。比如现在有一个Hello的字符串。内存的大小可能是Hello的两倍,也就是 5 * 2  = 10。当再次扩容字符串的时候,不一定需要再次分配内存了。并且可以自动扩容,假设10不够了,加了一个字符串后大小为13,那么内存就会分配为 13 * 2 = 26大小的内存。

3. 二进制安全,以及可以保存空字符 

  • C 字符串中的字符必须符合某种编码(比如 ASCII), 并且除了字符串的末尾之外, 字符串里面不能包含空字符, 否则最先被程序读入的空字符将被误认为是字符串结尾 —— 这些限制使得 C 字符串只能保存文本数据, 而不能保存像图片、音频、视频、压缩文件这样的二进制数据。
  • 因此,所有 SDS API 都会以处理二进制的方式来处理 SDS 存放在 buf 数组里的数据
  • 也就是保存在buf数组里面的所有东西,不论英文中文,还是图片音频,都是二进制数据流。

 

posted @ 2019-10-13 15:45  程序员博博  阅读(541)  评论(0编辑  收藏  举报