Redis高级数据类型

## 1.Redis相关配置信息

服务器端设定

设置服务器以守护进程的方式运行
```
daemonize yes|no
```
绑定主机地址 (只能此ip访问)
```
bind 127.0.0.1
```
设置服务器端口号
```
port 6379
```
设置数据库数量
```
databases 16
```

日志配置

设置服务器以指定日志记录级别
```
loglevel debug|verbose|notice|warning
```
日志记录文件名
```
logfile 端口号.log
```

注意：日志级别开发期设置为verbose即可，生产环境中配置为notice，简化日志输出量，降低写日志IO的频度

客户端限制配置 :

设置同一时间最大客户端连接数，默认无限制。当客户端连接到达上限，Redis会关闭新的连接
```
maxclients 0
```
客户端闲置等待最大时长，达到最大值后关闭连接。如需关闭该功能，设置为 0
```
timeout 300(s)
```

多服务器快捷配置 :

导入并加载指定配置文件信息，用于快速创建redis公共配置较多的redis实例配置文件，便于维护
```
include /path/server-端口号.conf
```

2. Bitmaps 类型

现有一个业务场景, 有八个人,编号分别为 1-8,,此时需要在程序中存储他们的性别,分别使用0(女),1(男),表示,

如果按照正常逻辑,我们使用最节省空间的方式,使用一个byte 存储一个人的性别,那么执行8byte 的空间即可表达清楚.

那么有没有更加节省空间的方式呢, 有,我们知道一个byte ,表示8位, 例如11111111, 使用二进制的方式,我们可以发现, 在此场景中, 一个byte 就可以表达完整此八人的性别表示, 例如11110000,表示前四个人是男性,后四人是女性

如果使用Redis,则可以使用String 类型操作,把一组数据作为一个字符串操作,但是操作起来非常麻烦, 修改字符串的指定位置, 为了方便操作, Redis 为我们提供了专门的数据类型 Bitmaps

Bitmaps类型的基础操作

获取指定key对应偏移量上的bit值

getbit key offset //取数据中第 offset位的 数据

设置指定key对应偏移量上的bit值，value只能是1或0

setbit key offset value // 设置 第 offset 位的数据为 0或1

注意: 若直接设置 offset 值为很大的值, 例如 setbit k 1000 0 ,即设置第1000位的数字位 0,那么前面 999位的数字则全部补0

扩展操作:

业务场景, 电影网站每天对电影有没有被点播的统计

统计每天某一部电影是否被点播
统计每天有多少部电影被点播
统计每周/月/年有多少部电影被点播
统计年度哪部电影没有被点播

对于每天每部电影有没有被点播,可以使用电影的id作为offset, 如果被点播记录1,没有被点播,则记为0,

并使用时间作为key, 例如 20210119:0101011 ,20210119:1101101 等

对于每月的统计,则可以将该月30 天的所有数据位,进行或操作(全为0则为0,只要有1则为1),统计出的即是该电影本月有没有被点播

3.HyperLogLog 类型

在说此类型时,先来看看什么是基数

比如数据集 {1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。基数估计就是在误差可接受的范围内，快速计算基数

那么此时如果有一个网站,需要统计一年的访问客户端电脑ip个数, 如果使用Set 集合的方式,每有一个新的ip,则往里面存,会自动去重,但是如果数据量太过庞大,则占据的存储量也十分大,

对于这种需求,Redis 提供了 HyperLogLog 类型, 它是专门干这个事的

LogLog 算法的底层实现

示意图:

1611068840234

由于实现太过于简单,我懒得解释了,想要深入了解的....算你厉害

基本操作

添加数据

pfadd key element [element ...]  // 将需要统计的数据加入到此中,例如一个ip

统计数据

pfcount key [key ...] // 统计此key 已经存放的元素基数

合并数据

pfmerge destkey sourcekey [sourcekey...] //合并多个key 到 destkey中

示例:

pfadd k  127.0.0.1
pfadd k  127.0.0.1
pfadd k  127.0.0.1
pfadd k  192.168.0.1
pfadd k  192.168.0.2
pfcount k  //得出结果 : 3

相关说明:

用于进行基数统计，不是集合，不保存数据，只记录数量而不是具体数据
核心是基数估算算法，最终数值存在一定误差
误差范围：基数估计的结果是一个带有 0.81% 标准错误的近似值
耗空间极小，每个hyperloglog key占用了12K的内存用于标记基数
pfadd命令不是一次性分配12K内存使用，会随着基数的增加内存逐渐增大
Pfmerge命令合并后占用的存储空间为12K，无论合并之前数据量多少

4. GEO 类型

对于现今软件中用到位置信息的计算,例如附近的人,Redis提供了非常方便的操作方式

哈哈丶丶

个人网站： www.qydp.net，提供公司吐槽评价，欢迎访问

Redis高级数据类型

2. Bitmaps 类型

3.HyperLogLog 类型

4. GEO 类型

公告