redis应用于独立信息统计
HyperLogLog
统计独立UV
基数
-
基数是数据集去重后元素个数
-
HyperLogLog是用来做基数统计的,运用了LogLog的算法
基本操作
- 添加数据
pfadd key element [element ...]
- 统计数据
pfcount key [key ...]
- 合并数据
pfmerge destkey sourcekey [sourcekey...]
Trips 22:
- redis应用于独立信息统计
相关说明
- 用于进行基数统计,不是集合,不保存数据,只记录数量而不是具体数据
- 核心是基数估算算法,最终数值存在一定误差
- 误差范围:基数估计的结果是一个带有0.81%标准错误的近似值
- 耗空间极小,每个htperloglog key占用了12k的内存用于标记基数
- pfadd命令不是一次性分配12k内存使用,会随着基数的增加内存逐渐增大
- pfmerge命令合并后占用的存储空间为12k,无论合并前数据量多少