redis应用于独立信息统计

HyperLogLog

统计独立UV

基数

  • 基数是数据集去重后元素个数

  • HyperLogLog是用来做基数统计的,运用了LogLog的算法

基本操作

  • 添加数据
pfadd key element [element ...]
  • 统计数据
pfcount key [key ...]
  • 合并数据
pfmerge destkey sourcekey [sourcekey...]

Trips 22:

  • redis应用于独立信息统计

相关说明

  • 用于进行基数统计,不是集合,不保存数据,只记录数量而不是具体数据
  • 核心是基数估算算法,最终数值存在一定误差
  • 误差范围:基数估计的结果是一个带有0.81%标准错误的近似值
  • 耗空间极小,每个htperloglog key占用了12k的内存用于标记基数
  • pfadd命令不是一次性分配12k内存使用,会随着基数的增加内存逐渐增大
  • pfmerge命令合并后占用的存储空间为12k,无论合并前数据量多少
posted @ 2020-02-18 13:41  if年少有为  阅读(210)  评论(0编辑  收藏  举报