Hyperloglog基数统计
基数(不重复的元素)
统计不重复的元素个数,可以接受误差
Redis Hyperloglog 基数统计的算法
优点:占用内存是固定的,2^64不同的元素的技术,只需要12KB内存,如果要从内存角度比较的话 首选Hyperloglog
网页的UV(一个人访问一个网站多次,但还是算作一个人)
传统方式:set保存用户的id,然后可以统计set中的元素数量作为标准判断
此方式如果保存大量的用户id,就会比较麻烦!我们目的是为了计数,而不是保存用户id
0.81%错误率 统计UV任务,可以忽略不计
PFadd key element.... 创建第一组元素
pfcount key 统计key中元素的基数数量
pfcount key3 key1 key2... 合并两组key1 key2 (并集) 到key3中
允许容错,可以使用Hyperloglog
不允许容错,就使用set或者自己的数据类型