摘要: 什么是Hyperloglog? 一个在大数据量下统计基数的算法, 占用内存小, 误差小, 但是会损失一定精度(Kylin中需要高精度可以用bitmap)。 作为数据人, 我们为何要了解它? 它与我们的部分实际业务是有关联的, 理解原理能更好的做好工作。 应用了Hyperloglog算法的框架: Re 阅读全文
posted @ 2020-10-07 12:11 wellDoneGaben 阅读(1412) 评论(0) 推荐(0) 编辑