摘要: 前言: 蓄水池抽样:从N个元素中随机的等概率的抽取k个元素,其中N无法确定。 适用场景: 模式识别等概率抽样,抽样查看渐增的log日志(无法先保存整个数据流然后再从中选取,而是期望有一种将数据流遍历一遍就得到所选取的元素,并且保证得到的元素是随机的算法)。 伪代码: 解释:先选中第1到k个元素,作为 阅读全文
posted @ 2016-02-24 17:49 XiaoliSmile 阅读(3158) 评论(0) 推荐(0) 编辑