摘要: 在一个给定长度的数组中随机等概率抽取一个数据很容易,但如果面对的是长度未知的海量数据流呢?蓄水池采样(Reservoir Sampling)算法就是来解决这个问题的, 它在分析一些大数据集的时候非常有用。 基本概念 细看后,我们可以对其进行扩展,假如从未知或者很大样本空间随机地取k个数? 类比下即可 阅读全文
posted @ 2018-01-11 08:06 kincolle 阅读(514) 评论(0) 推荐(0) 编辑