摘要: 水塘抽样 与 洗牌算法 本文介绍两个相似的问题,水塘抽样和洗牌算法。 水塘抽样(Reservoir Sampling) 水塘抽样(Reservoir Sampling)说的是这样一个问题:当内存无法完全加载时,如何从数据流或大数据集中随机选取k个样本,并保证每个样本被选取的概率相等。 典型问题出现在 阅读全文
posted @ 2021-03-12 15:53 与MPI做斗争 阅读(160) 评论(0) 推荐(0) 编辑