会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
kincolle
博客园
新随笔
管理
2018年1月11日
蓄水池采样(Reservoir Sampling)
摘要: 在一个给定长度的数组中随机等概率抽取一个数据很容易,但如果面对的是长度未知的海量数据流呢?蓄水池采样(Reservoir Sampling)算法就是来解决这个问题的, 它在分析一些大数据集的时候非常有用。 基本概念 细看后,我们可以对其进行扩展,假如从未知或者很大样本空间随机地取k个数? 类比下即可
阅读全文
posted @ 2018-01-11 08:06 kincolle
阅读(514)
评论(0)
推荐(0)
编辑
公告