会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
GHR
博客园
首页
新随笔
联系
订阅
管理
2022年1月17日
【数据结构与算法】蓄水池抽样算法(Reservoir Sampling)
摘要: 问题描述 给定一个数据流,数据流长度 N 很大,且 N 直到处理完所有数据之前都不可知,请问如何在只遍历一遍数据(O(N))的情况下,能够随机选取出 m 个不重复的数据。 比较直接的想法是利用随机数算法,求 random(N) 得到随机数,但是题目表明数据流极大,这种大数据量是无法一次都读到内存的,
阅读全文
posted @ 2022-01-17 16:52 gonghr
阅读(1242)
评论(0)
推荐(0)
编辑
公告