摘要: 问题 阅读全文
posted @ 2022-01-16 18:24 r1-12king 阅读(69) 评论(0) 推荐(0) 编辑
摘要: 引入 有这样一类问题, 就是大数据流中的随机抽样问题,即: 当内存无法加载全部数据时,如何从包含未知大小的数据流中随机选取k个数据,并且要保证每个数据被抽取到的概率相等。 这道题有两个限制: 高效,即节省内存的使用 尽量随机地返回值 假如我们去掉限制1,可以很简单地做出来:我们将所有数据加载进内存, 阅读全文
posted @ 2022-01-16 18:07 r1-12king 阅读(70) 评论(0) 推荐(0) 编辑