摘要: 转自http://blog.csdn.net/clearriver/archive/2009/11/21/4846354.aspx随机抽样问题(蓄水池问题Reservoir Sampling)【问题】随机抽样问题表示如下:要求从N个元素中随机的抽取k个元素,其中N无法确定。这种应用的场景一般是数据流的情况下,由于数据只能被读取一次,而且数据量很大,并不能全部保存,因此数据量N是无法在抽样开始时确定的;但又要保持随机性,于是有了这个问题。所以搜索网站有时候会问这样的问题。这里的核心问题就是“随机”,怎么才能是随机的抽取元素呢?我们设想,买彩票的时候,由于所有彩票的中奖概率都是一样的,所以我们才是 阅读全文
posted @ 2011-08-24 13:04 westfly 阅读(533) 评论(0) 推荐(0) 编辑