hadoop 蓄水池抽样 分布式抽样
摘要:
#!/usr/bin/env python# -*- coding=utf8 -*-import sysimport osimport random#input split 1565 #>>> 3000000/1565.0#1916.932907348243#2000K = 2000pool = [... 阅读全文
posted @ 2015-08-31 23:12 雨渐渐 阅读(403) 评论(0) 推荐(0) 编辑