2015年8月31日

hadoop 蓄水池抽样 分布式抽样

摘要: #!/usr/bin/env python# -*- coding=utf8 -*-import sysimport osimport random#input split 1565 #>>> 3000000/1565.0#1916.932907348243#2000K = 2000pool = [... 阅读全文

posted @ 2015-08-31 23:12 雨渐渐 阅读(403) 评论(0) 推荐(0) 编辑

c++ boost string split trim replace

摘要: http://blog.csdn.net/firebird321/article/details/2207669 阅读全文

posted @ 2015-08-31 18:43 雨渐渐 阅读(459) 评论(0) 推荐(0) 编辑

hadoop 数据采样

摘要: http://www.cnblogs.com/xuxm2007/archive/2012/03/04/2379143.html原文地址如上:关于Hadoop中的采样器1.为什么要使用采样器在这个网页上有一段描述比较靠谱 http://www.philippeadjiman.com/blog/2009... 阅读全文

posted @ 2015-08-31 17:45 雨渐渐 阅读(766) 评论(0) 推荐(0) 编辑

导航