摘要: 吸血鬼数字是指位数为偶数的数字,可以由一对数字相乘而得到,而这对数字各包含乘积的一半位数的数字,其中从最初的数字中选取的数字可以任意排序。以两个0结尾的数字是不允许的,例如,下列数字都是吸血鬼数字:1260 = 21 * 601827 = 21 * 872187 = 27 * 81程序如下:impo... 阅读全文
posted @ 2015-03-23 21:42 tinylcy 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 上一种方法让所有的数据在网络上重排,然后在许多情况下大部分数据又被丢弃了,如果我们在map阶段就去除不必要的数据,会更有效率。当较小的数据源可以装入mapper的内存时,可以通过将较小的数据源复制到所有的mapper,并在mapper阶段进行联结,以实现效率的极大提高。管理分布式缓存的类为Distr... 阅读全文
posted @ 2015-03-23 16:04 tinylcy 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 我是参照《Hadoop in action》完成示例程序。如果是在eclipse下需要将 hadoop-datajoin-xxx.jar 导入工程的Library中。另外新的API已经不再使用mapper,reducer接口,而Datajoin中DataJoinMapperBase,DataJoin... 阅读全文
posted @ 2015-03-23 10:02 tinylcy 阅读(168) 评论(0) 推荐(0) 编辑