摘要: 来自:http://blog.csdn.net/dandingyy/article/details/7490046众所周知,Hadoop对处理单个大文件比处理多个小文件更有效率,另外单个文件也非常占用HDFS的存储空间。所以往往要将其合并起来。1,getmergehadoop有一个命令行工具getm... 阅读全文
posted @ 2014-09-12 16:28 悟寰轩-叶秋 阅读(678) 评论(0) 推荐(0) 编辑
摘要: http://grepalex.com/2013/05/20/multipleoutputs-part1/http://grepalex.com/2013/07/16/multipleoutputs-part2/ 阅读全文
posted @ 2014-09-12 11:11 悟寰轩-叶秋 阅读(166) 评论(0) 推荐(0) 编辑