摘要: hadoop之 distcp(分布式拷贝) 概述 distcp(分布式拷贝)是用于大规模集群内部和集群之间拷贝的工具。 它使用Map/Reduce实现文件分发,错误处理和恢复,以及报告生成。 它把文件和目录的列表作为map任务的输入,每个任务会完成源列表中部分文件的拷贝。 由于使用了Map/Redu 阅读全文
posted @ 2018-10-29 11:23 SamaelB 阅读(513) 评论(0) 推荐(0) 编辑