摘要: 一、用户命令1、archive命令(1).什么是Hadoop archives?Hadoop archives是特殊的档案格式。一个Hadoop archive对应一个文件系统目录。 Hadoop archive的扩展名是*.har。Hadoop archive包含元数据(形式是_index和_ma... 阅读全文
posted @ 2015-10-09 16:51 ethan_song 阅读(183) 评论(0) 推荐(0) 编辑
摘要: 我们主要使用Hadoop的2个部分:分布式文件存储系统(HDFS)和MapReduce计算模型。关于这2个部分,可以参考一下Google的论文:The Google File System 和 MapReduce: Simplified Data Processing on Large Cluste... 阅读全文
posted @ 2015-10-09 14:39 ethan_song 阅读(155) 评论(0) 推荐(0) 编辑