摘要: HDFS会把非常大的文件分割成多个大的数据块(例如,128M),并且每一个数据块在集群的不同节点上存储3个备份。HDFS并不知道也不关心这些文件的内容。在yarn上,当一个Mapreduce任务开始时,Resource Manager(负责集群的资源管理和任务调度)会创建一个Appl... 阅读全文
posted @ 2015-04-20 00:00 忙碌的键盘 阅读(87) 评论(0) 推荐(0) 编辑