hadoop架构.hdfs:分布式文件存储包括:HDFS client,NameNode(临时存储),DataNode.yarn:分布式资源管理负责任务调度和资源管理,只关心资源使用情况.mapreduce:分布式计算分为两个操作一个是map:即使用map键值对的形式存储数据reduce:核心处理过程流程:读取数据--》map(存储)--》reduce(处理)--》输出数据