摘要:
一、知识预热1、了解hadoop概念,及其家族树。hadoop是是一个能够对大量数据进行分布式处理的软件框架。Hadoop Common: 在0.20及以前的版本中,包含HDFS、MapReduce和其他项目公共内容,从0.21开始HDFS和MapReduce被分离为独立的子项目,其余内容为Hadoop CommonHDFS: Hadoop分布式文件系统(Distributed File System) - HDFS (Hadoop Distributed File System)MapReduce:并行计算框架,0.20前使用 org.apache.hadoop.mapred 旧接口,0.2 阅读全文