2014年3月21日
摘要: 一、知识预热1、了解hadoop概念,及其家族树。hadoop是是一个能够对大量数据进行分布式处理的软件框架。Hadoop Common: 在0.20及以前的版本中,包含HDFS、MapReduce和其他项目公共内容,从0.21开始HDFS和MapReduce被分离为独立的子项目,其余内容为Hadoop CommonHDFS: Hadoop分布式文件系统(Distributed File System) - HDFS (Hadoop Distributed File System)MapReduce:并行计算框架,0.20前使用 org.apache.hadoop.mapred 旧接口,0.2 阅读全文
posted @ 2014-03-21 12:53 冰墨白 阅读(268) 评论(0) 推荐(0) 编辑