Fork me on GitHub
摘要: 本篇是大数据系列的开局篇,主要介绍了Hadoop家族,HDFS和MapReduce的概念;通过以“专利数据集”为测试对象,编写MapReduce Demo,了解Hadoop MapReduce的内部运行机制以及Map和Reduce的输入输出键值对如何生成与相互关联等。 阅读全文
posted @ 2014-12-13 16:17 JackieZheng 阅读(3205) 评论(4) 推荐(1) 编辑