摘要: 概述MapReduce运行在Hadoop集群上。但MapReduce是通过另外一批进程来运行的。HDFS的进程名是NameNode、SecondaryNameNode和DataNode;而MapReduce的进程名(可以通过JPS命令查看)是:ResourceMana... 阅读全文
posted @ 2018-10-09 22:05 IT晓白 阅读(256) 评论(0) 推荐(0) 编辑
摘要: hadoop参数配置 阅读全文
posted @ 2018-10-09 21:18 IT晓白 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 一、MR计算模型的由来 MapReduce最早是由Google公司研究提出的一种面向大规模数据处理的并行计算模型和方法。Google公司设计MapReduce的初衷,主要是为了解决其搜索引擎中大规模网页数据的并行化处理。 Google公司发... 阅读全文
posted @ 2018-10-09 20:01 IT晓白 阅读(905) 评论(0) 推荐(0) 编辑