摘要: MapReduce是什么? MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,MapReduce程序本质上是并行运行的,因此可以解决海量数据的计算问题. MapReduce任务过程被分为两个处理阶段:map阶段和reduce阶段.每个阶段都以键值对作为输入和输出.用户只需 阅读全文
posted @ 2016-12-06 10:11 大象踢足球 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 原文地址:http://www.cnblogs.com/laov/p/3434917.html 简介 HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Google File System)Goog 阅读全文
posted @ 2016-12-06 10:00 大象踢足球 阅读(190) 评论(0) 推荐(0) 编辑