摘要: 超大集群的简单数据处理转自百度文库Jeffrey Dean Sanjay Ghemawatjeff@google.com , sanjay@google.comGoogle , Inc.摘要MapReduce是一个编程模式,它是与处理/产生海量数据集的实现相关。用户指定一个map函数,通过这个map函数处理key/value(键/值)对,并且产生一系列的中间key/value对,并且使用reduce函数来合并所有的具有相同key值的中间键值对中的值部分。现实生活中的很多任务的实现都是基于这个模式的,正如本文稍后会讲述的那样。使用这样的函数形式实现的程序可以自动分布到一个由普通机器组成的超大集群 阅读全文
posted @ 2013-09-21 09:30 逆流的天平 阅读(399) 评论(0) 推荐(0) 编辑