摘要: 论文:英文版,中文版1. 导论1.1 定义先给个定义: MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。使用这个抽象模型,我们只要表述我们想要执行的简单运算即可,而不必关心并行计算、容错、数据分布、负载均衡等复杂的细节,这些问题都被封装在了一个库里面。设计这个抽象模型的灵感来自Lisp和许多其他函数式语言的Map和Reduce的原语。1.2 概述 阅读全文
posted @ 2013-04-15 16:28 billowkiller 阅读(933) 评论(0) 推荐(0) 编辑
Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 3.0 Unported License.