摘要: 一:MapReduce模型简介 MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数:Map和Reduce。它采用“分而治之”策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片(split),这些分片可以被多个Map任务并行处理 1.Map和Red 阅读全文
posted @ 2018-04-25 11:58 黎先生 阅读(42215) 评论(1) 推荐(3) 编辑