批处理引擎MapReduce

1、MapReduce是一个经典的分布式批处理计算引擎,被广泛应用于搜索引擎索引构建、大规模数据处理等场景中,具有易于编程、良好的扩展性与容错性以及高吞吐率等特点。它主要由两部分组成:编程模型和运行时环境。其中,编程模型为用户提供了非常易用的编程接口,用户只需像编写串行程序一样实现几个简单的函数即可实现一个分布式程序,而其他比较复杂的工作,如节点间的通信、节点失效、数据切分等,全部由MapReduce运行时环境完成,用户无需关心这些细节

2、MapReduce设计目标

易于编程、良好的扩展性、高容错性、高吞吐率

 

posted @ 2020-06-23 16:56  Z张不错  阅读(372)  评论(0编辑  收藏  举报