MapReduce广泛应用技术原因(序篇)
1 MapReduce采用无共享大规模集群系统,集群系统的好的性价比和可伸缩性,这个优势使得MapReduce成为大规模海量数据的
首选条件
2MapReduce模型简单,易于理解,使用,大量数据处理问题包括很多机器学习和数据挖掘算法,都可以使用MapReduce实现
3虽然基本的MapReduce模型只是提供一个过程性的编程接口,但是在海量数据环境需要保证可伸缩性的前提下,通过合适的查询优化
和索引技术,MapReduce仍然能够提供好的数据处理性能