Spark分布式计算和RDD模型研究
摘要:
1背景介绍现今分布式计算框架像MapReduce和Dryad都提供了高层次的原语,使用户不用操心任务分发和错误容忍,非常容易地编写出并行计算程序。然而这些框架都缺乏对分布式内存的抽象和支持,使其在某些应用场景下不够高效和强大。RDD(Resilient Distributed Datasets弹性... 阅读全文
posted @ 2014-11-22 14:54 毛小娃 阅读(187) 评论(0) 推荐(0) 编辑