spark
摘要:
Spark是UC Berkeley AMP lab开发的一个集群计算的框架,类似于Hadoop,但有很多的区别。最大的优化是让计算任务的中间结果可以存储在内存中,不需要每次都写入HDFS,更适用于需要迭代的MapReduce算法场景中,可以获得更好的性能提升。例如一次排序测试中,对100TB数据进行 阅读全文
posted @ 2017-10-13 23:00 懵懂的菜鸟 阅读(439) 评论(0) 推荐(0) 编辑
Stay hungry,Stay foolish.
2017年10月13日 #
posted @ 2017-10-13 23:00 懵懂的菜鸟 阅读(439) 评论(0) 推荐(0) 编辑
posted @ 2017-10-13 22:44 懵懂的菜鸟 阅读(481) 评论(0) 推荐(0) 编辑
posted @ 2017-10-13 21:05 懵懂的菜鸟 阅读(457) 评论(0) 推荐(0) 编辑
posted @ 2017-10-13 20:52 懵懂的菜鸟 阅读(251) 评论(0) 推荐(0) 编辑