spark RDD 中Action的count、top、reduce、fold、aggregate -- (视频笔记)

 

count
返回整个RDD所有元素的个数

top
返回最大key的top个数元素。
会进行倒叙排序
返回的为数组

reduce
针对每个分区进行reduceLeft操作。
前两个进行reduce操作,然后结果与第三个元素操作。。。。。。。
然后对所有分区的结果进行reduceLeft操作
串行处理

aggregate
也是reduceLeft操作
是并行化的

posted @ 2015-12-29 14:15  逸新  阅读(637)  评论(0编辑  收藏  举报