RDD使用(2)

 reduceByKey支持预聚合,这样的话IO就少了,读写效率高了,在聚合的时候内存的tuple也少了,内存上计算也更快了,所以如果使用聚合的话reduceBykey比groupbyKey效率更高

posted @ 2024-02-06 23:59  -她的梦-  阅读(0)  评论(0编辑  收藏  举报