SPARK之map()和mapPartition()的区别

  • map():每次处理一条数据

  • mapPartition():每次处理一个分区的数据,这个分区的数据处理完后,原RDD中分区的数据才能释放,可能导致OOM

    当内存空间较大的时候建议使用mapPartition(),以提高处理效率

posted @ 2019-09-03 21:39  北漂屌丝  阅读(1769)  评论(0编辑  收藏  举报