Spark优化
摘要:
###代码优化 1.避免使用重复的RDD 2.对经常使用的RDD进行缓存持久化 3.使用高性能的算子 reduceByKey(map端预聚合)替代groupByKey mapPartitions替代map Transformation foreachPartitions替代foreach Actio 阅读全文
posted @ 2021-11-16 21:01 糟糟张 阅读(70) 评论(0) 推荐(0) 编辑
2021年11月16日 #
Powered by:
博客园
Copyright © 2025 糟糟张
Powered by .NET 9.0 on Kubernetes