越努力,越幸运

朱季谦

腾讯云社区2022年度最佳作者、阿里云专家博主认证

摘要: 原创/朱季谦 RDD(弹性分布式数据集)中的数据就如final定义一般,只可读而无法修改,若要对RDD进行转换或操作,那就需要创建一个新的RDD来保存结果。故而就需要用到转换和行动的算子。 Spark运行是惰性的,在RDD转换阶段,只会记录该转换逻辑而不会执行,只有在遇到行动算子时,才会触发真正的运 阅读全文
posted @ 2023-08-22 21:20 朱季谦 阅读(281) 评论(0) 推荐(1) 编辑