会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
越努力,越幸运
朱季谦
腾讯云社区2022年度最佳作者、阿里云专家博主认证
朱季谦
博客园
首页
新随笔
联系
订阅
管理
2023年8月22日
Spark RDD惰性计算的自主优化
摘要: 原创/朱季谦 RDD(弹性分布式数据集)中的数据就如final定义一般,只可读而无法修改,若要对RDD进行转换或操作,那就需要创建一个新的RDD来保存结果。故而就需要用到转换和行动的算子。 Spark运行是惰性的,在RDD转换阶段,只会记录该转换逻辑而不会执行,只有在遇到行动算子时,才会触发真正的运
阅读全文
posted @ 2023-08-22 21:20 朱季谦
阅读(281)
评论(0)
推荐(1)
编辑
公告