第五章_Spark核心编程_Rdd算子的分类与定义

复制代码
1. 什么是Rdd 算子
    rdd的方法 => rdd的算子 => rdd的操作

2. Rdd 算子的分类
    1. Transformation(转换) 算子
         Transformation 操作是延迟计算的
         也就是说 一个RDD转换生成另一个RDD操作时是不会马上执行的,需要等待有Actions操作时,才会触发

     根据操作Rdd元素的类型可以分为
value型、double value型、key-value型
2. Action(行动) 算子 Action算子 会触发Spark提交作业(Job),并将数据输出到Spark系统
复制代码

 

posted @   学而不思则罔!  阅读(77)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
点击右上角即可分享
微信分享提示