会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
十七楼的羊
博客园
首页
新随笔
联系
订阅
管理
2019年3月12日
spark RDD与集群提交任务
摘要: RDD 的介绍: 1,一组分片。数据集的基本单位,每个分片都被一个计算任务进行处理,相当于集群分节点。默认是CPU的 core数,创建RDD过程可以指定分片数量 2,一个计算每个分区的函数,RDD之中计算是按照分片为单位的,每一个分片都会实现computer函数来达到这个目的 3,RDD的每一次转换都生成一个新的RDD,所以RDD之间形成流水线的前后依赖,如果RDD丢失,完全可以...
阅读全文
posted @ 2019-03-12 08:06 十七楼的羊
阅读(193)
评论(0)
推荐(0)
编辑
公告