会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
知晓的老巢
唯有专注,才能保证对象的高内聚,年轻不狂妄自大,拼搏要有计划
博客园
首页
新随笔
联系
订阅
管理
2020年5月8日
Spark中rdd分区数量的决定因素
摘要: 1、参数配置(并行度)分区的默认个数等于对spark.default.parallelism的指定值2、根据父rdd的reduceTask数量3、读取hdfs的文件生成的rddrdd分区的数量等于hdfs的文件的block 4、sparkStreaming生成的rdd根据block interval
阅读全文
posted @ 2020-05-08 15:33 知晓的老巢
阅读(1245)
评论(0)
推荐(0)
编辑
公告