会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
shijing's blog
博客园
首页
新随笔
联系
订阅
管理
2015年8月10日
Spark性能优化-coalesce(n)
摘要: 有时用Spark 运行Job 的时候,输出可能会出现一些空或者小内容。这时重新将输出的Partition 进行重新调整,可以减少RDD中Patition的数目。 两种方式: 1. coalesce(numPartitions:Int, shuffle:Boolean = false) 2. repa
阅读全文
posted @ 2015-08-10 16:54 evashi
阅读(790)
评论(0)
推荐(0)
编辑
公告