摘要: 这个其实我前面已经记录过了,这里在记录一下。我可以通过参数人为的来控制分区大小,增加分区中即可增加任务的并行度,并行度高自然运行的就快了嘛。官方推荐集群中每个cpu并行的任务是2-3个(也就是2-3个partition),这样对于资源使用是最充分的那么如何调整并行度呢。在类似 sc.textFile... 阅读全文
posted @ 2015-05-20 11:03 HarkLee 阅读(1271) 评论(0) 推荐(0) 编辑
摘要: 对于官方Programming Guides的GC优化一节做了阅读。在这里记录一下我的理解,可能记录的比较混乱没有条理:我理解其实GC优化的主要目的就是在你的任务执行中使用更少的内存,进行更少的gc回收,因为GC回收会使你的任务执行的更慢。使用-verbose:gc -XX:+PrintGCDeta... 阅读全文
posted @ 2015-05-20 07:56 HarkLee 阅读(1685) 评论(0) 推荐(0) 编辑