摘要: 在spark1.2以上的版本中,默认shuffle的方式已经变成了sortshuffle(在spark.shuffle.manager修改org.apache.spark.shuffle.sort.HashShuffleManager或者org.apache.spark.shuffle.sort.S... 阅读全文
posted @ 2015-05-26 13:28 HarkLee 阅读(1430) 评论(0) 推荐(0) 编辑
摘要: http://www.cnblogs.com/shenh062326/p/3946341.html 其实流程是从这里转载下来的,我只是在流程叙述中做了一下的标注。 当然为了自己能记住的更清楚,我没有直接copy而是打出来的。1、客户端提交作业后,启动Driver,Driver是Spark作业的Mas... 阅读全文
posted @ 2015-05-26 05:57 HarkLee 阅读(4906) 评论(0) 推荐(0) 编辑