原理:

  spark作业sparkcontext、DAGDAGSchedler、taskSchulder、会将编写算子、切割成大量的task,会提交到application的excutor上执行如何资源设置cup core和excutor较少,就会造成能并行处理的task数量较少,从而就会增加task的运行时间,所以根据资源配置分配资源是很有必要的会很大程度的提高task的运行时间。

例子:

  

设置参数:

  

 

posted on 2018-05-14 12:04  大漠无影  阅读(112)  评论(0编辑  收藏  举报