摘要: 一、stage 的处理过程 1、从下图可以看出stage是通过递归的形式,从开始依次提交每个stage,直到ResultStage。 2、生成task的主要代码 3、提交到taskScheduler 4、 二、每个stage生成的task的个数 从以上的几幅图不难发现task的数量其实只与rdd的p 阅读全文
posted @ 2017-05-10 13:26 I'm_kylin 阅读(558) 评论(0) 推荐(0) 编辑