摘要: 导入 从一个Job运行过程中来看DAGScheduler是运行在Driver端的,其工作流程如下图: 图中涉及到的词汇概念: 1. RDD——Resillient Distributed Dataset 弹性分布式数据集。 2. Operation——作用于RDD的各种操作分为transformat 阅读全文
posted @ 2019-06-26 23:50 cctext 阅读(3214) 评论(2) 推荐(1) 编辑