摘要: 粗粒度资源申请(Spark) 在Application执行之前,将所有的资源申请完毕,当资源申请成功后,才会进行任务的调度,当所有的task执行完成后,才会释放这部分资源 优点:在Application执行之前,所有的资源都申请完毕,每一个task直接使用资源就可以了,不需要task在执行前自己去申 阅读全文
posted @ 2019-07-22 20:51 北漂屌丝 阅读(482) 评论(0) 推荐(0) 编辑
摘要: 1、启动集群后,Worker节点会向Master节点汇报资源情况,Master掌握了集群资源情况 2、当Spark提交一个Application后,根据RDD之间的依赖关系将Application形成一个DAG有向无环图。任务提交后,Spark会在Driver端创建两个对象:DAGScheduler 阅读全文
posted @ 2019-07-22 20:47 北漂屌丝 阅读(222) 评论(0) 推荐(0) 编辑
摘要: 资源粒度 MR是基于进程,MR的每一个task都是一个进程,当task完成时,进程也会结束 spark是基于线程,Spark的多个task跑在同一个进程上,这个进程会伴随spark应用程序的整个生命周期,即使没有作业进行,进程也是存在的 所以,spark比MR快的原因也在这,MR启动就需要申请资源, 阅读全文
posted @ 2019-07-22 19:41 北漂屌丝 阅读(465) 评论(0) 推荐(0) 编辑