摘要: 自己总结 MR是基于进程,spark是基于线程 Spark的多个task跑在同一个进程上,这个进程会伴随spark应用程序的整个生命周期,即使没有作业进行,进程也是存在的 MR的每一个task都是一个进程,当task完成时,进程也会结束 所以,spark比MR快的原因也在这,MR启动就需要申请资源, 阅读全文
posted @ 2019-06-18 17:25 任重而道远的小蜗牛 阅读(6398) 评论(0) 推荐(3) 编辑