Fork me on GitHub
摘要: spark spark是一个开源分布式计算框架,在于让计算更加快速,通常使用资源调度器yarn和spark自带的资源调度器standalond进行调度,spark相对于Hadoop更加快速,基于它是内存进行迭代,每次通过计算逻辑得到的中间结果值都会存放在内存中,而且最后结果也是从内存到磁盘,而Had 阅读全文
posted @ 2019-04-08 21:43 时间行人 阅读(1093) 评论(0) 推荐(0) 编辑