摘要: 一、Spark运行架构 1.基本概念 *  RDD:是弹性分布式数据集(Resilient Distributed Dataset)的简称,是分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型;*  DAG:是Directed Acyclic Graph(有向无环图)的简称,反映RDD之 阅读全文
posted @ 2020-02-06 22:23 祺&Qi 阅读(277) 评论(0) 推荐(0) 编辑