摘要: 此文为个人学习笔记如需系统学习请访问http://dblab.xmu.edu.cn/blog/1709-2/ 基本概念 *  RDD:是弹性分布式数据集(Resilient Distributed Dataset)的简称,是分布式内存的一个抽象概念,提供了一... 阅读全文
posted @ 2018-09-10 20:48 莫逸风 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 此文为个人学习笔记如需系统学习请访问http://dblab.xmu.edu.cn/blog/1709-2/ Spark具有如下几个主要特点:  运行速度快 Spark使用先进的DAG(Directed Acyclic Graph,有向无环图)执行引擎... 阅读全文
posted @ 2018-09-10 20:23 莫逸风 阅读(127) 评论(0) 推荐(0) 编辑