2017年12月19日
摘要: 顾名思义,从字面理解RDD就是 Resillient Distributed Dataset,即弹性分布式数据集。 它是Spark提供的核心抽象。 RDD在抽象上来讲是一种抽象的分布式的数据集。它是被分区的,每个分区分布在集群中的不同的节点上。从而可以让数据进行并行的计算 它主要特点就是弹性和容错性 阅读全文
posted @ 2017-12-19 20:21 玲珑少年 阅读(3686) 评论(0) 推荐(0) 编辑