摘要: RDD Resilient Distributed DataSet:弹性分布式数据集 弹性:Spark可以通过重新安排计算来自动重建丢失的分区。 分布式:集群中跨多个机器分区存储。 RDD是一个基本的抽象,操作RDD就像操作一个本地集合一样,降低了编程的复杂度。 RDD不存储真正要计算的数据,而是记 阅读全文
posted @ 2020-09-06 15:17 yangyh11 阅读(170) 评论(0) 推荐(0) 编辑