摘要: 一,RDD 是什么 RDD 是spark 整个 体系中最重要的概念 RDD (Resilient Distributed DataSet) 中文就是 弹性分布式数据集; 弹性:简单解释就是RDD 是可以横向多分区的 ,纵向概念理解起来可能更容易 ,当计算过程中内存不足时候可以把数据刷到磁盘等外部存储 阅读全文
posted @ 2018-03-18 14:36 c'estlavie 阅读(176) 评论(0) 推荐(0) 编辑