摘要: @ RDD实现详解 RDD是Spark最基本也是最根本的数据抽象,本质将数据保存在内存中,并且高度受限的共享内存,即RDD是只读的,并且只能通过其他RDD上的批量操作来创建。 1. 什么是RDD RDDDD弹性分布式内存数据集,只读,分区记录的集合,RDD只能基于在稳定物理存储中的数据集和其他已有的 阅读全文
posted @ 2021-01-21 15:20 彬在俊 阅读(573) 评论(0) 推荐(0) 编辑