摘要: RDD介绍 Spark中的RDD就是一个不可变的分布式对象集合,每个RDD都被分为多个分区,这些分区运行在集群中的不同节点上。用户可以使用两种方法创建RDD:读取一个外部数据集,或在驱动器程序里分发驱动器程序中的对象集合(比如 list 和 set)。创建出来之后,RDD支持两种类型的操作:转化操作 阅读全文
posted @ 2020-04-27 16:30 G先生 阅读(477) 评论(0) 推荐(0) 编辑

:guocheng