摘要: RDD编程 基础Spark中的RDD是一个不可变的分布式对象集合。每个RDD都被分为多个分区,这些分区运行在集群中的不同节点上。RDD可以包含Python、java、Scala中任意类型的对象,甚至可以包含用户自定义的对象。两种方法创建RDD: 1. 读取一个外部数据集 2. 在驱动器程序里分发驱动 阅读全文
posted @ 2019-10-14 13:49 彪悍大蓝猫 阅读(236) 评论(0) 推荐(0) 编辑