摘要: Working on a Per Partition Basis(基于分区的操作) 以每个分区为基础处理数据使我们可以避免为每个数据项重做配置工作。如打开数据库连接或者创建随机数生成器这样的操作,我们希望避免为每个元素重做配置工作。Spark有分区版本的 和`foreach`,通过让RDD的每个分区 阅读全文
posted @ 2018-03-18 10:11 Tikko 阅读(1475) 评论(0) 推荐(0) 编辑