摘要: 2.RDD 编 程 2.RDD 编 程 在 Spark 中,RDD 被表示为对象,通过对象上的方法调用来对 RDD 进行转换。经过 一系列的 transformations 定义 RDD 之后,就可以调用 actions 触发 RDD 的计算,action 可 以是向应用程序返回结果(count, 阅读全文
posted @ 2019-07-06 15:34 LXL_1 阅读(707) 评论(0) 推荐(0) 编辑
摘要: 1 RDD 概述 1.1 什么是 RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本的数据 抽象。代码中是一个抽象类,它代表一个弹性的、不可变、可分区、里面的元素可并行计算 的集合。 WordCount: 1.2 RDD 的属性 阅读全文
posted @ 2019-07-06 04:55 LXL_1 阅读(263) 评论(0) 推荐(0) 编辑