摘要:
2.RDD 编 程 2.RDD 编 程 在 Spark 中,RDD 被表示为对象,通过对象上的方法调用来对 RDD 进行转换。经过 一系列的 transformations 定义 RDD 之后,就可以调用 actions 触发 RDD 的计算,action 可 以是向应用程序返回结果(count, 阅读全文
摘要:
1 RDD 概述 1.1 什么是 RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本的数据 抽象。代码中是一个抽象类,它代表一个弹性的、不可变、可分区、里面的元素可并行计算 的集合。 WordCount: 1.2 RDD 的属性 阅读全文