摘要:
第 3 章 RDD 编程 目录: 3.1 RDD基础 3.2 创建RDD 3.3 RDD操作 3.4 向spark传递函数 3.5 常见的RDD操作 3.6 持久化 3.1 RDD基础 RDD(Resilient Distributed Dataset):弹性分布式数据集,是一个不可变的分布式对象集 阅读全文
摘要:
第 2 章 Spark 下载与入门 2.1 下载Spark 略 2.2 Spark中Python和Scala的shell 略 2.3 Spark核心概念简介 以Python 版的例子介绍saprk核心概念 例 2-1:Python 行数统计# 1、驱动器程序:交互式运行spark,Spark she 阅读全文