LZ名約山炮

博客园 首页 新随笔 联系 订阅 管理

2021年6月1日 #

摘要: 第1章 RDD概述 1.1 什么是RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。 代码中是一个抽象类,它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。(简单说就是一个抽象类) 1.1.1 RDD类比工厂 阅读全文
posted @ 2021-06-01 22:54 LZ名約山炮 阅读(117) 评论(0) 推荐(0) 编辑