会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
博客园
首页
新随笔
联系
订阅
管理
2020年9月6日
【Spark学习笔记】05-Spark RDD
摘要: RDD Resilient Distributed DataSet:弹性分布式数据集 弹性:Spark可以通过重新安排计算来自动重建丢失的分区。 分布式:集群中跨多个机器分区存储。 RDD是一个基本的抽象,操作RDD就像操作一个本地集合一样,降低了编程的复杂度。 RDD不存储真正要计算的数据,而是记
阅读全文
posted @ 2020-09-06 15:17 yangyh11
阅读(170)
评论(0)
推荐(0)
编辑
公告