会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
酷酷的狐狸
走思狗的日子
博客园
首页
新随笔
联系
订阅
管理
2021年3月31日
spark算子
摘要: 一、RDD概述 1.1 RDD叫做弹性分布式数据集,是spark中最基本的抽象数据。它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。 1)弹性: 存储的弹性:内存与磁盘的自动切换 容错的弹性:数据丢失可以自动恢复 计算的弹性:计算出容错机制 分片的弹性:可根据需要重新分片 2)分布式
阅读全文
posted @ 2021-03-31 10:54 酷酷的狐狸
阅读(166)
评论(0)
推荐(0)
编辑
公告