会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
喜讯XiCent
博客园
首页
新随笔
联系
订阅
管理
2020年7月6日
Spark快速入门之RDD编程模型
摘要: RDD(Resilient Distributed Dataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个可分区,不可变,里面的元素可并行计算的结合。RDD具有自动容错、位置感知性调度和可伸缩性。RDD允许用户在执行多个查询时显示地将工作集换存在内存中,后续的查询能够重用工作集
阅读全文
posted @ 2020-07-06 15:25 喜讯XiCent
阅读(207)
评论(0)
推荐(0)
编辑
公告