会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
大数据学习与分享
博客园
首页
新随笔
联系
订阅
管理
2020年10月23日
Spark RDD详解 | RDD特性、lineage、缓存、checkpoint、依赖关系
摘要: RDD(Resilient Distributed Datasets)弹性的分布式数据集,又称Spark core,它代表一个只读的、不可变、可分区,里面的元素可分布式并行计算的数据集。RDD是一个很抽象的概念,不易于理解,但是要想学好Spark,必须要掌握RDD,熟悉它的编程模型,这是学习Spark其他组件的基础
阅读全文
posted @ 2020-10-23 15:52 大数据学习与分享
阅读(894)
评论(0)
推荐(0)
编辑
公告