会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
装'X'者死于各种非命!!!!
博客园
首页
新随笔
联系
订阅
管理
2017年12月19日
什么是RDD?
摘要: 顾名思义,从字面理解RDD就是 Resillient Distributed Dataset,即弹性分布式数据集。 它是Spark提供的核心抽象。 RDD在抽象上来讲是一种抽象的分布式的数据集。它是被分区的,每个分区分布在集群中的不同的节点上。从而可以让数据进行并行的计算 它主要特点就是弹性和容错性
阅读全文
posted @ 2017-12-19 20:21 玲珑少年
阅读(3686)
评论(0)
推荐(0)
编辑