会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
tonglin0325.github.io
博客园
首页
新随笔
联系
订阅
管理
2017年4月6日
Spark学习笔记——RDD编程
摘要: 1.RDD——弹性分布式数据集(Resilient Distributed Dataset) RDD是一个分布式的元素集合,在Spark中,对数据的操作就是创建RDD、转换已有的RDD和调用RDD操作进行求值。 Spark 中的 RDD 就是一个不可变的分布式对象集合。每个 RDD 都被分为多个分区
阅读全文
posted @ 2017-04-06 10:36 tonglin0325
阅读(366)
评论(0)
推荐(0)
编辑
公告