会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
triassic
博客园
首页
新随笔
管理
2020年2月7日
假期学习7
摘要: 今天开始做实验四,看上去一头雾水。查阅相关博客资料才明白了RDD是什么东西。 Spark 对数据的核心抽象—弹性分布式数据集就是RDD,换句话说就是分布式的元素集合。在spark里,对数据的所有操作就是创建 RDD、转化已有 RDD 以及调用 RDD 操作进行求值。创建RDD有两种方法:读取一个外部
阅读全文
posted @ 2020-02-07 22:57 Triassic
阅读(107)
评论(0)
推荐(0)
编辑
公告