会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
oftenlin
思考,前进...
博客园
首页
新随笔
联系
订阅
管理
2018年2月27日
Spark 学习笔记 —— 常见API
摘要: 一、RDD 的创建 1)通过 RDD 的集合数据结构,创建 RDD sc.parallelize(List(1,2,3),2) 其中第二个参数代表的是整个数据,分为 2 个 partition,默认情况会讲数据集进行平分,注意不是两个副本 2)通过文件来读取 sc.textFile("file.tx
阅读全文
posted @ 2018-02-27 13:20 oftenlin
阅读(280)
评论(0)
推荐(0)
编辑
公告