会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
SimbaStar
博客园
首页
新随笔
联系
订阅
管理
2019年11月22日
spark-on-yarn 学习
摘要: 1. hdfs存文件的时候会把文件切割成block,block分布在不同节点上,目前设置replicate=3,每个block会出现在3个节点上。 2. Spark以RDD概念为中心运行,RDD代表抽象数据集。以代码为例: sc.textFile(“abc.log”) textFile()函数会创建
阅读全文
posted @ 2019-11-22 11:52 SimbaStar
阅读(180)
评论(0)
推荐(0)
编辑