会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
tony~博客小屋
夫学须静也,才须学也.非学无以广才,非志无以成学
→_→^_^
博客园
管理
2017年12月4日
Spark RDD、DataFrame原理及操作详解
摘要: RDD是什么? RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。 RDD内部可以有许多分区(partitions),每个分区又拥有大量的记录(records)。 五个特征: dep
阅读全文
posted @ 2017-12-04 15:35 ^_TONY_^
阅读(19409)
评论(0)
推荐(2)
编辑
公告