会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
力扛九鼎
博客园
首页
新随笔
联系
管理
订阅
2019年8月12日
Rdd 、dataframe、dataset共性与区别
摘要: 共性: 1、RDD、DataFrame、Dataset全都是spark平台下的分布式弹性数据集,为处理超大型数据提供便利 2、三者都有惰性机制,在进行创建、转换,如map方法时,不会立即执行,只有在遇到Action如foreach时,三者才会开始遍历运算,极端情况下,如果代码里面有创建、转换,但是后
阅读全文
posted @ 2019-08-12 10:31 力扛九鼎
阅读(915)
评论(0)
推荐(0)
编辑
公告