会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
SAM's DATA RIVER
山姆大叔的 DATA BLOG
博客园
首页
新随笔
联系
管理
订阅
2022年7月6日
Spark 中三种数据处理对象的区别: RDD-Dataset-Dataframe
摘要: 1,对比表: RDD Dataframe Dataset 版本 1.0 1.3 1.6 描述 分布式数据集合 行列化的分布式数据集合 RDD 和 DataFrame的结合 数据格式 结构化和非结构化都可以 结构化和半结构化都可以 结构化和非结构化都可以 数据源 多种 多种 多种 不变性和互通性 容易
阅读全文
posted @ 2022-07-06 15:01 gaussen126
阅读(80)
评论(0)
推荐(0)
编辑
公告