会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
daitu66
博客园
首页
新随笔
联系
订阅
管理
DataFrame的代码构建 - 读取外部数据
parquet: 是Spark中常用的一种列式存储文件格式
和Hive中的ORC差不多, 他俩都是列存储格式
parquet对比普通的文本文件的区别:
●parquet 内置schema (列名\列类型\是否为空)
●存储是以列作为存储格式
●存储是序列化存储在文件中的(有压缩属性体积小
posted @
2024-01-24 18:09
阿飞藏泪
阅读(
4
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
公告
1
2 3
4