会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
elsearch
博客园
首页
新随笔
联系
订阅
管理
2016年12月21日
Parquet与ORC:高性能列式存储格式(收藏)
摘要: 背景 随着大数据时代的到来,越来越多的数据流向了Hadoop生态圈,同时对于能够快速的从TB甚至PB级别的数据中获取有价值的数据对于一个产品和公司来说更加重要,在Hadoop生态圈的快速发展过程中,涌现了一批开源的数据分析引擎,例如Hive、Spark SQL、Impala、Presto等,同时也产
阅读全文
posted @ 2016-12-21 18:47 无尽的缥缈
阅读(10845)
评论(1)
推荐(3)
编辑