摘要: ==> 什么是parquet Parquet 是列式存储的一种文件类型 ==> 官网描述: Apache Parquet is a columnar storage format available to any project in the Hadoop ecosystem, regardless 阅读全文
posted @ 2019-11-23 19:32 sandea 阅读(4025) 评论(1) 推荐(0) 编辑
摘要: 原文 Parquet 列式存储格式 面向分析型业务的列式存储格式 由 Twitter 和 Cloudera 合作开发,2015 年 5 月从 Apache 的孵化器里毕业成为 Apache 顶级项目 列式存储 列式存储和行式存储相比有哪些优势呢? 当时 Twitter 的日增数据量达到压缩之后的 1 阅读全文
posted @ 2019-11-23 19:30 sandea 阅读(1231) 评论(0) 推荐(0) 编辑