06 2024 档案

摘要:介绍 在数据处理领域,数据分析师在数据湖上运行其即席查询。数据湖充当分析和生产环境之间的接口,可防止下游查询影响上游数据引入管道。为了确保数据湖中的数据处理效率,选择合适的存储格式至关重要。 Vanilla数据湖解决方案构建在具有 Hive 元存储的云对象存储之上,其中数据文件以 Parquet 格 阅读全文
posted @ 2024-06-23 10:32 leesf 阅读(174) 评论(0) 推荐(0) 编辑
摘要:这篇博文包括 Onehouse 首席执行官 Vinoth Chandar 于 2022 年 3 月在奥斯汀数据委员会发表的重要演讲的后半部分。本文是第 2 部分,比较了架构的功能和性价比特征。最后,它描述了一个面向未来的、湖仓一体的架构。 数据仓库和Lakehouse:功能对比 对于核心读写:湖仓一 阅读全文
posted @ 2024-06-16 09:10 leesf 阅读(142) 评论(1) 推荐(1) 编辑