03 2022 档案
摘要:本文是一篇数据湖的面试题,同时也是数据湖知识点的讲解 目录: 一、什么是数据湖 二、数据湖的发展 三、数据湖有哪些优势 四、数据湖应该具备哪些能力 五、数据湖的实现遇到了哪些问题 六、数据湖与数据仓库的区别 七、为什么要做数据湖?区别在于? 八、数据湖挑战 九、湖仓一体 十、目前有哪些开源数据湖组件
阅读全文
摘要:本文目录: 一、前言 二、SQL的执行计划 explain 的用法explain 的使用场景 案例一:join 语句会过滤 null 的值吗? 案例二:group by 分组语句会进行排序吗? 案例三:哪条sql执行效率高呢? 案例四:定位产生数据倾斜的代码段explain dependency的用
阅读全文
摘要:本文大纲: 因内容较多,本文将直接从第五章开始,完整版文档请点击下方链接: 数仓建设保姆级教程PDF文档 前四章内容在上方链接获取 第五章 实时数仓建设核心 1. 实时计算初期 虽然实时计算在最近几年才火起来,但是在早期也有部分公司有实时计算的需求,但是数据量比较少,所以在实时方面形成不了完整的体系
阅读全文