03 2022 档案

摘要:本文是一篇数据湖的面试题,同时也是数据湖知识点的讲解 目录: 一、什么是数据湖 二、数据湖的发展 三、数据湖有哪些优势 四、数据湖应该具备哪些能力 五、数据湖的实现遇到了哪些问题 六、数据湖与数据仓库的区别 七、为什么要做数据湖?区别在于? 八、数据湖挑战 九、湖仓一体 十、目前有哪些开源数据湖组件 阅读全文
posted @ 2022-03-31 21:05 五分钟学大数据 阅读(677) 评论(0) 推荐(0) 编辑
摘要:本文目录: 一、前言 二、SQL的执行计划 explain 的用法explain 的使用场景 案例一:join 语句会过滤 null 的值吗? 案例二:group by 分组语句会进行排序吗? 案例三:哪条sql执行效率高呢? 案例四:定位产生数据倾斜的代码段explain dependency的用 阅读全文
posted @ 2022-03-22 10:16 五分钟学大数据 阅读(843) 评论(0) 推荐(0) 编辑
摘要:本文大纲: 因内容较多,本文将直接从第五章开始,完整版文档请点击下方链接: 数仓建设保姆级教程PDF文档 前四章内容在上方链接获取 第五章 实时数仓建设核心 1. 实时计算初期 虽然实时计算在最近几年才火起来,但是在早期也有部分公司有实时计算的需求,但是数据量比较少,所以在实时方面形成不了完整的体系 阅读全文
posted @ 2022-03-02 17:45 五分钟学大数据 阅读(788) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示