摘要: 在Ralph Kimball和Margy Ross 的《数据仓库工具包》一书中,提到了数据仓库设计中的10个常见陷阱,本文针对每个陷... 阅读全文
posted @ 2020-08-07 23:15 大数据技术与数仓 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 维表是数仓中的一个概念,维表中的维度属性是观察数据的角度,在建设离线数仓的时候,通常是将维表与事实表进行关联构建星型模型。在实时数仓... 阅读全文
posted @ 2020-08-07 23:14 大数据技术与数仓 阅读(5125) 评论(0) 推荐(1) 编辑
摘要: LeeCode数据库部分SQL题目总结 176. 第二高的薪水 描述 编写一个 SQL 查询,获取 Employee 表中第二高的... 阅读全文
posted @ 2020-08-07 23:07 大数据技术与数仓 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 在Hive的开窗函数实战的文章中,主要介绍了Hive的分析函数的基本使用。本文是这篇文章的延续,涵盖了Hive所有的条件函数和日期函... 阅读全文
posted @ 2020-08-07 23:04 大数据技术与数仓 阅读(964) 评论(0) 推荐(0) 编辑
摘要: 本文主要介绍Hive的架构和以及HQL的查询阶段,主要内容包括: Hive的架构架构中的相关组件介绍HQL的查询阶段 Hive的架构... 阅读全文
posted @ 2020-08-07 23:02 大数据技术与数仓 阅读(337) 评论(0) 推荐(0) 编辑
摘要: 当我们在使用Flink的时候,避免不了要和时间(time)、水位线(watermarks)打交道,理解这些概念是开发分布式流处理应用... 阅读全文
posted @ 2020-08-07 22:52 大数据技术与数仓 阅读(675) 评论(0) 推荐(0) 编辑
摘要: Flink总共有三种时间语义:Processing time(处理时间)、Event time(事件时间)以及Ingestion t... 阅读全文
posted @ 2020-08-07 22:46 大数据技术与数仓 阅读(407) 评论(0) 推荐(0) 编辑
摘要: 在Flink Table API & SQL编程指南(1)一文中介绍了Flink Table API &SQL的一些基本的概念和通用... 阅读全文
posted @ 2020-08-07 22:44 大数据技术与数仓 阅读(201) 评论(0) 推荐(0) 编辑
摘要: SQL是大数据从业者的必备技能,大部分的大数据技术框架也都提供了SQL的解决方案。可以说SQL是一种经久不衰、历久弥新的编程语言。尤... 阅读全文
posted @ 2020-08-07 13:46 大数据技术与数仓 阅读(223) 评论(0) 推荐(0) 编辑
摘要: SQL是大数据从业者的必备技能,大部分的大数据技术框架也都提供了SQL的解决方案。可以说SQL是一种经久不衰、历久弥新的编程语言。尤其是在数仓领域,使用SQL更是家常便饭。本文会分享四个在面试和工作中常用的几个使用技巧,具体包括: 日期与期间的使用 临时表与Common Table Expressi 阅读全文
posted @ 2020-08-07 10:32 大数据技术与数仓 阅读(210) 评论(0) 推荐(1) 编辑
摘要: ... 阅读全文
posted @ 2020-08-07 08:30 大数据技术与数仓 阅读(202) 评论(0) 推荐(1) 编辑