数仓工程师面试知识点汇总

1.知识体系

2.HIVE相关

四种排序的区别

提交一个hive任务后的后台执行流程(sql转化为mr的过程)

数据倾斜的成因及优化方法

概念模型、逻辑模型、物理模型是什么

hive和关系型数据有什么区别

 

3.基础概念相关

数仓概念、作用

数仓分层、为什么要分层

数据仓库和数据库的区别

数仓模型设计思路(范式建模和维度建模,雪花/星座/星型)

数仓分层的主题域划分原则有哪些

数据库六大范式https://blog.csdn.net/weixin_41951954/article/details/120762668

 

4.数据库相关

哪些数据库是关系型的or非关系型的,各自有什么特点

 

 

5.Hadoop相关

mapReduce执行过程

hadoop操作命令 

6.编程题(只记录难点)

开窗函数

次日 留存、次n日留存、连续登录超过n天的用户

 

posted @ 2022-08-08 21:19  stAr_1  阅读(112)  评论(0编辑  收藏  举报