数仓工程师面试知识点汇总
1.知识体系
2.HIVE相关
四种排序的区别
提交一个hive任务后的后台执行流程(sql转化为mr的过程)
数据倾斜的成因及优化方法
概念模型、逻辑模型、物理模型是什么
hive和关系型数据有什么区别
3.基础概念相关
数仓概念、作用
数仓分层、为什么要分层
数据仓库和数据库的区别
数仓模型设计思路(范式建模和维度建模,雪花/星座/星型)
数仓分层的主题域划分原则有哪些
数据库六大范式https://blog.csdn.net/weixin_41951954/article/details/120762668
4.数据库相关
哪些数据库是关系型的or非关系型的,各自有什么特点
5.Hadoop相关
mapReduce执行过程
hadoop操作命令
6.编程题(只记录难点)
开窗函数
次日 留存、次n日留存、连续登录超过n天的用户