大数据开发工师面试复盘
最近面试了静极思动,面试了不少大数据相关岗位。总结了一下考察的相关范围:
1、Java基础
出乎意料,大数据岗也会问一下不少Java的知识,像 多线程、JVM内存管理、四种引用、GC机制、CMS和G1区别 都是考察的重点
2、算法
HiveSQL 经典:分组TopN、连续值求解问题
经典算法:超内存比较、二叉树遍历、链表反转等
3、Hive/Spark问题
运行机制、Shuffle原理、常用API、数据倾斜、算法优化、广播变量、小文件、SQL解析机制(大厂)、RPC机制(源码,这种只有一线大厂才会问)
4、结合自身岗位的其他大数据组件:HDFS、Hbase、Kafka、Redis等
以实操解决问题居多、基础数据结构次之、原理最少
总结:加强Flink的学习,流式计算为自身弱点