真实架构面试 待整理
第1题
题目描述:请介绍下您的大数据从业经历
考察目的:考察应变和总结归纳能⼒,没有标准答案。
第2题
题目描述:您公司的大数据架构
考察目的:考察是不是真的有大数据经验,归纳概括能力如何,能不能把架构数清楚,无标准答案。
第3题
题目描述:最近在研究什么技术
考察目的:其实是在考察你是否爱钻研,没有标准答案。
第4题
题目描述:你们的团队组成和分⼯
考察目的:不同情况,考察⽬的不⼀样。如果⾯试的是普通⼤数据开发岗位,本问题主要是看你有没有说实话,判断有没有真是的⼤数据⼯作经验,如果⽀⽀吾吾,或者前后回答⽜头不对⻢嘴⽴⻢就让⾯试官绝地没有实际⼯作经验。如果⾯试的是⼤数据架构师,leader,负责⼈,总监,主要是考察你有没有带过团队,团队是如何分⼯的。
第5题
题目描述:请介绍下您如何做服务器选型以及您公司的集群规模
考察目的:考察是否具有实际的项⽬经验,服务器配置说的离谱、集群规模明显跟公司的业务和数据量相悖⼀定是假造的⼯作经验。
第6题
题目描述:基础架构选型
考察目的:主要是考虑架构师的⼀些独⽴思考能⼒。
第7题
题目描述:您在哪个公司的数据规模最⼤,有多⼤量
考察目的:辨别项⽬经验真假。
第8题
题目描述:容量规划
考察目的:辨别项⽬经验真假。
第9题
题目描述:数仓分层架构
考察目的:考察数仓架构
第10题
题目描述:您熟悉常⻅机器学习算法吗?
考察目的:考察是否具有算法能⼒
第11题
题目描述:谈谈你对数据倾斜理解及实际场景
回复技巧:数据倾斜是⾮常⼤的⼀个题,是每⼀个分布式计算框架、技术都会⾯临的问题,答案很宽泛,不要都记住。不可能每个都记住,记住3四个点即可,切记。
第12题
题目描述:HDFS读写流程
考察目的:考察对存储系统的理解
第13题
题目描述:MapReduce的Shuffle过程
考察目的:考察对分布式计算的理解
第14题
题目描述:Flink端到端⼀致性
考察目的:考察Flink的功底
第15题
题目描述:您在项⽬中遇到了哪些棘⼿问题怎么解决的
考察目的:考察应变能⼒、总结能⼒、以及项⽬经验是否真实
第16题
题目描述:HBase的架构及读写流程
考察目的:考察对HBase的理解程度
第17题
题目描述:Hive优化技巧
考察目的:考察Hive功底
第18题
题目描述:你们都有哪些分析指标
考察目的:⽬的也是在考察项⽬经验是否属实,是否深度参与了项⽬。
第19题
题目描述:实时数据仓架构
考察目的:考察实时数仓的架构、好处及优化
第20题
题目描述:Kafka优化及⾼效读写的原因
考察目的:考察对Kafka底层架构的理解
第21题
题目描述:你们公司是如何做数据治理的
考察目的:考察你是否具备数据治理经验
第22题
题目描述:数据质量如何管理
考察目的:考察你是否具备数据质量管理经验
第23题
题目描述:你们是怎么做元数据管理的
考察目的:考察你是否具备元数据管理经验
第24题
题目描述:数仓、⽤户画像、其他AI应⽤的关系
考察目的:考察你是否能驾驭公司整体业务
第25题
题目描述:你们数据部门对外交付的形式有哪些
考察目的:一定程度考察你工作经验的真实性
第26题
题目描述:你们是如何把数据查询能⼒开放出去的
考察目的:一定程度考察你工作经验的真实性