真实架构面试 待整理

第1题

题目描述:请介绍下您的大数据从业经历

考察目的:考察应变和总结归纳能⼒,没有标准答案。

 

第2题

题目描述:您公司的大数据架构

考察目的:考察是不是真的有大数据经验,归纳概括能力如何,能不能把架构数清楚,无标准答案。

 

第3题

题目描述:最近在研究什么技术

考察目的:其实是在考察你是否爱钻研,没有标准答案。

 

第4题

题目描述:你们的团队组成和分⼯

考察目的:不同情况,考察⽬的不⼀样。如果⾯试的是普通⼤数据开发岗位,本问题主要是看你有没有说实话,判断有没有真是的⼤数据⼯作经验,如果⽀⽀吾吾,或者前后回答⽜头不对⻢嘴⽴⻢就让⾯试官绝地没有实际⼯作经验。如果⾯试的是⼤数据架构师,leader,负责⼈,总监,主要是考察你有没有带过团队,团队是如何分⼯的。

 

第5题

题目描述:请介绍下您如何做服务器选型以及您公司的集群规模

考察目的:考察是否具有实际的项⽬经验,服务器配置说的离谱、集群规模明显跟公司的业务和数据量相悖⼀定是假造的⼯作经验。

 

第6题

题目描述:基础架构选型

考察目的:主要是考虑架构师的⼀些独⽴思考能⼒。

 

第7题

题目描述:您在哪个公司的数据规模最⼤,有多⼤量

考察目的:辨别项⽬经验真假。

 

第8题

题目描述:容量规划

考察目的:辨别项⽬经验真假。

 

第9题

题目描述:数仓分层架构

考察目的:考察数仓架构

 

第10题

题目描述:您熟悉常⻅机器学习算法吗?

考察目的:考察是否具有算法能⼒

 

第11题

题目描述:谈谈你对数据倾斜理解及实际场景

回复技巧:数据倾斜是⾮常⼤的⼀个题,是每⼀个分布式计算框架、技术都会⾯临的问题,答案很宽泛,不要都记住。不可能每个都记住,记住3四个点即可,切记。

 

第12题

题目描述:HDFS读写流程

考察目的:考察对存储系统的理解

 

第13题

题目描述:MapReduce的Shuffle过程

考察目的:考察对分布式计算的理解

 

第14题

题目描述:Flink端到端⼀致性

考察目的:考察Flink的功底

 

第15题

题目描述:您在项⽬中遇到了哪些棘⼿问题怎么解决的

考察目的:考察应变能⼒、总结能⼒、以及项⽬经验是否真实

 

第16题

题目描述:HBase的架构及读写流程

考察目的:考察对HBase的理解程度

 

第17题

题目描述:Hive优化技巧

考察目的:考察Hive功底

 

第18题

题目描述:你们都有哪些分析指标

考察目的:⽬的也是在考察项⽬经验是否属实,是否深度参与了项⽬。

 

第19题

题目描述:实时数据仓架构

考察目的:考察实时数仓的架构、好处及优化

 

第20题

题目描述:Kafka优化及⾼效读写的原因

考察目的:考察对Kafka底层架构的理解

 

第21题

题目描述:你们公司是如何做数据治理的

考察目的:考察你是否具备数据治理经验

 

第22题

题目描述:数据质量如何管理

考察目的:考察你是否具备数据质量管理经验

 

第23题

题目描述:你们是怎么做元数据管理的

考察目的:考察你是否具备元数据管理经验

 

第24题

题目描述:数仓、⽤户画像、其他AI应⽤的关系

考察目的:考察你是否能驾驭公司整体业务

 

第25题

题目描述:你们数据部门对外交付的形式有哪些

考察目的:一定程度考察你工作经验的真实性

 

第26题

题目描述:你们是如何把数据查询能⼒开放出去的

考察目的:一定程度考察你工作经验的真实性

posted @ 2023-05-06 18:34  十一vs十一  阅读(20)  评论(0编辑  收藏  举报