面经 大数据开发实习 深信服科技

 面试时间:2019年6月

深信服的效率是很快的,前一天晚上5点钟通知笔试,在7点就要进行笔试,9点笔试完11点钟通知第二天中午11点面试

所以我做完也没有来得及有所准备,就得去面试了

面经如下:

1.namenode和secondarynamenode的工作机制

2.谈谈对flume的理解,

flume有什么缺点,怎么去优化他,

如果和kafka整合应该kadka在前还是在后

3.mapreduce有什么缺点,怎么去优化?

mapreduce与spark的对比,各有什么优缺点

4.谈谈对storm的了解

5.hbase的了解,
怎么存储数据,
数据读写流程,
与关系型数据库的区别,
为什么列式存储能多一列或者少一列

6.zookeeper的工作原理,怎么实现高可靠

7.azkaban的工作原理

8.jvm调优

9.gc

10.锁机制,同步锁和乐观锁

11.一个进程切换到另外一个进程,要保存前一个进程的什么?

12.如果一个map较慢,是什么原因?
怎么排查,怎么解决

13.三种join方式

14.hdfs适合存大文件还是小文件,为什么?

16.算法题
(1)有n级楼梯,可以一次跳一级,也可以一次跳两级,一共有多少种跳法
(2)一篇文章,找出词频前五点多单词,不能用mapreduce

17.Linux系统较卡顿,怎么去排查原因?

18.项目是分布式环境吗?搭建环境时出现
过什么问题?

19.有没有对hive进行过调优,有没有修改过源码?

20.TCP的三次握手🤝

深信服的面试问的很全面,问的问题一般都是从基础切入然后深挖;

后来了解到该部门的工作主要是基于源码的开发,

换句话说:不仅仅是使用这些大数据框架和组件,而是在原有的大数据框架基础上开发出自己大数据框架和组件

深知当时的自己是无法胜任该岗位的,

不过算是给了我一个学习的目标吧。

posted @ 2020-02-24 19:30  Transkai  阅读(621)  评论(0编辑  收藏  举报