1、jdk jre jvm 三者的区别
2、HDFS的副本数为什么为3,为什么不是2或者是4?
3、怎么查看端口号 怎么查看进程
4、查看java进程
5、说下隐语义模型的应用案例
6、用java开发过吗?
7、多线程是怎么运作的。
8、线程的创建和启动方式:
9、线程管理
10、线程同步
1、sql的一些问题:group by 时候前面字段比较多?
2、kafka是怎么工作的?
3、zookeeper有了解吗?
4、平时开发用什么工具?
5、linux netcat是怎么玩的?
6、kafka的acks机制?怎么保证kafka最大吞吐量?
7、Kafka 高吞吐率的实现
8、shell 的if判断的条件,什么时候是true?
9、字符串判断
10、Flume的扇入扇出
11、ELK的几个查询关键词
12、为什么HBase查询比较快
13、工作中用什么将Kafka中的数据导入HBase
1、Linux查看一个文件的大小
2、Linux如何查看一个文件后500行数据
3、使用hive怎么过滤空值
4、索引类型有哪些?
5、数据库如果考虑时区,用什么类型?
6、组合索引使用like还有效吗?
7、组合索引怎么使用才会生效
8、事务的特性?
9、 数据库隔离级别
10、linux系统常用的操作命令
11、 自己在linux上装过哪些软件?
12、 对堆和栈的理解?
13、 java数据结构
14、双向 链表如果从中取出一个数据,如何使其还是一个双向链表?
15、 算法了解吗?知道哪些?说下原理
16、离线大数据和实时大数据的区别?你如何技术选型?
17、 离线数据流向过程
18、 kafka熟吗?
19 、非结构化数据库有哪些?用过哪些?
20、kafka有哪些节点类型
21、 如果3台kafka的集群宕机了一台,怎么办?宕了两台呢?
22、 kafka和传统消息队列有何区别?
23 、集群是动态增加的吗?
24、 触发器的作用
25、 工作中SQL的优化
26、项目耗时多久?从什么状态开始的?什么状态结束的?你负责哪些?
1,你写的所有项目,说一遍
2,MR的执行流程
3,flume扇入扇出
4,kafka 的topic分区设计和consumer有什么关系
5,tableau怎么用的。
6,为什么用hbase存储
7,hive的优化
8,hive数据倾斜原因和处理
9,flink了解么
10,数据仓库用过哪些模型,说几个,例如雪花和星型
11,用过哪些算法
12,java线程怎么保证同步
13,线程锁的实现方式有几种
14,java GC回收垃圾说一下
15,jvm底层怎么玩的
16,手写一个java 的设计模式
17,python熟么,写过项目么
1、Kafka和传统的MQ之间的区别
2、Hive执行计划
3、sqoop工具可以条件导出吗
4、sqoop代码怎么写
1、数仓分层 数仓和普通数据库区别
2、数据仓库构建步骤:
3、oozie怎么用的?
4、项目里具体hive做的哪一块
5、别的调度工具
6、hive的自定义函数实现了什么接口
7、hive举几个会发生mr过程的语句例子
8、hive外部表应用场景
9、scala的数据类型有哪些
10、scala的偏函数能和我说说吗?
11、谈谈scala的柯里化
12、scala的apply和unapply方法是什么作用
13、scala里面定义一个集合有哪些方法
14、scala的元组定义之后可变吗
1、java注解底层是怎么实现的
2、你写过springboot吗,他里面有哪些注解
3、java日志框架用过哪个
4、java顶级父类有哪些方法
5、MySQL的执行计划
6、hashmap和treemap的区别知道吗
7、有哪些方法可以遍历一个hashmap
8、list和arraylist的关系
9、hashmap是怎么get和put的,就是它怎么是实现的