hadoop面试题

1、hadoop2.x版本和hadoop3.x版本hdfs高可用有什么区别?

2版本namenode只有两台,3版本namenode可以有很多台,JournalNode同节点的数据

hdfs非高可用是secondarynamenode同步元数据

 

2、on yarn模式下spark集群规模是多少?

一般设置2至三台客户端

 

3、yarn上任务跑满了,机器变得非常卡怎么办?

yarn.nodemanager.resource.memory-mb配置,根据服务器内存大小分配小部分内存给linux系统,所以不会卡。

生产环境:128G 32核 。分配108G给yarn,linux系统预留20G。物理核虚拟化1:2。

 

4、

 

posted @ 2022-06-13 11:40  所向披靡zz  阅读(44)  评论(0编辑  收藏  举报