hadoop面试题

1、hadoop2.x版本和hadoop3.x版本hdfs高可用有什么区别?

2版本namenode只有两台,3版本namenode可以有很多台,JournalNode同节点的数据

hdfs非高可用是secondarynamenode同步元数据

 

2、on yarn模式下spark集群规模是多少?

一般设置2至三台客户端

 

3、yarn上任务跑满了,机器变得非常卡怎么办?

yarn.nodemanager.resource.memory-mb配置,根据服务器内存大小分配小部分内存给linux系统,所以不会卡。

生产环境:128G 32核 。分配108G给yarn,linux系统预留20G。物理核虚拟化1:2。

 

4、

 

posted @   所向披靡zz  阅读(54)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示