Hadoop集群regionserver节点故障

全触点Hadoop集群出现regionserver频繁掉的现象,大部分掉的都是140的regionserver节点,查看日志后发现两处信息
查看相关主机信息并无异常,日志信息显示由于与zk的session超时,查看MaxSessionTimeout、zookeeper.session.timeout这2个参数,发现参数设置过小
 
建议调整参数
MaxSessionTimeout   调整为210000
zookeeper.session.timeout   调整180000 

20190219凌晨两点至三点,137及140两台主机的regionserver节点均故障,相关的nmon监控及regionserver日志信息请查看附件
posted @ 2022-02-22 21:28  Harda  阅读(70)  评论(0编辑  收藏  举报