Doris 再次启动FE失败的思考

Doris再次启动FE失败的思考

背景描述

在昨天已经成功下载安装最新稳定版docker、拉取doris-0.15.0版本的镜像、将镜像挂载道本地Doris源码目录、完成了doris的编译之后,今天在继续按照文档进行集群部署时,基本没遇到什么问题,后面在查看be节点状态时发现hadoop102节点的可用空间只有3个G,便想给hadoop102集群扩容

问题描述

直接关掉虚拟机后,删除所有快照(不删不让在VMvare的设置里面修改虚拟机的空间),然后将空间从50G改到了80G--(后来才知道在设置里面扩展的是虚拟磁盘空间)--,重启时出现的一个问题也都解决了,但是hadoop102节点的状态发生了改变,回退了很多操作,导致我需要重新给他配置并启动doris,我从其他节点直接拷贝配置文件过来,然后运行fe报错,运行其他节点的fe也会报错

问题原因

Centos7磁盘空间扩容操作不规范,删掉所有快照,回退了操作,导致集群出现故障
Centos7磁盘空间扩容

报错信息

一、FE启动失败,fe.log 中一直滚动如下信息:
wait catalog to be ready. FE type UNKNOWN

听说是因为doris暂时不支持ip变动,因为fe主节点ip变化 导致无法启动,换个版本重新编译一遍,再部署一次就好了

二、尝试使用Mysql客户端连接Doris时报错
Lost connection to MySQL server at 'reading initial communication packet', system error: 0

通常是因为编译 FE 时使用的 jdk 版本和运行 FE 时使用的 jdk 版本不同导致的。


三、启动FE时,使用jps命令看不到进程,查看日志
java.lang.Suchmethoderror: java.nio. ByteBuffer. limit (I)Ljava/nio/ByteBuffer;

Docker 里默认是 JDK 11,如果您的安装环境是使用 JDK8 ,需要在 Docker 里 JDK 环境切换成 JDK8


四、启动FE错误:
找不到或无法加载主类 org.apache.doris.PaloFe

思路可以


尚未解决

Doris官方常见报错处理指导文档
问题相似,可以参考

他的问题是FE挂掉后,启动不起来了


这个关系不大
可能有点用

思考

一、

我用docker build编译完doris后(编译前我有将Docker镜像挂载到本地),关机或重启节点,我还需要去重新启动一下docker吗?还是去本地挂载目录下直接配置运行doris

二、如果恢复到刚扩容重启的时候你会怎么做?

是向往常一样死马当活马医,看到一个解决方法就拿来试试,还是捋顺思路后再动手,没搞清楚问题本质前,宁可搁置,也不让事态继续恶化

其他问题

问题描述

直接在VMvare里面通过设置扩展虚拟磁盘的容量,重启虚拟机时遇到的问题

错误信息

重启后命令行提示如下:

generating “/run/initramfs/rdsosreport.txt”
entering emergencymode. exit the shell to continue
type “journalctl” to view system logs.
you might want to save “/run/initramfs/rdsosreport.txt” to a usb stick or /boot after mounting them and attach it to a bug report。

解决方法

查看设备的信息
# ls /dev/mapper/

这里会显示三个设备,其中有一个: xxxx-root,我的虚拟机是:rhel-root
问题修复:

# xfs_repair /dev/mapper/rhel-root

上述命令执行后,提示: xxxx busy...(大致意思就是:那块设备正在被使用)
此时,需要尝试先卸载那块设备。

# umount /rhel-root
卸载之后,在此尝试修复(此时可以正常修复)
# xfs_repair /dev/mapper/rhel-root
上述命令不能修复,需要添加参数 -L
# xfs_repair /dev/mapper/rhel-root -L

posted @ 2023-08-27 22:22  与时代共同进步  阅读(2062)  评论(0编辑  收藏  举报