Atlas 启动异常问题汇总

org.janusgraph.diskstorage.XX#

关键错误:#

Could not instantiate implementation: org.janusgraph.diskstorage.XXX

可能原因及排查:#

如果出现这种错误就注意看一看对应的XXX服务是否有正常启动。

解决方案:#

例如:Could not instantiate implementation: org.janusgraph.diskstorage.solr.Solr6Index。
Solr服务未正常启动。重新启动Solr,并确保正常启动。

KeeperErrorCode = NoNode for /hbase/hbaseid#

关键错误:#

org.apache.zookeeper.KeeperException$NoNodeException: KeeperErrorCode = NoNode for /hbase/hbaseid

解决方案:#

原因一:ZookeeperHbase数据节点异常
解决方案:
删掉Zookeeper中的hbase重新启动zk,删除XX/hbase/data目录 重新启动Hbase

原因二:Solr使用的Zookeeper,跟Hbase的zk不是同一个
解决方案:
Solr使用的Zookeeper,跟HbaseZookeeper,使用同一个Zookeeper服务。

原因三:atlas.graph.storage.hostname=XXX 填写错误
解决方案:
atlas.graph.storage.hostname=XXX 要写hbase使用的zk所在服务器地址

Failed to start embedded kafka#

关键错误:#

Caused by: org.apache.atlas.AtlasException: Failed to start embedded kafka

可能原因及排查:#

Kafka没有正常启动

解决方案:#

查看Kafka服务,并确保正常启动。

Master is initializing#

关键错误:#

org.apache.hadoop.hbase.PleaseHoldException: Master is initializing

可能原因及排查:#

Hbase的日志中发现
Timedout 300000ms waiting for namespace table to be assigned and enabled: tableName=hbase:namespace, state=ENABLED

解决方案:#

删除/hbase/data目录,重新启动。

Connection refused: localhost/127.0.0.1:16000#

关键错误:#

Caused by: org.apache.hbase.thirdparty.io.netty.channel.AbstractChannel$AnnotatedConnectException: Connection refused: localhost/127.0.0.1:16000

可能原因及排查:#

Hbase没有正常启动成功

解决方案:#

查看Hbase服务,并确保正常启动。

hbase:meta,,1 is not online#

关键错误:#

org.apache.hadoop.hbase.NotServingRegionException: hbase:meta,,1 is not online

Caused by: org.janusgraph.diskstorage.TemporaryBackendException: Temporary failure in storage backend
..............
Caused by: java.net.SocketTimeoutException: callTimeout=1200000, callDuration=1327553: Failed after attempts=16, exceptions:
2022-10-13T07:24:42.903Z, RpcRetryingCaller{globalStartTime=1665645882898, pause=100, maxAttempts=16}, org.apache.hadoop.hbase.NotServingRegionException: org.apache.hadoop.hbase.NotServingRegionException: hbase:meta,,1 is not online on lingxiu,16020,1665644650334

可能原因及排查:#

hbase的端口没有配置,导致hbase的16020服务无法正常访问。

解决方案:#

配置hbase端口

vim /opt/hbase/conf/hbase-site.xml

添加一下内容

<property>
	<name>hbase.master.port</name>
	<value>16000</value>
</property>
<property>
	<name>hbase.master.info.port</name>
	<value>16010</value>
	<dedication>建议增加端口配置  不加可能会遇到,启动成功页面无法访问</dedication>
</property>
<property>
	<name>hbase.regionserver.port</name>
	<value>16020</value>
</property>
<property>
	<name>hbase.regionserver.info.port</name>
	<value>16030</value>
</property>

org.apache.hadoop.hbase.ipc.NettyRpcServer#

关键错误:#

java.lang.UnsupportedOperationException: Constructor threw an exception for org.apache.hadoop.hbase.ipc.NettyRpcServer

可能原因及排查:#

查看hostname对应IP是否正确,本机域名对应的IP不正确。

解决方案:#

配置域名对应IP地址

vi /etc/hosts

bind(..) failed: 地址已在使用#

可能原因及排查:#

端口占用

解决方案:#

netstat -tunlp | grep 16010

使用命令查询是否占用端口号,查询之后kill掉。

java.net.ConnectException: 拒绝连接;#

关键错误:#

Call From lingxiu/192.168.152.128 to lingxiu:8311 failed on connection exception: java.net.ConnectException: 拒绝连接;

可能原因及排查:#

lingxiu:8311 无法访问。查看改域名端口是哪个服务配置。
该服务是否正常访问,如正常,及看lingxiu域名配置不正确,修改域名配置。

解决方案:#

lingxiu:8311这里错误是hbase中hadoop的配置问题。
core-site.xml 及 hbase-site.xml 的 hbase.rootdir 节点把 lingxiu:8311 改为 localhost:8311

作者:black-cat

出处:https://www.cnblogs.com/Kylin-lawliet/p/16944315.html

版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。

posted @   黑猫的黑猫黑猫  阅读(1701)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
点击右上角即可分享
微信分享提示
more_horiz
keyboard_arrow_up dark_mode palette
选择主题
menu