consul 重启后 id 重新生成,导致该consul不能接收服务注册问题解决。
一、问题
最近测试环境的 consul
发生了重启
但是重启之后,发现服务注册不上去了,查看consul 的日志,发现了下面的信息。
2021/04/28 06:40:55 [WARN] agent: Syncing service "uat_10.60.6.30:davietest:8092" failed. rpc error making call: failed inserting node: Error while renaming Node ID: "c82f9d74-a4bc-c65e-a2fb-b9bfcec17ad3": Node name uat_37 is reserved by node 3ccb61e1-e0dd-9548-fc41-59de4b9f3991 with name uat_37
2021/04/28 06:40:55 [ERR] agent: failed to sync remote state: rpc error making call: failed inserting node: Error while renaming Node ID: "c82f9d74-a4bc-c65e-a2fb-b9bfcec17ad3": Node name uat_37 is reserved by node 3ccb61e1-e0dd-9548-fc41-59de4b9f3991 with name uat_37
第一眼我也没看出来什么异常, 认真一看,就是consul 的 node id 不一致导致的问题。 由于 consul server 异常重启后,导致 该节点的 node ID 重新生成了。,但是原来的 nodeid
已经在集群内其他节点未删除。
二、解决办法
修改当前异常 consul
的node id 为 之前的id。
我们看下我们consul 指定的 -data-dir=
路径是在哪,我们这边指定的是 /consul/data/
, 在该目录下可以找到为我们的文件 node-id
- 备份下
node-id
文件 - 将
3ccb61e1-e0dd-9548-fc41-59de4b9f3991
写入到node-id
文件,替换老的内容。 - 重启 consul.
三、扩展
注册服务
接口 http://ip:8500/v1/agent/service/register
请求方式 PUT
请求参数
{
"ID": "djx-test1-037",
"Name": "djx-test1",
"Tags": [],
"Address": "10.60.7.8",
"Port": 8000,
"Meta": {},
"Weights": {
"Passing": 10,
"Warning": 1
}
}
注销服务
-
去注册的节点 执行命令
consul services deregister -id djx-test1-037
-
PUT 请求
http://ip:8500/v1/agent/service/deregister/{ID}
ip 需要为注册的ip.
-
PUT 请求
/v1/catalog/deregister
https://www.consul.io/api-docs/catalog
可以不用在注册的机器发起注销。
{ "Datacenter": "yx-sz", "ServiceID": "djx-test1-037", "Node": "uat_hq_37" }
作者:理想三旬
本人承接各种项目维护和python项目开发, 如果觉得文章写得不错,或者帮助到您了,请点个赞,加个关注哦。运维学习交流群:544692191
本文版权归作者所有,欢迎转载,如果文章有写的不足的地方,或者是写得错误的地方,请你一定要指出,因为这样不光是对我写文章的一种促进,也是一份对后面看此文章的人的责任。谢谢。