rabbitmq 集群相关操作

rabbitmq 集群相关操作

1. 集群启停

  • 正常启动

    • 如果关闭了集群中的所有节点,启动时需要首先启动最后一个关闭的节点。
      如果第一个启动的不是最后关闭的节点,那这个节点会等待最后关闭的节点启动。默认尝试连接10次,响应超时30s。如果对方在这段时间可用,节点会成功启动,并同步所需信息,否则启动失败。
  • 异常情况的启动

    最后关闭的节点因某些原因无法启动
    通过rabbitmqctl forget_cluster_node rabbit@node1 -offline 剔除rabbit@node1(故障节点)
    
    此命令在 rabbit@node2上执行,因为此时rabbit@node1未启动,需要加上-offline执行命令
    rabbit@node1 需要剔除的故障节点
    
    集群由于非正常因素,比如断电而全部关闭,集群中的节点会认为还有其他节点在它后面关闭
    
    通过rabbitmqctl force_boot 启动一个节点
    

2. 移除单节点

  • 节点未能正常运行

    rabbitmqctl forget_cluster_node rabbit@node1 -offline
    
    此命令在 rabbit@node2上执行,因为此时rabbit@node1未启动,需要加上-offline执行命令
    rabbit@node1 需要剔除的故障节点
    
  • 节点正常运行

    在节点执行:
    [root@node1 ~]# rabbitmqctl stop_app
    Stopping rabbit application on node rabbit@node1 ...
    
    [root@node1 ~]# rabbitmqctl reset
    Resetting node rabbit@node1 ...
    
    [root@node1 ~]# rabbitmqctl start_app
    Starting node rabbit@node1 ...
     completed with 0 plugins.
     
    [root@node1 ~]# rabbitmqctl cluster_status
    Cluster status of node rabbit@node1 ...
    [{nodes,[{disc,[rabbit@node1]}]},
     {running_nodes,[rabbit@node1]},
     {cluster_name,<<"rabbit@node1">>},
     {partitions,[]},
     {alarms,[{rabbit@node1,[]}]}]
    
    

3. 单节点故障恢复

单节点故障包括:机器硬件(硬盘、内存、网卡)故障、机器掉电、网络异常、服务进程异常

1. rabbitmqctl forget_cluster_node rabbit@node1
2. rabbitmqctl reset
3. 重新加入集群

如果有客户端连接故障节点,客户端会有异常报出,此时需要将故障节点的IP从连接列表里删除,并让客户端重新与集群中的节点建立连接

posted @ 2019-05-30 11:57  漂泊的蒲公英  阅读(481)  评论(0编辑  收藏  举报