centos7.4搭建RabbitMQ高可用集群
- 准备工作
- 搭建 RabbitMQ Server 单机版
- RabbitMQ Server 高可用集群相关概念
- 搭建 RabbitMQ Server 高可用集群
- 搭建 HAProxy 负载均衡
环境介绍:
rabbitmq
|
节点IP
|
节点类型
|
系统
|
node01
|
10.0.0.1
|
disk
|
centos7.4-64位
|
node02
|
10.0.0.2
|
disk
|
centos7.4-64位
|
node03
|
10.0.0.3
|
ram
|
centos7.4-64位
|
整体架构
1.准备工作
修改hostname
在node01服务器上,修改主机名:
hostnamectl --static set-hostname node01
在node02服务器上,修改主机名:
hostnamectl --static set-hostname node02
在node03服务器上,修改主机名:
hostnamectl --static set-hostname node03
添加host解析,vim /etc/hosts(三台都需要添加)
10.0.0.1 node01 10.0.0.2 node02 10.0.0.3 node03
然后查看下hostnamectl status,如果不正确,需要在重新设置下:
hostnamectl --static set-hostname node01
2.搭建rabbitmq server单机版
首先,更新软件包和存储库:
yum -y update
然后安装 Erlang(RabbitMQ 运行需要 Erlang 环境):
vi /etc/yum.repos.d/rabbitmq-erlang.repo
name=rabbitmq-erlangbaseurl=https://dl.bintray.com/rabbitmq/rpm/erlang/20/el/7gpgcheck=1gpgkey=https://dl.bintray.com/rabbitmq/Keys/rabbitmq-release-signing-key.ascrepo_gpgcheck=0enabled=1
yum -y install erlang socat
然后安装 RabbitMQ Server:
mkdir -p ~/download && cd ~/download
wget https://www.rabbitmq.com/releases/rabbitmq-server/v3.6.10/rabbitmq-server-3.6.10-1.el7.noarch.rpm
rpm --import https://www.rabbitmq.com/rabbitmq-release-signing-key.asc
rpm -Uvh rabbitmq-server-3.6.10-1.el7.noarch.rpm
卸载 RabbitMQ 命令:
rpm -e rabbitmq-server-3.6.10-1.el7.noarch
rm -rf /var/lib/rabbitmq/ //清除rabbitmq配置文件
安装好之后,就可以启动 RabbitMQ Server 了:
systemctl start rabbitmq-server
也可以添加到系统服务中启动:
systemctl enable rabbitmq-server
启动成功之后,我们可以查看下 RabbitMQ Server 的状态:
systemctl status rabbitmq-server
然后启动 RabbitMQ Web 管理控制台:
rabbitmq-plugins enable rabbitmq_management
RabbitMQ Server 默认guest用户,只能localhost地址访问,我们还需要创建管理用户:
rabbitmqctl add_user admin admin123rabbitmqctl set_user_tags admin administratorrabbitmqctl set_permissions -p / admin ".*" ".*" ".*"
然后添加防火墙运行访问的端口:
firewall-cmd --zone=public --permanent --add-port=4369/tcp &&firewall-cmd --zone=public --permanent --add-port=25672/tcp &&firewall-cmd --zone=public --permanent --add-port=5671-5672/tcp &&firewall-cmd --zone=public --permanent --add-port=15672/tcp &&firewall-cmd --zone=public --permanent --add-port=61613-61614/tcp &&firewall-cmd --zone=public --permanent --add-port=1883/tcp &&firewall-cmd --zone=public --permanent --add-port=8883/tcp
重新启动防火墙:
firewall-cmd --reload
上面这些做完了,RabbitMQ 单机版的部署也完成了,我们可以浏览器访问http://node01:15672:
将上面的搭建过程,在node02、node03服务器上,再做重复一边。
3.rabbitmq server高可用集群方案相关概念
设计集群的目的
- 允许消费者和生产者在 RabbitMQ 节点崩溃的情况下继续运行。
- 通过增加更多的节点来扩展消息通信的吞吐量。
集群配置方式
- cluster:不支持跨网段,用于同一个网段内的局域网;可以随意的动态增加或者减少;节点之间需要运行相同版本的 RabbitMQ 和 Erlang。
- federation:应用于广域网,允许单台服务器上的交换机或队列接收发布到另一台服务器上交换机或队列的消息,可以是单独机器或集群。federation 队列类似于单向点对点连接,消息会在联盟队列之间转发任意次,直到被消费者接受。通常使用 federation 来连接 internet 上的中间服务器,用作订阅分发消息或工作队列。
- shovel:连接方式与 federation 的连接方式类似,但它工作在更低层次。可以应用于广域网。
节点类型
- RAM node:内存节点将所有的队列、交换机、绑定、用户、权限和 vhost 的元数据定义存储在内存中,好处是可以使得像交换机和队列声明等操作更加的快速。
- Disk node:将元数据存储在磁盘中,单节点系统只允许磁盘类型的节点,防止重启 RabbitMQ 的时候,丢失系统的配置信息。
问题说明:RabbitMQ 要求在集群中至少有一个磁盘节点,所有其他节点可以是内存节点,当节点加入或者离开集群时,必须要将该变更通知到至少一个磁盘节点。如果集群中唯一的一个磁盘节点崩溃的话,集群仍然可以保持运行,但是无法进行其他操作(增删改查),直到节点恢复。
解决方案:设置两个磁盘节点,至少有一个是可用的,可以保存元数据的更改。
Erlang Cookie
Erlang Cookie 是保证不同节点可以相互通信的密钥,要保证集群中的不同节点相互通信必须共享相同的 Erlang Cookie。具体的目录存放在/var/lib/rabbitmq/.erlang.cookie。
说明:这就要从 rabbitmqctl 命令的工作原理说起,RabbitMQ 底层是通过 Erlang 架构来实现的,所以 rabbitmqctl 会启动 Erlang 节点,并基于 Erlang 节点来使用 Erlang 系统连接 RabbitMQ 节点,在连接过程中需要正确的 Erlang Cookie 和节点名称,Erlang 节点通过交换 Erlang Cookie 以获得认证。
镜像队列
RabbitMQ 的 Cluster 集群模式一般分为两种,普通模式和镜像模式。
- 普通模式:默认的集群模式,以两个节点(rabbit01、rabbit02)为例来进行说明。对于 Queue 来说,消息实体只存在于其中一个节点 rabbit01(或者 rabbit02),rabbit01 和 rabbit02 两个节点仅有相同的元数据,即队列的结构。当消息进入 rabbit01 节点的 Queue 后,consumer 从 rabbit02 节点消费时,RabbitMQ 会临时在 rabbit01、rabbit02 间进行消息传输,把 A 中的消息实体取出并经过 B 发送给 consumer。所以 consumer 应尽量连接每一个节点,从中取消息。即对于同一个逻辑队列,要在多个节点建立物理 Queue。否则无论 consumer 连 rabbit01 或 rabbit02,出口总在 rabbit01,会产生瓶颈。当 rabbit01 节点故障后,rabbit02 节点无法取到 rabbit01 节点中还未消费的消息实体。如果做了消息持久化,那么得等 rabbit01 节点恢复,然后才可被消费;如果没有持久化的话,就会产生消息丢失的现象。
- 镜像模式:将需要消费的队列变为镜像队列,存在于多个节点,这样就可以实现 RabbitMQ的HA高可用性。作用就是消息实体会主动在镜像节点之间实现同步,而不是像普通模式那样,在 consumer 消费数据时临时读取。缺点就是,集群内部的同步通讯会占用大量的网络带宽。
镜像队列实现了 RabbitMQ 的高可用性(HA),具体的实现策略如下所示:
ha-mode
|
ha-params
|
功能
|
all
|
空
|
镜像队列将会在整个集群中复制。当一个新的节点加入后,也会在这 个节点上复制一份。
|
exactly
|
count
|
镜像队列将会在集群上复制 count 份。如果集群数量少于 count 时候,队列会复制到所有节点上。如果大于 Count 集群,有一个节点 crash 后,新进入节点也不会做新的镜像。
|
nodes
|
node name
|
镜像队列会在 node name 中复制。如果这个名称不是集群中的一个,这不会触发错误。如果在这个 node list 中没有一个节点在线,那么这个 queue 会被声明在 client 连接的节点。
|
实例列举:
queue_args("x-ha-policy":"all") //定义字典来设置额外的队列声明参数 channel.queue_declare(queue="hello-queue",argument=queue_args)
如果需要设定特定的节点(以rabbit@localhost为例),再添加一个参数:
queue_args("x-ha-policy":"nodes", "x-ha-policy-params":["rabbit@localhost"]) channel.queue_declare(queue="hello-queue",argument=queue_args)
可以通过命令行查看那个主节点进行了同步:
rabbitmqctl list_queue name slave_pids synchronised_slave_pids
以上内容主要参考:RabbitMQ分布式集群架构
4.搭建rabbitmq server高可用集群
理解了上面的概念之后,我们再搭建 RabbitMQ Server 高可用集群,就非常容易了。
默认.erlang.cookie文件是隐藏的,ls命令并不能查看,你也可以手动搜索下文件:
find / -name ".erlang.cookie" cat /var/lib/rabbitmq/.erlang.cookie
将node01服务器中的.erlang.cookie文件,拷贝到node02、node03服务器上:
scp /var/lib/rabbitmq/.erlang.cookie root@node02:/var/lib/rabbitmqscp /var/lib/rabbitmq/.erlang.cookie root@node03:/var/lib/rabbitmq
先停止运行节点,然后以后台方式启动 RabbitMQ Server(node1、node2和node03分别执行):
rabbitmqctl stoprabbitmq-server -detached
然后我们以node01作为集群中心,在node02和node03上执行加入集群中心命令(节点类型为磁盘节点):
rabbitmqctl stop_apprabbitmqctl resetrabbitmqctl join_cluster rabbit@node01 //默认是磁盘节点,如果是内存节点的话,需要加--ram参数rabbitmqctl start_app
查看集群的状态(包含node01、node02和node03节点):
rabbitmqctl cluster_status
Cluster status of node rabbit@node01[{nodes,[{disc,[rabbit@node01,rabbit@node02,rabbit@node03]}]},{running_nodes,[rabbit@node03,rabbit@node02,rabbit@node01]},{cluster_name,<<"rabbit@node01">>},{partitions,[]},{alarms,[{rabbit@node03,[]},{rabbit@node02,[]},{rabbit@node01,[]}]}]
我们可以从 RabbitMQ Web 管理界面,看到集群的信息:
5.搭建haproxy负载均衡方案(为防止脑裂问题,可考虑加上Keepalived)
HAProxy 是一个免费的负载均衡软件,可以运行于大部分主流的 Linux 操作系统上。
HAProxy 提供了 L4(TCP) 和 L7(HTTP) 两种负载均衡能力,具备丰富的功能。HAProxy 的社区非常活跃,版本更新快速(最新稳定版 1.7.2 于 2017/01/13 推出)。最关键的是,HAProxy 具备媲美商用负载均衡器的性能和稳定性。它当前不仅仅是免费负载均衡软件的首选,更几乎成为了唯一选择。
因为 RabbitMQ 本身不提供负载均衡,下面我们就搭建 HAProxy,用作 RabbitMQ 集群的负载均衡。
HAProxy 安装在node01服务器上,安装命令:
yum -y install haproxy
配置 HAProxy:
cp /etc/haproxy/haproxy.cfg /etc/haproxy/haproxy.cfg.bak vi /etc/haproxy/haproxy.cfg
将下面的配置添加到/etc/haproxy/haproxy.cfg文件中:
global log 127.0.0.1 local0 info log 127.0.0.1 local1 notice daemon maxconn 4096 defaults log global mode tcp option tcplog option dontlognull retries 3 option abortonclose maxconn 4096 timeout connect 5000ms timeout client 3000ms timeout server 3000ms balance roundrobin listen private_monitoring bind 0.0.0.0:8100 mode http option httplog stats refresh 5s stats uri /stats stats realm Haproxy stats auth admin:admin listen rabbitmq_admin bind 0.0.0.0:8102 server node01 node01:15672 server node02 node02:15672 server node03 node03:15672 listen rabbitmq_cluster bind 0.0.0.0:8101 mode tcp option tcplog balance roundrobin timeout client 3h timeout server 3h server node01 node01:5672 check inter 5000 rise 2 fall 3 server node02 node02:5672 check inter 5000 rise 2 fall 3 server node03 node03:5672 check inter 5000 rise 2 fall 3
然后启动 HAProxy:
haproxy -f /etc/haproxy/haproxy.cfg
外部访问的话,需要关闭下防火墙:
systemctl disable firewalld.service systemctl stop firewalld.service
HAProxy 配置了三个地址:
- http://node01:8100/stats:HAProxy 负载均衡信息地址,账号密码:admin/admin。
- http://node01:8101:RabbitMQ Server Web 管理界面(基于负载均衡)。
- http://node01:8102:RabbitMQ Server 服务地址(基于负载均衡)。
通过访问http://node01:8100/stats,查看 HAProxy 负载均衡信息:
参考资料:
- 如何在CentOS 7上安装RabbitMQ服务器(有点坑,要结合下面文章中的命令)
- Centos 6 通过 yum 安装 RabbitMQ
- RabbitMQ集群安装
- RabbitMQ分布式集群架构(推荐)
- RabbitMQ 分布式设置和高可用性讨论
- RabbitMQ 高可用集群
- RabbitMQ+Haproxy+Keepalived实现高可用集群搭建