RabbitMQ的介绍与安装
1. MQ 的相关概念
1.1 MQ 的概念
MQ(message queue
),从字面意思上看,本质是个队列,FIFO先进先出,只不过队列中存放的内容是 message
而已,还是一种跨进程的通信机制,用于上下游传递消息。在互联网架构中,MQ是一种非常常见的上下游 “逻辑结构 + 物理解耦” 的消息通信服务。使用了MQ之后,消息发送上游只需要依赖MQ,不用依赖其他服务。
1.2 MQ 的作用
-
流量消峰
举个例子,如果订单系统最多能处理一万次订单,这个处理能力应付正常时段的下单时绰绰有余,正常时段我们下单一秒后就能返回结果。但是在高峰期,如果有两万次下单操作系统是处理不了的,只能限制订单超过一万后不允许用户下单。使用消息队列做缓冲,我们可以取消这个机制,把一秒内的订单分散成一段时间来处理,这时有些用户可能在下单十几秒后才能收到下单成功的操作,但是比不能下单的体验要好。
-
应用解耦
以电商应用为例,应用中有订单系统,库存系统、物流系统、支付系统。用户创建订单后,如果耦合调用库存系统、物流系统、支付系统,任何一个子系统除了故障,都会造成下单操作异常。当转变成基于消息队列的方式后,系统间调用的问题会减少很多,比如物流系统因为发生故障,需要几分钟来修复。在这几分钟的时间里,物流系统要处理的内存被缓存在消息队列中,用户的下单操作可以正常完成。当物流系统恢复后,继续处理订单信息即可,中间用户感受不到物流系统的故障,提升系统的可用性。
-
异步处理
有些服务间调用是异步的,例如A调用B,B需要花费很长时间执行,但是A需要知道B什么时候可以执行完,以前一般有两种方式,A过一段时间去调用B的查询api查询。或者A提供一个callback api,B执行完之后调用api通知A服务。这两种方式都不是很优雅,使用消息总线,可以很方便解决这个问题,A调用B服务后,只需要监听B处理完成的消息,当B处理完成后,会发送一条消息给MQ,MQ会将此消息转发给A服务。这样服务既不用循环调用B的的查询api,也不用提供callback api。同样B服务也不用做这些操作。A服务还能及时得到异步处理成功的消息。
1.3 MQ 的分类
1.3.1 ActiveMQ
- 优点:单机吞吐量万级,时效性ms级,可用性高,基于主从架构实现高可用性,消息可靠性较低的概率丢失数据
- 缺点:官方社区现在对 ActiveMQ5.x 维护越来越少,高吞吐量场景较少使用
1.3.2 Kafka
大数据的杀手锏,谈到大数据领域内的消息传输,则绕不开 kafka
,这苦啊哪位大数据而生的消息中间件,以其百万级TPS的吞吐量名声大噪,迅速成为大数据领域的宠儿,在数据采集、传输、存储的过程中发挥着举足轻重的作用。目前已经被 linkedIn
、Uber
、Twitter
、Netflix
等大公司所采纳。
- 优点:性能卓越,打你家写入 TPS 约在百万条/秒,最大的优点,就是吞吐量高。时效性 ms 级可用性非常高,kafaka 是分布式的,一个数据多个副本,少数机器宕机,不会丢失数据,不会导致不可用,消费者采用 Pull 方式获取消息,消息有序,通过控制能够保证所有消息被消费且仅被消费一次;有优秀的第三方
Kafka Web
管理界面Kafka-Manager
;在日志领域比较成熟,被多家公司和多个开源项目使用;功能支持:功能较为简单,主要支持简单的 MQ 功能,在大数据领域的实时计算以及日志采集被大规模使用 - 缺点:Kafka 单机超过64个队列/分区,Load 会发生明显的飙高现象,队列越多,load 越高,发送消息响应时间变长,使用短轮询方式,实时性取决于轮询间隔时间,消息失败不支持重试;支持消息顺序,但是一台代理宕机后,就会产生消息乱序,社区更新较慢;
1.3.3 RocketMQ
RocketMQ 出自阿里巴巴的开源产品,用 Java 语言实现,在设计时参考了 Kafka,并做出了自己的一些改进。被阿里巴巴广泛应用在订单、交易、充值、流计算、消息推送、日志流式处理、binglog 分发等场景。
- 优点:单机吞吐量十万级,可用性非常高,分布式架构,消息可以做到0丢失,MQ功能较为完善,还是分布式的,扩展性好,支持10亿级别的消息堆积,不会因为堆积导致性能下降,源码是 java ,我们可以自己阅读源码,定制自己公司的 MQ
- 缺点:支持的客户端语言不多,目前是 java 及 c++,其中 c++ 不成熟,社区活跃度一般,没有在MQ核心中去实现 JMS 等接口,有些系统要迁移需要修改大量代码
1.3.4 RabbitMQ
2007 年发布,是一个在AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最 主流的消息中间件之一。
- 优点:由于
erlang
语言的高并发特性,性能较好;吞吐量到万级,MQ 功能比较完备,健壮、稳定、易 用、跨平台、支持多种语言 如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP 等,支持 AJAX 文档齐全;开源提供的管理界面非常棒,用起来很好用,社区活跃度高;更新频率相当高。
1.4 MQ 的选择
-
Kafka
Kafka 主要特点是基于Pull 的模式来处理消息消费,追求高吞吐量,一开始的目的就是用于日志收集 和传输,适合产生大量数据的互联网服务的数据收集业务。大型公司建议可以选用,如果有日志采集功能, 肯定是首选 kafka 了
-
RocketMQ
天生为金融互联网领域而生,对于可靠性要求很高的场景,尤其是电商里面的订单扣款,以及业务削 峰,在大量交易涌入时,后端可能无法及时处理的情况。RoketMQ 在稳定性上可能更值得信赖,这些业务 场景在阿里双 11 已经经历了多次考验,如果你的业务有上述并发场景,建议可以选择 RocketMQ。
-
RabbitMQ
结合 erlang 语言本身的并发优势,性能好时效性微秒级,社区活跃度也比较高,管理界面用起来十分 方便,如果你的数据量没有那么大,中小型公司优先选择功能比较完备的 RabbitMQ。
2. RabbitMQ
2.1 RabbitMQ 的概念
RabbitMQ 是一个消息中间件:它接受并转发消息。你可以把它当做一个快递站点,当你要发送一个包 裹时,你把你的包裹放到快递站,快递员最终会把你的快递送到收件人那里,按照这种逻辑 RabbitMQ 是 一个快递站,一个快递员帮你传递快件。RabbitMQ 与快递站的主要区别在于,它不处理快件而是接收, 存储和转发消息数据。
2.2 RabibitMQ 的四大核心
-
生产者:产生数据发送消息的程序是生产者
-
交换机:交换机是 RabbitMQ 非常重要的一个不见,一方面它接受来自生产者的消息,另一方面它将消息推送到队列中。交换机必须确切知到如何处理它接受的消息,是将这些消息推送到特定队列还是推送到多个队列,亦或者是把消息丢弃,这个得由交换机类型决定
-
队列:队列是 RabbitMQ 内部使用的一种数据结构,尽管消息流经 RabbitMQ 和应用程序,但他们只能存储在队列中。队列仅受主机的内存和磁盘限制的约束,本质上是一个大的消息缓冲区。许多生产者可以将消息发送到一个队列,许多消费者可以尝试从一个队列接受数据。这就是我们使用队列的方式。
-
消费者:消费与接受具有相似的含义。消费者大多时候是一个等待接受消息的程序。请注意生产者,消费者和消息中间件很多时候并不在同一机器上。同一个应用程序既可以是生产者又可以是消费者。
2.3 RabbitMQ 的核心部分
2.4 RabbitMQ 名词介绍
- Broker:接收和分发消息的应用,
RabbitMQ Server
就是 Message Broker ; - Virtual host:出于多租户和安全因素设计的,把 AMQP 的基本组件划分到一个虚拟的分组中,类似于网络中的
namespace
概念。当多个不同的用户使用同一个 RabbitMQ server 提供的服务时,可以划分出 多个 vhost,每个用户在自己的 vhost 创建exchange/queue
等 ; - Connection:
publisher/consumer
和 broker 之间的 TCP 连接; - Channel:如果每一次访问 RabbitMQ 都建立一个 Connection,在消息量大的时候建立 TCP Connection 的开销将是巨大的,效率也较低。Channel 是在 connection 内部建立的逻辑连接,如果应用程 序支持多线程,通常每个 thread 创建单独的 channel 进行通讯,AMQP method 包含了 channel id 帮助客 户端和 message broker 识别 channel,所以 channel 之间是完全隔离的。Channel 作为轻量级的 Connection 极大减少了操作系统建立 TCP connection 的开销 ;
- Exchange:message 到达 broker 的第一站,根据分发规则,匹配查询表中的 routing key,分发 消息到 queue 中去。常用的类型有:
direct (point-to-point)
,topic (publish-subscribe)
andfanout (multicast)
; - Queue:消息最终被送到这里等待 consumer 取走;
- Binding:exchange 和 queue 之间的虚拟连接,binding 中可以包含 routing key,Binding 信息被保 存到 exchange 中的查询表中,用于 message 的分发依据;
2.5 安装 RabbitMQ
安装RabbitMQ之前需要先安装erlang
2.5.1 安装erlang22.2
-
下载erlang安装包
-
上传安装包到目标文件夹(我这里是/usr/local/software/),并解压erlang安装包
tar -zxvf otp_src_22.2.tar.gz
-
重命名
mv otp_src_22.2 erlang
-
安装 erlang 的有依赖工具
yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel unixODBC-devel
-
进入 erlang 目录进行安装环境的配置
# 步骤1 cd erlang/ # 步骤2 ./configure # 步骤3 make && make install PS:编译的过程可能会有点久,请耐心等待
-
验证 erlang 是否安装成功
./bin/erl # 输出Hello World io:format("Hello World~n", []).
-
添加环境变量
vim /etc/profile # 找到最后一行加入以下内容,保存退出 export PATH=$PATH:/data/app/hzt/erlang/bin # 刷新环境变量 source /etc/profile
-
查看环境变量是否配置成功
在任意目录下输入erl,如果能进入erl的控制台说明安装成功
2.5.2 安装RabbitMQ3.8.0
-
下载RabbitMQ3.8.0安装包
https://github.com/rabbitmq/rabbitmq-server/releases/tag/v3.8.0
-
上传安装包,并解压
上传到/usr/local/software 目录下(如果没有 software 需要自己创建)
解压文件
xz -d rabbitmq-server-generic-unix-3.8.0.tar.xz tar -xvf rabbitmq-server-generic-unix-3.8.0.tar # 重命名 mv rabbitmq_server-3.8.0 rabbitmq
-
配置环境变量
vim /etc/profile # 在最后一行添加如下命令 export PATH=$PATH:/usr/local/lib/erlang/bin:/usr/local/software/rabbitmq/sbin # 刷新环境变量 source /etc/profile
-
启动MQ
rabbitmq-plugins enable rabbitmq_management rabbitmq-server 或 rabbitmq-server -detached(后台运行)
-
添加新用户
默认账号密码是(guest/guest)
这里新添加账号:admin/admin注:需要在mq服务运行的时候才可以添加
# 添加用户 # rabbitmqctl add_user 账号 密码 rabbitmqctl add_user admin admin # 分配用户标签(admin为要赋予administrator权限的刚创建的那个账号的名字) rabbitmqctl set_user_tags admin administrator # 设置权限<即开启远程访问>(如果需要远程连接,例如java项目中需要调用mq,则一定要配置,否则无法连接到mq,admin为要赋予远程访问权限的刚创建的那个账号的名字,必须运行着rabbitmq此命令才能执行) rabbitmqctl set_permissions -p "/" admin ".*" ".*" ".*"
-
访问后台
-
停止mq
rabbitmqctl shutdown
-
解除guest账户的本地登录限制
修改核心配置参数
rabbitmq的核心配置参数在
/usr/local/software/rabbitmq/ebin/rabbit.app
里vim /usr/local/software/rabbitmq/ebin/rabbit.app # 找到loopback_users 修改为如下内容(去除 <<"guest">>中<<"">>) {loopback_users, [guest]},