RabbitMQ
一、消息队列介绍
MQ的全称是Message Queue——消息队列,是一种应用程序对应用程序的通信方法。
它是一个独立运行的程序,实现在消息的传输过程中临时保存消息,可以将其理解称为一个存储消息的容器。
所谓的消息,是指代在两台计算机或2个应用程序之间传送的数据。
消息可以非常简单,例如文本字符串或者数字,也可以是更复杂的json数据或hash数据等。
所谓的队列,是一种先进先出、后进呼后出的数据结构。比如python中有一个线程队列模块queue。
我们先不管消息(Message)这个词,来看看队列(Queue)。
队列是一种先进先出的数据结构。
消息队列可以简单理解为:把要传输的数据放在队列中。
import queue q = queue.Queue(maxsize=10) # 设置此队列的容纳量为10 # 存放数据 q.put(111) q.put(222) q.put(333) # 获取数据 print(q.get()) # 111 print(q.get()) # 222 print(q.get()) # 333 print(q.get()) # 已无数据,程序将阻塞在这里,等待其他线程向q存放数据。
MQ是消费者-生产者模型的一个典型的代表:
-
生产者往消息队列中不断写入消息,而消费者去读取队列中的消息;
-
生产者和消费者都不需要知道对方的存在。
生产者-消费者模式通过一个容器来解决生产者和消费者的强耦合问题。
生产者和消费者彼此之间不直接通讯,而通过阻塞队列来进行通讯,所以生产者生产完数据之后不用等待消费者处理,直接扔给阻塞队列,
消费者不找生产者要数据,而是直接从阻塞队列里取,阻塞队列就相当于一个缓冲区,平衡了生产者和消费者的处理能力。
二、为什么需要MQ
消息队列中间件是分布式系统中重要的组件,主要解决应用解耦、异步消息、流量削锋等问题,实现高性能,高可用,可伸缩和最终一致性架构。
目前使用较多的消息队列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ。
当然,像redis、mysql、MongoDB,也可以充当消息中间件,但是相对而言,没有上面那么专业和性能稳定。
并发任务10k以下的,直接使用redis
并发任务10k以上,1000k以下的,直接使用RabbitMQ
并发任务1000k以上的,直接使用RocketMQ
接下来利用一个外卖系统的消息推送给大家解释下MQ的意义:应用解耦与异步消息
实际生活中,要完成一个外卖订单需要以下步骤:
- 用户在客户端下单;
- 客户下单完成,将此订单视为一个任务A,
- 将任务A发送给商家系统,以便商家完成食物制作...
- 将任务A发送给配送系统,配送系统将之分配给某个外卖员,外卖员接收此派单任务...
- 将任务A发送给后台系统,实现页面显示(客户可以看到订单进度、外卖员位置等)、餐后点评...
如果按照顺序流程去完成这个任务,将会非常耗时。
-
用户必须在商家、配送、后台三个系统都接收到任务后,订单系统才给用户“订单完成”的提示。
-
但用户根本不需要知道商家、配送、后台这三个系统的存在,也不需要知道它们之间如何交互。
所以,更优的做法是:
- 用户仅跟订单系统打交道即可,只要用户完成付款即可提示“下单成功”;
- 之后订单系统将此订单信息存放到消息队列中,订单系统任务即可完成;
- 商家、配送、后台这三个系统各自去消息队列中获取消息,各自完成自己任务。
三、RabbitMQ
RabbitMQ 是一个由 Erlang 语言开发的、基于 AMQP 协议的消息中间件,
它能够在应用之间提供可靠的消息传输。在易用性,扩展性,高可用性上表现优秀。
RabbitMQ的安装
安装依赖环境
yum install build-essential openssl openssl-devel unixODBC unixODBC-devel make gcc gcc-c++ kernel-devel m4 ncurses-devel tk tc xz
安装Erlang
需自行下载三个安装包:
erlang-18.3-1.el7.centos.x86_64.rpm
socat-1.7.3.2-5.el7.lux.x86_64.rpm
rabbitmq-server-3.6.5-1.noarch.rpm
# 安装erlang rpm -ivh erlang-18.3-1.el7.centos.x86_64.rpm # 安装socat:网络增强 rpm -ivh socat-1.7.3.2-1.1.el7.x86_64.rpm --force --nodeps # 安装rabbitmq rpm -ivh rabbitmq-server-3.6.5-1.noarch.rpm
如果出现如下错误:
说明gblic 版本太低。
开启管理界面
# 开启管理界面 rabbitmq-plugins enable rabbitmq_management # 修改默认配置信息 vim /usr/lib/rabbitmq/lib/rabbitmq_server-3.6.5/ebin/rabbit.app # 比如修改密码、配置等等,例如:loopback_users 中的 <<"guest">>,只保留guest
启动RabbitMQ
service rabbitmq-server start # 启动服务 service rabbitmq-server stop # 停止服务 service rabbitmq-server restart # 重启服务
RabbitMQ在安装好后,可以访问 http://192.168.56.110:15672
;自带了guest/guest的用户名和密码
简单模式
生产者:
import pika # pika是python用于连接RabbitMQ的第三方包 # 先连接RabbitMQ connection = pika.BlockingConnection(pika.ConnectionParameters('localhost')) channel = connection.channel() # 创建消息队列 channel.queue_declare(queue='hello') # 简单发布内容 channel.basic_publish(exchange='', # 简单模式,此处值为空 routing_key='hello', # 指定使用的队列 body='Hello World!') # 内容 print(" [x] Sent 'Hello World!'")
消费者:由于不确定是生产者还是消费者先启动,所以都需要创建消息队列。
import pika # 消费者第一步也是先连接RabbitMQ connection = pika.BlockingConnection(pika.ConnectionParameters('localhost')) channel = connection.channel() # 创建消息队列 channel.queue_declare(queue='hello') # 回调函数 def callback(ch, method, properties, body): print(" [x] Received %r" % body) # 指定监听内容 channel.basic_consume(queue='hello', # 指定队列 auto_ack=True, # 默认应答 on_message_callback=callback) # 指定回调函数 print(' [*] Waiting for messages. To exit press CTRL+C') channel.start_consuming()
应答参数 auto_ack
以上使用的是默认应答(auto_ack=True)。
消费者到队列中取出数据时,无论消费者后续是否正确完成了数据处理,队列中的数据一旦被取走就会删除。
但这种方式是有问题的,如果消费者在处理数据时出错了,而队列中的数据又已经删除,就会造成数据丢失。
设置auto_ack=False则为手动应答模式,此时回调函数需要在逻辑处理完成之后,给队列发送信号,队列接收到信号后才删除数据。
import pika # 消费者第一步也是先连接RabbitMQ connection = pika.BlockingConnection(pika.ConnectionParameters('localhost')) channel = connection.channel() # 创建消息队列 channel.queue_declare(queue='hello') # 回调函数 def callback(ch, method, properties, body): print(" [x] Received %r" % body) ch.basic_ack(delivery_tag=method.delivery_tag) # 固定写法,给队列发送信号:数据已完成处理。 # 指定监听内容 channel.basic_consume(queue='hello', # 指定队列 auto_ack=False, # 默认应答 on_message_callback=callback) # 指定回调函数 print(' [*] Waiting for messages. To exit press CTRL+C') channel.start_consuming()
持久化参数
RabbitMQ默认是将数据保存在内存中的,系统重启数据就会丢失。
如果需要对数据进行持久化,可以如下处理:
- 创建消息队列时,指定durable=True,表示此队列中的数据支持持久化;
- 发布消息时,指定该消息需进行持久化。
#声明queue channel.queue_declare(queue='hello2', durable=True) # durable=True 此队列支持数据持久化 channel.basic_publish(exchange='', routing_key='hello2', body='Hello World!', properties=pika.BasicProperties( delivery_mode=2, # 固定写法,直接记住。 ) )
分发参数
如果有两个消费者同时监听一个队列。
其中一个线程sleep2秒,另一个消费者线程sleep1秒,无论数据处理速度差异有多大,它们处理的消息是一样多。
这种方式叫轮询分发(round-robin)。谁都不会多给消息,总是你一个我一个。
另一种分发方式叫公平分发(fair dispatch)。
想要做到公平分发,即谁先处理完数据谁先获得下一个数据。
必须关闭消费者的自动应答ack,改成手动应答。
使用basicQos(perfetch=1)限制每次只发送不超过1条消息到同一个消费者,消费者必须手动反馈告知队列,才会发送下一个。
channel.basic_qos(prefetch_count=1)
交换机之发布订阅
实际开发中,往往存在多个消费者,此时可以使用交换机模式。
在交换机模式中,生产者与交换机通信;
每个消费者有对应的消息队列,该消息队列与交换机进行绑定;
交换机接收到消息,将会往各个队列发送。
生产者:
import pika # 连接RabbitMQ connection = pika.BlockingConnection(pika.ConnectionParameters(host='localhost')) channel = connection.channel() # 声明一个名为logs、类型为 fanout(订阅模式) 的交换机 channel.exchange_declare(exchange='logs', exchange_type='fanout') message = "info: Hello World!" channel.basic_publish(exchange='logs', # 指定声明的交换机 routing_key='', # 不用指定 body=message) print(" [x] Sent %r" % message) connection.close()
消费者
import pika connection = pika.BlockingConnection(pika.ConnectionParameters(host='localhost')) channel = connection.channel() # 声明一个名为logs、类型为fanout的交换机 channel.exchange_declare(exchange='logs', exchange_type='fanout') # 创建消息队列 result = channel.queue_declare("",exclusive=True) # 不指定队列名称,系统将会自动生成唯一的名称 queue_name = result.method.queue # 取得消息队列的名称 # 将指定队列绑定到交换机上 channel.queue_bind(exchange='logs', queue=queue_name) print(' [*] Waiting for logs. To exit press CTRL+C') def callback(ch, method, properties, body): print(" [x] %r" % body) channel.basic_consume(queue=queue_name, auto_ack=True, on_message_callback=callback) channel.start_consuming()
交换机之关键字模式
上面发布订阅模式中,没有指定关键字,即交换机每一次获取消息,都会给每一个绑定它的队列传送。
交换机提供了一个关键字模式,队列在绑定交换机时,可以指定一个关键字,
而生产者往交换机传送数据时,也需要给每一条数据指定一个关键字,
只有关键字与队列匹配,该消息才会被传送。
# 生产者 import pika connection = pika.BlockingConnection(pika.ConnectionParameters(host='localhost')) channel = connection.channel() # 注意这里的exchange_type参数,direct为关键字模式 channel.exchange_declare(exchange='logs2', exchange_type='direct') message = "info: Hello Yuan!" channel.basic_publish(exchange='logs2', routing_key='info', # 指定此次数据的关键字 body=message) print(" [x] Sent %r" % message) connection.close()
消费者
import pika import sys connection = pika.BlockingConnection(pika.ConnectionParameters(host='localhost')) channel = connection.channel() channel.exchange_declare(exchange='logs2', exchange_type='direct') result = channel.queue_declare("",exclusive=True) queue_name = result.method.queue severities = sys.argv[1:] if not severities: sys.stderr.write("Usage: %s [info] [warning] [error]\n" % sys.argv[0]) sys.exit(1) for severity in severities: channel.queue_bind(exchange='logs2', queue=queue_name, routing_key=severity) # 指定关键字 print(' [*] Waiting for logs. To exit press CTRL+C') def callback(ch, method, properties, body): print(" [x] %r" % body) channel.basic_consume(queue=queue_name, auto_ack=True, on_message_callback=callback) channel.start_consuming()
交换机之通配符模式
通配符交换机与之前的路由模式相比,它将信息的传输类型的key更加细化,以“key1.key2.keyN….”的模式来指定信息传输的key的大类型和大类型下面的小类型,让消费者可以更加精细的确认自己想要获取的信息类型。
而在消费者一端,不用精确指定具体到哪一个大类型下的小类型的key,而是可以使用类似正则表达式(但与正则表达式规则完全不同)的通配符在指定一定范围或符合某一个字符串匹配规则的key,来获取想要的信息。
“通配符交换机”(Topic Exchange)将路由键和某模式进行匹配。
此时队列需要绑定在一个模式上。
符号“#”匹配一个或多个词,符号“*”仅匹配一个词。
因此“audit.#”能够匹配到“audit.irs.corporate”,但是“audit.*”只会匹配到“audit.irs”。
(这里与我们一般的正则表达式的“*”和“#”刚好相反,这里我们需要注意一下。)
生产者:
# 生产者 import pika connection = pika.BlockingConnection(pika.ConnectionParameters(host='localhost')) channel = connection.channel() channel.exchange_declare(exchange='logs3', exchange_type='topic') message = "info: Hello ERU!" channel.basic_publish(exchange='logs3', routing_key='europe.weather', body=message) print(" [x] Sent %r" % message) connection.close()
消费者:
# 消费者 import pika import sys connection = pika.BlockingConnection(pika.ConnectionParameters(host='localhost')) channel = connection.channel() channel.exchange_declare(exchange='logs3', exchange_type='topic') result = channel.queue_declare("",exclusive=True) queue_name = result.method.queue channel.queue_bind(exchange='logs3', queue=queue_name, routing_key="#.news") print(' [*] Waiting for logs. To exit press CTRL+C') def callback(ch, method, properties, body): print(" [x] %r" % body) channel.basic_consume(queue=queue_name, auto_ack=True, on_message_callback=callback) channel.start_consuming()
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律