RabbitMQ概念

1.RabbitMQ的概念

RabbitMQ是一个消息中间件:它接受并转发消息。
你可以把它当做一一个快递站点,当你要发送一个包裹时,你把你的包裹放到快递站,快递员最终会把你的快递送到收件人那里
按照这种逻辑RabbitMQ是一个快递站,一个快递员帮你传递快件。
RabitMQ与快递站的主要区别在于,它不处理快件而是接收,存储和转发消息数据。

2.四大核心概念

  • 生产者
    产生数据发送消息的程序是生产者
  • 交换机
    交换机是RabbitMQ非常重要的一个部件,
    一方面它接收来自生产者的消息, 另一方面它将消息推送到队列中。
    交换机必须确切知道如何处理它接收到的消息,是将这些消息推送到特定队列还是推送到多个队列,亦或者是把消息丢弃,这个由交换机类型决定
  • 队列
    队列是RabbitMQ内部使用的一种数据结构,尽管消息流经RabbitMQ和应用程序,但它们只能存储在队列中。
    队列仅受主机的内存和磁盘限制的约束,本质上是一个大的消息缓冲区。
    许多生产者可以将消息发送到一个队列,许多消费者可以尝试从一个队列接收数据。这就是我们使用队列的方式
  • 消费者
    消费与接收具有相似的含义。消费者大多时候是一个等待接收消息的程序。
    请注意生产者,消费者和消息中间件很多时候并不在同一机器上。同一个应用程序既可以是生产者又是可以是消费者。

3.RabbitMQ核心部分

1 Hello World简单模式

2 Work queues工作队列模式

消费者竞争资源

3 Publish/Subscribe发布订阅模式

4 Routing路由模式

5 Topics主题模式

6 Publisher Confirms发布确认模式

4.工作原理

  • Broker:接收和分发消息的应用,RabbitMQ Server就是Message Broker
  • Virtual host:出于多租户和安全因素设计的,把AMQP的基本组件划分到一个虚拟的分组中,类似于网络中的namespace概念。
    当多个不同的用户使用同一个RabbitMQ server提供的服务时,可以划分出多个vhost,每个用户在自己的vhost创建exchange/ queue等
  • Connention: publisher / consumer和broker之间的TCP连接
  • Channel信道:如果每一次访问RabbitMQ 都建立一个Connection,在消息量大的时候建立TCPConnection的开销将是巨大的,效率也较低。
    Channel是在connection内部建立的逻辑连接,如果应用程序支持多线程,通常每个thread创建单独的channel进行通讯,
    AMQP method包含了channel id帮助客户端和message broker识别channel, 所以channel之间是完全隔离的。
    Channel 作为轻量级的Connection极大减少了操作系统建立TCP connection的开销
  • Exchange: message 到达broker的第一站, 根据分发规则,匹配查询表中的routing key,分发消息到queue中去。
    常用的类型有: direct (point to point), topic (publish-subscibe) and fanout(multicast)
  • Queue:队列,每个消息投入到一个或多个队列
  • Binding:绑定,将exchange和queue按照路由规则绑定起来
  • RoutingKey: 路由关键字

4.1 消息传输

基于信道,建立在TCP上的虚拟链接,每个TCP连接上的信道无限制

5.高可用保证

RabbitMQ 是比较有代表性的,因为是基于主从(非分布式)做高可用性的,
RabbitMQ 有三种模式:单机模式、普通集群模式、镜像集群模式。

  • 单机模式
    单机模式,就是 Demo 级别的,一般就是你本地启动,没人生产用单机模式。
  • 普通集群模式(无高可用性)
    普通集群模式,意思就是在多台机器上启动多个 RabbitMQ 实例,每个机器启动一个。
    你创建的 queue,只会放在一个 RabbitMQ 实例上,但是每个实例都同步 queue 的元数据(元数据可以认为是 queue 的一些配置信息,通过元数据,可以找到 queue 所在实例)。
    你消费的时候,实际上如果连接到了另外一个实例,那么那个实例会从 queue 所在实例上拉取数据过来。
    这种方式确实很麻烦,也不怎么好,没做到所谓的分布式,就是个普通集群。
    因为这导致你要么消费者每次随机连接一个实例然后拉取数据,要么固定连接那个 queue 所在实例消费数据,前者有数据拉取的开销,后者导致单实例性能瓶颈。
    而且如果那个放 queue 的实例宕机了,会导致接下来其他实例就无法从那个实例拉取,
    如果你开启了消息持久化,让 RabbitMQ 落地存储消息的话,消息不一定会丢,得等这个实例恢复了,然后才可以继续从这个 queue 拉取数据。
    所以这个事儿就比较尴尬了,这就没有什么所谓的高可用性,这方案主要是提高吞吐量的,就是说让集群中多个节点来服务某个 queue 的读写操作。
  • 镜像集群模式
    这种模式,才是所谓的 RabbitMQ 的高可用模式。
    跟普通集群模式不一样的是,在镜像集群模式下,你创建的 queue,无论元数据还是 queue 里的消息都会存在于多个实例上
    就是说,每个 RabbitMQ 节点都有这个 queue 的一个完整镜像,包含 queue 的全部数据的意思。然后每次你写消息到 queue 的时候,都会自动把消息同步到多个实例的 queue 上。
    那么如何开启这个镜像集群模式呢?其实很简单,RabbitMQ 有很好的管理控制台,就是在后台新增一个策略,这个策略是镜像集群模式的策略,指定的时候是可以要求数据同步到所有
    节点的,也可以要求同步到指定数量的节点,再次创建 queue 的时候,应用这个策略,就会自动将数据同步到其他的节点上去了。
    这样的话,好处在于,你任何一个机器宕机了,没事儿,其它机器(节点)还包含了这个queue 的完整数据,别的 consumer 都可以到其它节点上去消费数据。
    坏处在于,第一,这个性能开销也太大了吧,消息需要同步到所有机器上,导致网络带宽压力和消耗很重!
    第二,这么玩儿,不是分布式的,就没有扩展性可言了,如果某个 queue 负载很重,你加机器,新增的机器也包含了这个 queue 的所有数据,并没有办法线性扩展你的 queue。你想,如果这个
    queue 的数据量很大,大到这个机器上的容量无法容纳了,此时该怎么办呢?
posted @ 2023-05-18 00:22  lwx_R  阅读(17)  评论(0编辑  收藏  举报