RabbitMQ概念

1.RabbitMQ的概念

RabbitMQ是一个消息中间件:它接受并转发消息。
你可以把它当做一一个快递站点,当你要发送一个包裹时，你把你的包裹放到快递站，快递员最终会把你的快递送到收件人那里
按照这种逻辑RabbitMQ是一个快递站，一个快递员帮你传递快件。
RabitMQ与快递站的主要区别在于,它不处理快件而是接收,存储和转发消息数据。

2.四大核心概念

生产者
产生数据发送消息的程序是生产者
交换机
交换机是RabbitMQ非常重要的一个部件，
一方面它接收来自生产者的消息，另一方面它将消息推送到队列中。
交换机必须确切知道如何处理它接收到的消息，是将这些消息推送到特定队列还是推送到多个队列，亦或者是把消息丢弃，这个由交换机类型决定
队列
队列是RabbitMQ内部使用的一种数据结构,尽管消息流经RabbitMQ和应用程序,但它们只能存储在队列中。
队列仅受主机的内存和磁盘限制的约束，本质上是一个大的消息缓冲区。
许多生产者可以将消息发送到一个队列，许多消费者可以尝试从一个队列接收数据。这就是我们使用队列的方式
消费者
消费与接收具有相似的含义。消费者大多时候是一个等待接收消息的程序。
请注意生产者，消费者和消息中间件很多时候并不在同一机器上。同一个应用程序既可以是生产者又是可以是消费者。

3.RabbitMQ核心部分

1 Hello World简单模式

2 Work queues工作队列模式

消费者竞争资源

3 Publish/Subscribe发布订阅模式

4 Routing路由模式

5 Topics主题模式

6 Publisher Confirms发布确认模式

4.工作原理

Broker:接收和分发消息的应用，RabbitMQ Server就是Message Broker
Virtual host:出于多租户和安全因素设计的，把AMQP的基本组件划分到一个虚拟的分组中，类似于网络中的namespace概念。
当多个不同的用户使用同一个RabbitMQ server提供的服务时,可以划分出多个vhost,每个用户在自己的vhost创建exchange/ queue等
Connention: publisher / consumer和broker之间的TCP连接
Channel信道:如果每一次访问RabbitMQ 都建立一个Connection,在消息量大的时候建立TCPConnection的开销将是巨大的，效率也较低。
Channel是在connection内部建立的逻辑连接,如果应用程序支持多线程，通常每个thread创建单独的channel进行通讯，
AMQP method包含了channel id帮助客户端和message broker识别channel, 所以channel之间是完全隔离的。
Channel 作为轻量级的Connection极大减少了操作系统建立TCP connection的开销
Exchange: message 到达broker的第一站，根据分发规则，匹配查询表中的routing key,分发消息到queue中去。
常用的类型有: direct (point to point), topic (publish-subscibe) and fanout(multicast)
Queue：队列，每个消息投入到一个或多个队列
Binding:绑定，将exchange和queue按照路由规则绑定起来
RoutingKey: 路由关键字

4.1 消息传输

基于信道，建立在TCP上的虚拟链接，每个TCP连接上的信道无限制

5.高可用保证

RabbitMQ 是比较有代表性的，因为是基于主从（非分布式）做高可用性的，
RabbitMQ 有三种模式：单机模式、普通集群模式、镜像集群模式。

单机模式
单机模式，就是 Demo 级别的，一般就是你本地启动，没人生产用单机模式。
普通集群模式（无高可用性）
普通集群模式，意思就是在多台机器上启动多个 RabbitMQ 实例，每个机器启动一个。
你创建的 queue，只会放在一个 RabbitMQ 实例上，但是每个实例都同步 queue 的元数据（元数据可以认为是 queue 的一些配置信息，通过元数据，可以找到 queue 所在实例）。
你消费的时候，实际上如果连接到了另外一个实例，那么那个实例会从 queue 所在实例上拉取数据过来。
这种方式确实很麻烦，也不怎么好，没做到所谓的分布式，就是个普通集群。
因为这导致你要么消费者每次随机连接一个实例然后拉取数据，要么固定连接那个 queue 所在实例消费数据，前者有数据拉取的开销，后者导致单实例性能瓶颈。
而且如果那个放 queue 的实例宕机了，会导致接下来其他实例就无法从那个实例拉取，
如果你开启了消息持久化，让 RabbitMQ 落地存储消息的话，消息不一定会丢，得等这个实例恢复了，然后才可以继续从这个 queue 拉取数据。
所以这个事儿就比较尴尬了，这就没有什么所谓的高可用性，这方案主要是提高吞吐量的，就是说让集群中多个节点来服务某个 queue 的读写操作。
镜像集群模式
这种模式，才是所谓的 RabbitMQ 的高可用模式。
跟普通集群模式不一样的是，在镜像集群模式下，你创建的 queue，无论元数据还是 queue 里的消息都会存在于多个实例上
就是说，每个 RabbitMQ 节点都有这个 queue 的一个完整镜像，包含 queue 的全部数据的意思。然后每次你写消息到 queue 的时候，都会自动把消息同步到多个实例的 queue 上。
那么如何开启这个镜像集群模式呢？其实很简单，RabbitMQ 有很好的管理控制台，就是在后台新增一个策略，这个策略是镜像集群模式的策略，指定的时候是可以要求数据同步到所有
节点的，也可以要求同步到指定数量的节点，再次创建 queue 的时候，应用这个策略，就会自动将数据同步到其他的节点上去了。
这样的话，好处在于，你任何一个机器宕机了，没事儿，其它机器（节点）还包含了这个queue 的完整数据，别的 consumer 都可以到其它节点上去消费数据。
坏处在于，第一，这个性能开销也太大了吧，消息需要同步到所有机器上，导致网络带宽压力和消耗很重！
第二，这么玩儿，不是分布式的，就没有扩展性可言了，如果某个 queue 负载很重，你加机器，新增的机器也包含了这个 queue 的所有数据，并没有办法线性扩展你的 queue。你想，如果这个
queue 的数据量很大，大到这个机器上的容量无法容纳了，此时该怎么办呢？