Docker Swarm(一)集群部署

 

一、机器环境

  • 机器规划
172.16.0.89      swarm的manager节点      manager-node   
172.16.0.90 swarm的node节点      node1

机器版本(均是:CentOS Linux release 7.7.1908)

  • 设置主机名
在manager节点上
[root@manager-node ~]# hostnamectl --static set-hostname manager-node

在node1节点上

[root@node1 ~]# hostnamectl --static set-hostname node1

在2台机器上都要设置hosts,均执行如下命令:

vim /etc/hosts

......
172.16.0.89 manager-node
172.16.0.90 node1
  • 设置防火墙
关闭2台机器上的防火墙。如果开启防火墙,则需要在所有节点的防火墙上依次放行2377/tcp(管理端口)、7946/udp(节点间通信端口)、4789/udp(overlay 网络端口)端口。
[root@manager-node ~]# systemctl disable firewalld.service     --禁止firewall开机启动
[root@manager-node ~]# systemctl stop firewalld.service        --停止firewall
  • 安装docker

在2台机器上分别安装docker,这里使用的是【18.09.9】版本

 

 

二、创建集群

  • 创建Swarm

在 manager-node 节点上执行以下命令进行创建:

docker swarm init --advertise-addr 172.16.0.89

上面命令执行后,该机器自动加入到swarm集群。这个会创建一个集群token,获取全球唯一的 token,作为集群唯一标识。后续将其他节点加入集群都会用到这个token值(要保存好)。

其中,--advertise-addr参数表示其它swarm中的worker节点使用此ip地址与manager联系。命令的输出包含了其它节点如何加入集群的命令:

docker swarm join --token SWMTKN-1-2202mw1jwjmqq075ego96j8pomplqawtjrbpobmxlld0gjcau6-4bniw4tiqwa5j1iz02p65iqwj 172.16.0.89:2377
  • 查看集群信息

执行 docker node ls 命令查看节点信息:

docker node ls

执行 docker info 命令查看详细信息:

docker info

  •  添加节点到swarm集群中

登录到node1节点上,执行前面创建swarm集群时输出的命令:

docker swarm join --token SWMTKN-1-2202mw1jwjmqq075ego96j8pomplqawtjrbpobmxlld0gjcau6-4bniw4tiqwa5j1iz02p65iqwj 172.16.0.89:2377

如果想要将其他更多的节点添加到这个swarm集群中,添加方法如上一致!

然后在manager-node管理节点上看一下集群节点的状态:

  •  Node Availablity
swarm集群中node的availability状态可以为:
  1. active:执行现有的task,且可以接受来自manager节点新的task分派;
  2. pause:现有的task继续执行,但不能指派新的task至该node,故障排除时会用到
  3. drain:把现有的task分派给其它node,且不再接受来自manager节点的任务分派,维护时会用到

有些文章會建議維護時可以把manager node設為drain,但實際上你會需要在manager node做管理的事情,例如有monitoring tools要跑(e.g. Portainer, swarm web GUI),或是需要與swarm溝通的logging engine,這些容器可不能被停掉(drain/pause),尤其這兩個狀態如果容器出了任何問題,沒辦法重新建立,建議不要用在manager node,而是用label的方式來限制(控制)manager tasks

示例1、下线节点:
docker node update --availability drain node1

如上,当node1的状态改为drain后,那么该节点就不会接受task任务分发,就算之前已经接受的任务也会转移到别的节点上。

示例2、上线节点:

docker node update --availability active node1

再次修改为active状态(即将下线的节点再次上线)

示例3、manager只作为管理节点????

在正式的生产环境中我们都建议这么做,因为在容器编排当中,区分Worker 和Master节点的主要原因是因为Worker 只负责完成任务,启动服务,而Master则负责任务的调配,一旦Master节点也运行服务,导致Master节点负载过重,则会使集群发生崩溃,所以工作节点排除manager是很有必要的。

docker node update --availability drain manager
  • 删除节点
docker node rm --force node1

  • 离开集群

在node1节点执行以下命令离开集群:

docker swarm leave

 

 

三、部署服务

  • 设置网络

在启动容器之前,先来创建一个覆盖网络,用来保证在不同主机上的容器网络互通的网络模式

docker network create -d overlay mrp_net

查看网络是否创建成功:

docker network ls

  • 创建服务

在manager-node节点上使用上面这个覆盖网络创建相应的服务,我这里用的是自己的应用masl:

docker service create --name masl -e TZ="Asia/Shanghai" --network mrp_net --replicas 2 -p 8081:8080 172.16.99.2:40305/masl:dev-yc-34

其中,--replicas 参数指定服务由几个实例组成。

使用 docker service ls 查看正在运行服务的列表:

docker service ls

使用 docker service inspect --pretty masl 查看服务信息:

docker service inspect --pretty masl

--pretty 使命令输出格式化为可读的格式,不加 --pretty 可以输出更详细的信息

使用docker service ps masl 查询到哪个节点正在运行该服务。
如下该容器被调度到manager-node节点上启动了,然后访问http://182.48.115.237即可访问这个容器应用(如果调度到其他节点,访问也是如此)
docker service ps masl

有上面命令可知,该服务分别在manager-node和node1节点上运行。分别登陆这2个节点,可以查看到masl容器在运行中

登陆manager-node节点查看:

登陆node1节点查看: 

 

 

四、总结

1、Swarm上手很简单,Docker swarm可以非常方便的创建类似kubernetes那样带有副本的服务,确保一定数量的容器运行,保证服务的高可用,但功能比较简单;

2、Swarm、Kubernetes、Messos比较:

  • Swarm的优点和缺点都是使用标准的Docker接口,使用简单,容易集成到现有系统,但是更困难支持更复杂的调度,比如以定制接口方式定义的调度。
  • Kubernetes 是自成体系的管理工具,有自己的服务发现和复制,需要对现有应用的重新设计,但是能支持失败冗余和扩展系统。
  • Mesos是低级别 battle-hardened调度器,支持几种容器管理框架如Marathon, Kubernetes, and Swarm,现在Kubernetes和Mesos稳定性超过Swarm,在扩展性方面,Mesos已经被证明支持超大规模的系统,比如数百数千台主机,但是,如果你需要小的集群,比如少于一打数量的节点服务器数量,Mesos也许过于复杂了
 
 
 
参考资料:

posted on 2020-03-06 21:03  曹伟雄  阅读(1152)  评论(1编辑  收藏  举报

导航