记一次 Docker swarm - overlay network access error
背景
之前使用Docker swam 在不同的服务器 (docker host) 上面创建了service,他们之间的container通过overlay的网络通信。 昨天由于公司网络维护,其中一台服务器(我们简称 manager node)由于需要维护,暂时无法连接(大概持续了6个小时)。今天再过来,就发现container之间的通信出了问题...
分析问题
1. 首先从物理机器以及网络层面入手,检查了两台服务器彼此间的网络连接,发现没有问题。
2. 进入(work node), 发现其中的 container 里面已经无法连接到(manager node)上面的 container。
3. 在 node 之间重新创建Overlay network,并在其中建立containers(我这里使用busybox来试验),发现也无法相互通信。
解决问题
1. worker node 重新加入 swarm
#docker swarm join --token SWMTKN-1-23xxxxxxxxxxxxxxxxxxxxxxxxx <managernode-ip> 2377
2. 重新启动container
docker restart <container-name>
3. 进入 container 测试网络连接
#nslookup managerbusybox
发现可以找到指定的container,container之间的通信问题解决!
重新调用shell脚本启动服务,OK,一切恢复正常 :)
PS. 有一个奇怪的地方就是,使用命令查看swarm node 的情况:
#docker node ls
返回的 nodes 都是 active 的状态,但是事实上,彼此之前的网络通信已经出现了问题。。。这一点有点令人费解,不知道是不是bug →_→
希望有明白的童鞋可以给出解析,在此谢过!!
分类:
Docker
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现