docker环境一个奇怪的问题,容器进程正常运行,但是docker ps -a却找不到容器,也找不到镜像

一: 问题:
docker环境一个奇怪的问题,使用容器跑的进程正常提供服务,在服务器上也能看到对应的端口正在监听,但是docker ps -a却找不到容器,也找不到镜像.

查看我使用docker容器启动服务的端口 正在监听

docker images 找不到对应的镜像

docker ps -a 找不到任何容器

二: 排查过程:
1.检查docker服务状态

systemctl status docker

看到docker运行正常

  1. 检查 Docker 数据根目录
docker info | grep "Docker Root Dir"


这目录居然是 /var/snap/docker/common/var-lib-docker

在默认情况下,Docker 的数据目录是 /var/lib/docker,但这里却是 Snap 版本 的 Docker,Snap 包的文件系统布局与传统方式不同,因此数据目录被改为 /var/snap/docker/common/var-lib-docker。
这也是为什么我在执行 docker info 时,输出的 Docker Root Dir 是这个路径,而不是默认的 /var/lib/docker。所以需要针对这个路径来检查。

我的docker是使用APT安装的数据目录在/var/lib/docker下 运行一段时间后会莫名跑到/var/snap/docker/ 下,需要重新安装docker才能恢复, 这是Snap 版本的 Docker 和 传统版本的 Docker 共存互相干扰导致的,由于两者的服务名称和运行方式不同,它们可能会在重启或升级后冲突,甚至切换默认的守护进程。

三: 解决方案
要从根本上解决这个问题,需要明确选择 只保留一种 Docker 安装方式。以下是详细步骤:

步骤 1: 检查当前的 Docker 安装方式
运行以下命令确认系统中是否同时存在 Snap 和传统版本的 Docker:

snap list | grep docker

which docker

如果 snap list 显示 Docker,则 Snap 版本存在。如果 which docker 显示路径是 /usr/bin/docker,则是传统版本。
如果两者都存在,需要卸载其中一个,这里我们卸载掉snap版本。

sudo snap remove docker

卸载后 重新启动docker发现无法运行,提示 Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?

重新安装传统docker

sudo apt-get remove --purge docker docker-engine docker.io containerd runc
sudo apt-get update
sudo apt-get install -y docker-ce docker-ce-cli containerd.io

安装不成功,提示E: Sub-process /usr/bin/dpkg returned an error code (1

检查 docker.service 的依赖关系发现docker.socket 是红色的,这表示 docker.socket 服务未运行或未正确配置

sudo systemctl list-dependencies docker.service

尝试很多方法无果,决定强制重装 docker.socket

sudo apt-get remove --purge docker-ce docker-ce-cli containerd.io
sudo rm -rf /var/run/docker.sock

更新并重新安装:
sudo apt-get update
sudo apt-get install docker-ce docker-ce-cli containerd.io

安装成功

再看下我的镜像和容器,都在!

ok了

posted @ 2024-12-04 19:10  怀里的懒猫  阅读(41)  评论(0编辑  收藏  举报