Docker核心原理之数据卷
什么是数据卷呢?在Docker启动之后,容器内的文件和宿主机是隔离开的;如果不使用docker commit操作提交容器为镜像把数据保存下来的话,数据就会因为容器的删除而丢失。而实际构建镜像的过程中,为避免镜像无法通过Dokcerfile复现不利于迁移、重新构建等情况实现是需要尽量不要使用docker commit提交镜像——这样就会导致无法保存容器数据。
为例可以保存数据,又不至于破坏镜像的可复现特性,Docker提出了数据卷的概念,即数据卷和数据卷容器。
数据卷(Data Volumes)就是是一个可供一个或多个容器使用的特殊目录,它将主机操作系统目录直接映射进容器——这样就能保证这些数据不会随着容器的删除而删除。
docker容器数据卷可以看成使我们生活中常用的u盘,它存在于一个或多个的容器中,由docker挂载到容器,但不属于联合文件系统,Docker不会在容器删除时删除其挂载的数据卷。其特点如下:
1、数据卷可以在容器之间共享或重用数据
2、数据卷中的更改可以立即生效
3、数据卷中的更改不会包含在镜像的更新中
4、数据卷默认会一直存在,即使容器被删除
5、数据卷的生命周期一直持续到没有容器使用它为止
数据卷可以分为三种类型:
1)宿主机数据卷:直接在宿主机的文件系统中但是容器可以访问(bind mount)
2)命名的数据卷:磁盘上Docker管理的数据卷,但是这个卷有个名字。
3) 匿名数据卷:磁盘上Docker管理的数据卷,因为没有名字想要找到不容易,Docker来管理这些文件。
数据卷其实都在(如果没有网络文件系统等情况下)宿主机文件系统里面的,只是第一种是在宿主机内的特定目录下,而后两种则在docker管理的目录下,这个目录一般是 /var/lib/docker/volumes/
对数据卷的管理,容器中主要提供以下两种方式:
1、数据卷:Data Volumes 容器内数据直接映射到本地主机环境
2、数据卷容器:Data Volume Containers 使用特定容器维护数据卷(对于数据保存在宿主机不是很方便的情况,专门用来放数据的数据卷容器;其不需要运行任何应用,只是一个存放数据的容器,允许其他容器挂载就可以了。)
当然也可以使用最原始的copy方式:cp命令——用于容器与主机之间的数据拷贝。使用方法如下:
宿主机文件复制到容器内:docker cp [OPTIONS] SRC_PATH CONTAINER:DEST_PATH
容器内文件复制到宿主机:docker cp [OPTIONS] CONTAINER:SRC_PATH DEST_PATH
具体可以参考Docker工具之docker-compose应用实践~Nginx反向代理 - 池塘里洗澡的鸭子 - 博客园 (cnblogs.com)
下面就进行数据卷类型分类进行实操:
CentOS8 启动后警告boot空间不足 - 池塘里洗澡的鸭子 - 博客园 (cnblogs.com)实操可知操作系统提供对硬件挂载和解挂的命令mount和umount。同样docker对数据卷也提供类似命令功能,比如:docker run -v /宿主机绝对路径目录:/容器内目录 镜像名
需要注意的是,不仅docker run 提供该功能,create/start也提供该功能参数。但是挂载数据卷,最好是通过run而非create/start创建启动容器,create/start命令创建启动容器后,再挂载数据卷相当麻烦,要修改很多配置文件,但并非不可以。同时docker官网推荐尽量进行目录挂载,不要进行文件挂载。
宿主机数据卷实操:(nginx)通过 -v 容器内路径: ro rw 改变读写权限(ro:readonly 只读,rw:readwrite 可读可写)
docker run -it -v /宿主机绝对路径目录:/容器内目录:(ro 镜像名|rw 镜像名)
以Docker应用之利用Registry搭建自用镜像加速器 - 池塘里洗澡的鸭子 - 博客园 (cnblogs.com)中示例,通过docker inspect查看mount信息:
删除容器docker-registry(docker rm $(docker stop $(docker ps -aq))),可以看到数据卷目录还是存在的:
挂载数据卷到本地不仅仅可以保存数据卷内容,在很多时候还有“奇效”。比如把程序源代码目录挂载到容器,在容器里面编译,编译成功直接在宿主机下可以找到编译好的项目。
挂载数据卷容器实操:上面挂载本地目录到容器虽然解决了数据持久化的问题,但是在迁移上还是会很麻烦。比如多个容器之间共享数据卷需要迁移时,使用挂载宿主机的文件夹的方法一起起来就会显得麻烦。
所以为例管理数据卷,可以启动一个容器专门用来存放数据卷:
docker run -d -v /var/lib/mysql --name=mysql_volume mysql:8.0 /bin/true
可以看到数据卷容器的状态是exit(0),即创建好的数据卷容器是处于停止运行的状态,因为使用 —volumes-from 参数所挂载数据卷的容器自己并不需要保持在运行状态。
命令中的/bin/true是为了覆盖原有进程并防止容器退出。
然后启动其他容器并挂载数据卷容器:
docker run -itd --name nginx01 -p 80:80 --volumes-from mysql_volume nginx
docker run -itd --name nginx02 -p 81:80 --volumes-from mysql_volume nginx
甚至可以通过nginx01来挂载后续的启动的容器。这样即使删除了所有容器,数据卷也不会消失。因为数据卷还会保存在/var/lib/docker/volumes的某个目录下,这就需要实现docker inspect命令查看volume ID:
同时可以使用docker volume子命令管理数据卷:
由于docker volum体验目前不是很友好,所以实操中通常建议指定数据卷时注意指定挂载目录以避免日后找不到数据卷。