Docker 与 K8S学习笔记(十一)—— 容器的存储
Docker为容器提供了两种存储数据的方式:
-
Storage Driver即存储驱动
-
Data Volume即数据卷
本节我们分别讨论下它们的应用。
一、Storage Driver
前面讲过容器是由一个可写的容器层加若干个只读的镜像层组成,这样的设计带来如下效果:
-
新数据直接写在容器层中;
-
修改现有的数据时会将镜像层数据复制到容器层,修改后的数据直接存储在容器层中,原有镜像层数据不变;
-
如果多个层中存在同名文件,用户只能看到最顶层中的文件。
这些都要归功于Storage Driver,正是它实现了多层数据的堆叠并为用户提供单一的合并之后的统一视图。
Docker支持多种存储驱动,包括:AUFS、Device Mapper、Btrfs、OverlayFS、VFS和ZFS。它们都能实现分层存储,但各自又有其特性,以适用于不同场景,想把每一种存储驱动的特性都搞明白并不容易,所以Docker在安装时会根据当前系统的配置选择默认存储驱动,我们通过docker info可以看到当前host中docker使用的存储驱动是哪一种:
$ sudo docker info ... Server: Containers: 1 Running: 1 Paused: 0 Stopped: 0 Images: 20 Server Version: 20.10.8 Storage Driver: overlay2 ...
对于一些无状态的应用比如busybox,将数据放在由storage driver维护的层中是比较合理的,这类应用他不需要在持久化其他数据了,我们每次都只是用它提供的工具用完便销毁容器。
二、Data Volume
Data Volume本质上是Docker Host文件系统中的目录或文件,能够直接被挂在到容器的文件系统中,Data Volume有以下特点:
-
Data Volume是文件或目录而非没有格式化的磁盘;
-
容器可以读写Data Volume的数据;
-
Data Volume的数据可以永久保存,即使容器被销毁。
在具体使用时,docker提供两种类型的volume:bind volume和docker managed volume。
三、bind volume
bind volume是将host上已存在的目录或文件mount到容器,例如,我们在host上创建htdocs目录并增加一个index.html:
$ mkdir htdocs $ vim htdocs/index.html
我们的index.html内容如下:
<html> <head> <title>demo index</title> </head> <body> <h1>this is demo page</h1> <p>hahahahahahaha</p> </body> </html>
接着我们启动httpd容器,并挂载我们创建的htdocs目录,然后我们访问下主页看看效果:
$ sudo docker run -d -p 80:80 -v ~/htdocs:/usr/local/apache2/htdocs httpd fe00b987c8b7c5e37fe0898007f924da440c9ed5db8809c377566eef860b3402 $ curl http://127.0.0.1:80 <html> <head> <title>demo index</title> </head> <body> <h1>this is demo page</h1> <p>hahahahahahaha</p> </body> </html>
我们可以看到,curl的结果确实返回的是我们放在host上的页面内容,这里我们需要注意-v参数的格式:<host path>:<container path>。
如果我们修改host中的index,会有什么效果呢?我们来试一下:
$ echo "<h1>update page</h1>" > htdocs/index.html $ curl http://127.0.0.1:80 <h1>update page</h1>
我们在host中的修改生效了,bind mount可以让host与容器共享数据,这在管理上非常方便。
我们删除httpd容器看看host上的index文件是否还存在:
$ sudo docker stop fe00b987c8b7 fe00b987c8b7 $ sudo docker rm fe00b987c8b7 fe00b987c8b7 $ cat htdocs/index.html <h1>update page</h1>
可见,即使容器删除了,bind mount仍然存在,这是合理的,毕竟这些数据是host的,它只是借给容器使用,哪能随便就被干掉呢。
bind mount还可以指定数据读写权限,缺省情况下是可读可写,那我们如果指定为只读会有什么效果呢?
$ sudo docker run -d -p 80:80 -v ~/htdocs:/usr/local/apache2/htdocs:ro httpd 49bd7caad83860e11f9aae7c3c6e6d20231a0efbf6ddf226188b6001f5eea00a $ sudo docker exec -it 49bd7caad8386 bash root@49bd7caad838:/usr/local/apache2# echo "change index" > htdocs/index.html bash: htdocs/index.html: Read-only file system
我们通过ro参数设置了只读权限,这样在容器内便无法修改bind mount的数据,从而增加了安全性。
bind mount除了可以挂载目录外,也可以挂载单个文件,用法跟指定目录一样,需要注意的是,所挂载的文件在host中必须存在,不然docker会将其作为目录挂载到容器,这里就不再进行演示。
bind mount使用起来简单直观,易于理解,但它也有不足的地方:bind mount需要明确指定host文件具体路径,这就限制了容器的可移植性,当需要将容器迁移到其它host时,就容易存在问题,所以接下来我们看看移植性更好的docker managed volume。
四、docker managed volume
docker managed volume与bind mount相比最大的特点是-v参数中不用指定host path,仅指定container path即可。
$ sudo docker run -d -p 80:80 -v /usr/local/apache2/htdocs httpd caaf4e3f39ac44f49161efb707a196ca243a0768af67a266dbb9e342655fe569
我们通过-v参数告诉docker需要一个data volume,并挂载到容器/usr/local/apache2/htdocs目录下,那这个data volume在哪呢?这就需要使用docker inspect命令了:
$ sudo docker inspect caaf4e3f39ac44f49161efb707a196ca243a0768af67a266dbb9e342655fe569 [ ... "Mounts": [ { "Type": "volume", "Name": "a08419633c66a3cf522f3628b1920d8f48c4d7115a93c33f04db398945350e0b", "Source": "/var/lib/docker/volumes/a08419633c66a3cf522f3628b1920d8f48c4d7115a93c33f04db398945350e0b/_data", "Destination": "/usr/local/apache2/htdocs", "Driver": "local", "Mode": "", "RW": true, "Propagation": "" } ], ... ]
我们通过Mounts这部分信息可以看出来,
"Source": "/var/lib/docker/volumes/a08419633c66a3cf522f3628b1920d8f48c4d7115a93c33f04db398945350e0b/_data"
source就是在host上的目录,也就是说,当容器需要docker managed volume时,docker都会在host下的/var/lib/docker/volumes/目录下创建一个子目录,并将其挂载到容器中。
我们来看看这个目录下有什么东西:
$ sudo ls -l /var/lib/docker/volumes/a08419633c66a3cf522f3628b1920d8f48c4d7115a93c33f04db398945350e0b/_data total 4 -rw-r--r-- 1 504 staff 45 Jun 11 2007 index.html
我们发现这个目录下index.html和容器中的是一样的,这是为什么呢?这是因为,如果挂载的是已存在的的目录,容器中原有数据会拷贝到volume中,但是要明确一点,此时/usr/local/apache2/htdocs已经不再是由storage driver管理的层数据,它已经是一个data volume。
最后我们简单对比下bind mount和docker managed volume:
相同点:二者都是将host文件系统中某个路径挂载到容器。
不同点:
bind mount | docker managed volume | |
volume位置 | 可任意指定 | 由docker指定 |
对挂载点影响 | 隐藏并替换为volume | 原有数据拷贝到volume |
支持单个文件 | 支持 | 不支持 |
权限控制 | 可配置 | 均为读写权限 |
移植性 | 移植性弱 | 移植性强 |