Docker-数据管理
生产环境中使用Docker的过程中,往往需要对数据进行持久化,或者需要在多个容器之间进行数据共享,这必然涉及容器的数据管理操作。
容器中管理数据主要有两种方式
数据卷(Data Volumns):容器内数据直接映射到本地主机环境
数据卷容器(Data Volumns Contains):使用特定容器维护数据卷
数据卷
数据卷是一个可供容器使用的特殊目录,它将主机操作系统目录直接映射进容器,类似于Linux中的mount操作
数据卷可以提供很多有用的特性,如下
1. 数据卷可以在容器之间共享和重用,容器间传递数据将变得高效方便
2. 对数据卷内数据的修改会立马生效,无论是容器内操作还是本地操作
3. 对数据卷的更新不会影响镜像,解耦了应用和数据
4. 卷会一直存在,直到没有容器使用,可以安全地卸载它
在容器内创建一个数据卷
在用docker –run命令的时候,使用-v标记可以在容器内创建一个数据卷。多次重复使用-v标记可以创建多个数据卷
下面使用training/webapp镜像创建一个web容器,并创建一个数据卷挂载到容器的/webapp目录
FengZhen$ docker run -d -P --name web -v /webapp training/webapp python app.py Unable to find image 'training/webapp:latest' locally latest: Pulling from training/webapp e190868d63f8: Pull complete 909cd34c6fd7: Pull complete 0b9bfabab7c1: Pull complete a3ed95caeb02: Pull complete 10bbbc0fc0ff: Pull complete fca59b508e9f: Pull complete e7ae2541b15b: Pull complete 9dd97ef58ce9: Pull complete a4c1b0cb7af7: Pull complete Digest: sha256:06e9c1983bd6d5db5fba376ccd63bfa529e8d02f23d5079b8f74a616308fb11d Status: Downloaded newer image for training/webapp:latest 7e2b2d3e48f71944f1c4d6d639f457688e1393e53aed347b40814b99df909056
-P是将容器服务暴露的端口,自动映射到本地主机的临时端口
挂载一个主机目录作为数据卷
使用-v标记也可以指定挂载一个本地的已有目录到容器中去作为数据卷(推荐方式)
FengZhen$ docker run -d -P --name web -v /Users/FengZhen/Desktop/积累/docker:/opt/webapp training/webapp python app.py 43bb3babe90603a941eaab0bd6f08b216face887c8481a5f3022319b6219f415 FengZhen$ docker run -d -v /usr/bin:/test ubuntu:latest /bin/sh -c "while true;do echo fz; sleep 1;done" 0dc0e44cf47d504900ebe65f0b763caecc640c6fcf67572175fb0ef76a5f7ece
进入容器查看
FengZhen$ docker exec -it 0dc0e44cf47d /bin/bash root@0dc0e44cf47d:/# ls bin boot dev etc home lib lib64 media mnt opt proc root run sbin srv sys test tmp usr var root@0dc0e44cf47d:/# ls /test/ '[' chcon csplit factor hd kube-reset.sh logname lzless nsenter prlimit seq split truncate updatedb whereis xzless '[[' chmem curl fallocate head kube-restart.sh look lzma nslookup procan setarch ssl_client tsort upgrade.sh which xzmore
发现有一个test目录,test目录下是本地/usr/bin下的数据
用户可以将一些程序或数据放到本地目录中,然后再容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,docker会自动创建
Docker挂载数据卷的默认权限是读写(rw),用户也可以通过ro指定为只读
docker run -d -v /usr/bin:/test:ro ubuntu:latest /bin/sh -c "while true;do echo fz; sleep 1;done"
加了ro之后,容器内对锁挂在数据卷内的数据就无法修改了
数据卷容器
如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方式是使用数据卷。数据卷容器也是一个容器,但是它的目的是专门用来提供数据卷供其他容器挂载
首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata
FengZhen$ docker run -it -v /dbdata --name dbdata ubuntu root@c388eb9ba56c:/# ls bin boot dbdata dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var
然后,可以在其它容器中使用—volumns-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷
FengZhen$ docker run -it --volumes-from dbdata --name db1 ubuntu root@e03020fc3a00:/# ls bin boot dbdata dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var root@e03020fc3a00:/# exit exit FengZhen$ docker run -it --volumes-from dbdata --name db2 ubuntu root@9c4c7382edf2:/# ls bin boot dbdata dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var
此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到
例如,在dbdata容器中创建一个test文件
root@c388eb9ba56c:/dbdata# touch test root@c388eb9ba56c:/dbdata# ls test
在db2容器内查看
root@9c4c7382edf2:/# cd dbdata/ root@9c4c7382edf2:/dbdata# ls test
可以多次使用--volumns-from参数来从多个容器挂载多个数据卷。还可以从其他已经挂载了容器卷的容器来挂载数据卷
FengZhen$ docker run -d --name db3 --volumes-from db1 training/postgres Unable to find image 'training/postgres:latest' locally latest: Pulling from training/postgres a3ed95caeb02: Pull complete 6e71c809542e: Pull complete 2978d9af87ba: Pull complete e1bca35b062f: Pull complete 500b6decf741: Pull complete 74b14ef2151f: Pull complete 7afd5ed3826e: Pull complete 3c69bb244f5e: Pull complete d86f9ec5aedf: Pull complete 010fabf20157: Pull complete Digest: sha256:a945dc6dcfbc8d009c3d972931608344b76c2870ce796da00a827bd50791907e Status: Downloaded newer image for training/postgres:latest 8d0cf0041b3a61570ca03eb19594da985e4a1a2be1f0d24aa918ac0adf0b28f0 FengZhen$ docker exec -it 8d0cf0041b3a /bin/bash root@8d0cf0041b3a:/# ls bin boot dbdata dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var root@8d0cf0041b3a:/# cd dbdata/ root@8d0cf0041b3a:/dbdata# ls test
使用—volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态
如果删除了挂载的容器(包括dbdata、db1、db2),数据卷并不会自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm –v命令来指定同时删除关联的容器
利用数据卷容器来迁移数据
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移
1. 备份
docker run --volumes-from dbdata -v $(pwd):/backup --name worker ubuntu tar cvfP /backup/backup.tar /dbdata
首先,利用Ubuntu镜像创建一个容器worker
--volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷)
使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录
容器启动后,使用tar vcfP /backup/backup.tar /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar
FengZhen$ ls
backup.tar
2. 恢复
如果要将数据恢复到一个容器,可以按照下面的步骤操作。首先创建一个带有数据卷的容器dbdata2
FengZhen$ docker run -v /dataBackup --name dbdata2 ubuntu /bin/bash
然后创建另一个新的容器,挂载dbdata2容器,并使用untar解压备份文件到所挂载的容器中
FengZhen$ docker run --volumes-from dbdata2 -v $(pwd):/backup --name untar ubuntu tar -xvPf /backup/backup.tar
测试,新建一个容器,将untar容器挂载到新容器上
FengZhen$ docker run -it --volumes-from untar --name untardata ubuntu /bin/bash root@35d6a16f1f3f:/# ls backup bin boot dbdata dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var root@35d6a16f1f3f:/# cd dbdata/ root@35d6a16f1f3f:/dbdata# ls test