聊聊Docker镜像
本文分享自天翼云开发者社区@《聊聊Docker镜像》,作者: AE86上山了。
前言
回顾前面:
为什么需要Docker?
Docker入门为什么可以这么简单?
在上篇也同样留下一个问题:我们知道Tomcat运行起来需要Java的支持,那么我们在DockerHub拉取下来的Tomcat镜像是不是也有Java环境呢?
所以,这篇主要来讲讲Docker镜像相关的知识点!
一、简单了解Dockerfile
Dockerfile是用来构建Docker镜像的文件,是由一系列命令和参数构成的脚本。
简单来说:Dockerfile是镜像的源码。
上一篇我们pull了一份Tomcat的镜像,我们也可以去看看它的Dockerfile长的什么样:
我们随便点进去一个看一下:
我们在Dockerfile的第一行就可以发现FROM openjdk:8-jre,所以可以确定的是:在DockerHub拉取下来的Tomcat镜像一定有Java环境!
在这里我们先不说如何阅读/编写Dockerfile文件,先了解到Dockerfile是镜像的源码即可
简单来说:通过Dockerfile文件可以知道我们拉取下来的镜像究竟是怎么构建的。
二、解除镜像的疑惑
我们知道Docker Hub有很多常用的镜像,比如说Centos。我们去pull一个下来看看Docker中的Centos长啥样:
我们可以发现的是:Tomcat的SIZE竟然比Centos还要大!但按我们常规的想法,Centos的镜像可能是3或4GB(现在200M),Tomcat的镜像可能就200M(现在400M)。这是为什么呢?
如果我们在pull的时候观察得比较仔细的话,可以发现pull会拉下很多层镜像:
完全pull下来的之后,我们如果使用docker images只能查看到最终的镜像:
如果我们使用docker images -a命令的话,可以把中间层镜像都查出来:
理想效果:(在镜像列表里边除了tomcat和centos应该还夹杂着名为的镜像)
遗憾的是:博主一直没测出效果来,也就是我的镜像列表里没有的镜像(怀疑是版本的问题,我的版本是Docker版本是18.09.1,Centos的版本是CentOS Linux release 7.3.1611 。如果知道具体原因的不妨在评论区下告诉我)
Emmm,我们可以使用history命令来看看,可以发现Tomcat包含很多个镜像层
还可以发现一点:Dockerfile有多少条命令,那就有多少个镜像层
说了那么多,就想让大家知道:我们拉取下来的镜像实际上是由很多中间层镜像组成的。
再结合我们上一篇Docker入门为什么可以这么简单?,在解决Tomcat启动时一直卡住问题时,能够发现的是,我们可以使用cd, ls等基础命令,但无法使用vi命令(需要我自己去下载)。
我们可以推断出,pull下来的镜像由很多层镜像组成【这些镜像都是精简过的(甚至连vi命令都不支持)】
因为Tomcat镜像要的基础环境比Centos镜像要多,所以Tomcat镜像的SIZE比Centos要大
三、Docker镜像的特点
关于Docker镜像,有以下特点:
由Dockerfile生成
呈现层级结构
每层镜像包含:镜像文件以及镜像json元数据信息
3.1镜像呈现层级结构
联合文件系统(UnionFS)是实现Docker镜像的技术基础。在Docker中一般使用是AUFS(Another Union File System或Advanced Multilayered Unification File System)【具体还是得看宿主机用的什么系统】。
在搜索中文资料的时候,常常会发现有类似的解释:
“AUFS是一种 Union FS, 简单来说就是“支持将不同目录挂载到同一个虚拟文件系统下的文件系统”, AUFS支持为每一个成员目录设定只读(Rreadonly)、读写(Readwrite)和写(Whiteout-able)权限。Union FS 可以将一个Readonly的Branch和一个Writeable的Branch联合在一起挂载在同一个文件系统下”。
看得我一头雾水….后来去官方文档介绍AUFS:
AUFS is a union filesystem, which means that it layers multiple directories on a single Linux host and presents them as a single directory. These directories are called branches in AUFS terminology, and layers in Docker terminology
说白了,还是可以理解成:Docker的镜像的基础是联合文件系统,它支持将文件系统中的修改信息作为一次提交,并层层叠加,外界看到的是最外层的镜像。(比如外界只看到Tomcat镜像,而中间叠加了很多层镜像)
(这里只是拿AUFS说明,Docker实际上支持很多存储驱动,比如还有devicemapper,overlay2(Ubuntu的14.04.4或更高版本,16.04或更高版本), overlay,zfs
3.1.1镜像继承(共享)
Docker镜像可以通过分层来进行继承。
例如,hello-world的Dockerfile镜像FROM scratch镜像,scratch在Docker中是一个基础镜像
FROM scratch
COPY hello /
CMD ["/hello"]
Centos的Dockerfile镜像也是FROM scratch镜像:
FROM scratchADD centos-7-docker.tar.xz /LABEL org.label-schema.schema-version="1.0" \ org.label-schema.name="CentOS Base Image" \ org.label-schema.vendor="CentOS" \ org.label-schema.license="GPLv2" \ org.label-schema.build-date="20181205"CMD ["/bin/bash"]
那么Centos镜像和hello-world共享同一个基础镜像层scratch,提高了存储效率。
再说个例子,比如我们有一个Centos镜像,这个镜像大小是202M。然后,我们基于Centos镜像手动往里边添加一个Tomcat(假设这个Tomcat的大小是300M),生成一个镜像,总大小就是502M了。
如果仅仅是单纯的累加这两个镜像的大小:202M+502M=704M,但是由于镜像复用的存在,实际占用的磁盘空间大小是:202M+300M=502M
AUFS uses the Copy-on-Write (CoW) strategy to maximize storage efficiency and minimize overhead。
3.2json文件
Docker每一层镜像的json文件,都扮演着一个非常重要的角色,其主要的作用如下:
记录 Docker 镜像中与容器动态信息相关的内容
记录父子 Docker 镜像之间真实的差异关系
弥补 Docker 镜像内容的完整性与动态内容的缺失
Docker镜像的json文件可以认为是镜像的元数据信息
原文链接:http://blog.itpub.net/69900354/viewspace-2564682/