docker file

更准确的理解，或英文水平好的，建议直接看官方文档https://docs.docker.com/engine/reference/builder/，因为每个人的英语水平不同，理解能力不同。这节应该是比较难的一节，也是比较重要一节。

Dockerfile是个文本文件，这个文件就以“Dockerfile”命名（至少默认就叫这个名子，而且就在软件的要目录下，可以在docker built时通过-f参数来指定这个Dockerfile的位置和名子）,Docker能通过读取这个文件里的指令集来自动创建一个镜像。然后使用docker build命令，我们能创建出一个能执行一系列指令的镜像。

格式：

# Comment使用“#”注释
INSTRUCTION arguments
指令　　　　　　参数

指令是不分大小写的。（这个是我看了官方文档才知道，因为网上各大神都是指令大写的。）入乡随俗，国际惯例，指令大写，那就指令大写吧。

所有指令顶格编写。

错误示范

无效的，因为使用了换行符

# direc \
tive=value

无效的，因为使用了两次

# directive=value1
# directive=value2

FROM ImageName

被当作注释，因为在一个构建指令之后。

FROM ImageName
# directive=value

被当作注释，因为前面还有注释。

# About my dockerfile
# directive=value
FROM ImageName

一个是未被识别的指令，会被当成注释，而下面那个却因为上面那个成了注释，尽管这是一个能被识别的指令，但也是被当作注释。

# unknowndirective=value
# knowndirective=value

以下的效果是一样的，空格不影响

#directive=value
# directive =value
#	directive= value
# directive = value
#	  dIrEcTiVe=value

escape转义，如果没有特殊指定，如下操作。那么系统默认“\”为作转义字符。

# escape=\ or # escape=`

ENV

Environment replacement 环境置换

环境参数使用ENV来声明

ENV 设计环境变量。它们使用键值对，增加运行程序的灵活性。

ENV <key> <value>
ENV <key>=<value> ...

环境变理，可以使用$variable_name 或 ${variable_name}来表示。这些变量与shell有点类似。

如：

${variable:-word} 表示如果变量有东西就直接显示，如果为空，就使用word来代替
${variable:+word} 表示如果变量为word就显示word，否则，就为空。

要注意以下情况

ENV abc=hello
ENV abc=bye def=$abc
ENV ghi=$abc

def的结果是hello而不是bye，ghi的结果是bye。因为是不同部分的指令。

其它例子

ENV myName="John Doe" myDog=Rex\ The\ Dog \
    myCat=fluffy
ENV myName John Doe
ENV myDog Rex The Dog
ENV myCat fluffy

.dockerignore文件。一个被命名为.dockerignore的隐藏文件，如果他存在，Docker就会去找这个文件里的内容，出现在这个文件里的路径都会被忽略。

以下是一些.dockerignore的例子。

# comment
*/temp*
*/*/temp*
temp?

可使用通配符。

解析指令

在这个Dockerfile里的指令有：ADD，COPY，ENV，EXPOSE，FROM，LABEL，STOPSIGNAL，USER，VOLUME，WORKDIR

FROM

所有的Dockfile都必须以FROM命令开始。这个命令是指基于哪个镜像开始创建。下面是常见命令总表

FROM <image> [AS <name>]
or
FROM <image>[:<tag>] [AS <name>]
or
FROM <image>[@<digest>] [AS <name>]

ARG构建参数

ARG <arg name> [=<defaults value>]

ARG必须在FROM之前来声明参数，在后面的构建中是不会用到这个变量的。然后只有定义过的ARG才能在docker built 中使用--build-arg<参数名>=<值>
来覆盖。

在一个Dockerfile里面，可出现多次FROM指令。

除了选择现有镜像为基础镜像外，Docker 还存在一个特殊的镜像，名为 scratch。这个镜像是虚拟的概念，并不实际存在，它表示一个空白的镜像。如果你以 scratch 为基础镜像的话，意味着你不以任何镜像为基础，接下来所写的指令将作为镜像第一层开始存在。

RUN/CMD/ENTRYPOINT

RUN

RUN <command>在shell或者exec的环境下要执行的命令。
RUN <command> (shell form, the command is run in a shell, which by default is /bin/sh -c on Linux or cmd /S /C on Windows)
RUN ["executable", "param1", "param2"] (exec form)

使用一次RUN就等于创建一层。所以链接使用RUN是没有必要的，要使用换行加&&的形式来表示

例如：

FROM debian:jessie

RUN apt-get update
RUN apt-get install -y gcc libc6-dev make
RUN wget -O redis.tar.gz "http://download.redis.io/releases/redis-3.2.5.tar.gz"
RUN mkdir -p /usr/src/redis
RUN tar -xzf redis.tar.gz -C /usr/src/redis --strip-components=1
RUN make -C /usr/src/redis
RUN make -C /usr/src/redis install

可替换成
FROM debian:jessie

RUN buildDeps='gcc libc6-dev make' \
    && apt-get update \
    && apt-get install -y $buildDeps \
    && wget -O redis.tar.gz "http://download.redis.io/releases/redis-3.2.5.tar.gz" \
    && mkdir -p /usr/src/redis \
    && tar -xzf redis.tar.gz -C /usr/src/redis --strip-components=1 \
    && make -C /usr/src/redis \
    && make -C /usr/src/redis install \
    && rm -rf /var/lib/apt/lists/* \
    && rm redis.tar.gz \
    && rm -r /usr/src/redis \
    && apt-get purge -y --auto-remove $buildDeps

这个我是参考https://github.com/yeasy/docker_practice/blob/master/image/build.md

首先，之前所有的命令只有一个目的，就是编译、安装 redis 可执行文件。因此没有必要建立很多层，这只是一层的事情。因此，这里没有使用很多个 RUN 对一一对应不同的命令，而是仅仅使用一个 RUN 指令，并使用 && 将各个所需命令串联起来。将之前的 7 层，简化为了 1 层。在撰写 Dockerfile 的时候，要经常提醒自己，这并不是在写 Shell 脚本，而是在定义每一层该如何构建。

并且，这里为了格式化还进行了换行。Dockerfile 支持 Shell 类的行尾添加 \ 的命令换行方式，以及行首 # 进行注释的格式。良好的格式，比如换行、缩进、注释等，会让维护、排障更为容易，这是一个比较好的习惯。

此外，还可以看到这一组命令的最后添加了清理工作的命令，删除了为了编译构建所需要的软件，清理了所有下载、展开的文件，并且还清理了 apt 缓存文件。这是很重要的一步，我们之前说过，镜像是多层存储，每一层的东西并不会在下一层被删除，会一直跟随着镜像。因此镜像构建时，一定要确保每一层只添加真正需要添加的东西，任何无关的东西都应该清理掉。

很多人初学 Docker 制作出了很臃肿的镜像的原因之一，就是忘记了每一层构建的最后一定要清理掉无关文件。

CMD 容器启动命令的三种形式，但CMD只能使用一次，多个CMD会抵消之前的指令。
CMD ["executable","param1","param2"](推荐这种json格式，要使用双引号，不使用单引号。）
CMD ["param1","param2"]作为一个参数向ENTRYPOINT传递
CMD command param1 param2

ENTRYPOIONT 配置容器一个可执行的命令与CMD比较相似，也是只能使用一次，多个命令会抵消之前的。它有两种形式
ENTRYPOIONT ["executable","param1","param2"]
ENTRYPOIONT command param1 param2

CMD

Docker 不是虚拟机，容器就是进程。既然是进程，那么在启动容器的时候，需要指定所运行的程序及参数。CMD 指令就是用于指定默认的容器主进程的启动命令的。

如果我们直接 docker run -it ubuntu 的话，会直接进入 bash。我们也可以在运行时指定运行别的命令，如 docker run -it ubuntu cat /etc/os-release。这就是用 cat /etc/os-release 命令替换了默认的 /bin/bash 命令了，输出了系统版本信息。推荐这种json格式，要使用双引号，不使用单引号。还有需要了解清命令启动容器，容器里的东西就生效，要是命令结束了，容器就生命周期就结束。所以要启动一个类似于service nginx start的命令时，实际是在运行init.d下的一个nginx的脚本。而执行这个脚本是sh 。当这个脚本被执行完后，程序就结束，容器就会被销毁。所以应该直接运行nginx命令。

ENTRYPOINT

这节参考来源于https://github.com/yeasy/docker_practice/blob/master/image/dockerfile/entrypoint.md

ENTRYPOINT ["executable", "param1", "param2"] (exec form, preferred)
ENTRYPOINT command param1 param2 (shell form)

ENTRYPOINT 命令格式和RUN一样，而其目的和 CMD 一样，都是在指定容器启动程序及参数。ENTRYPOINT 在运行时也可以替代，不过比 CMD 要略显繁琐，需要通过 docker run 的参数 --entrypoint 来指定。当我们定义了ENTRYPOINT后，CMD的含意就发生了改变，变成把CMD的内容作为参数传给ENTRYPOINT

<ENTRYPOINT> "<CMD>"

例子1：让镜像变成像命令一样使用

假设我们需要一个得知自己当前公网 IP 的镜像，那么可以先用 CMD 来实现：

FROM ubuntu:16.04
RUN apt-get update \
    && apt-get install -y curl \
    && rm -rf /var/lib/apt/lists/*
CMD [ "curl", "-s", "http://ip.cn" ]

假如我们使用 docker build -t myip . 来构建镜像的话，如果我们需要查询当前公网 IP，只需要执行：

$ docker run myip
如果再试
$ docker run myip -i 报错

改成

FROM ubuntu:16.04
RUN apt-get update \
    && apt-get install -y curl \
    && rm -rf /var/lib/apt/lists/*
ENTRYPOINT [ "curl", "-s", "http://ip.cn" ]

则正常。其实每个一外来的参数就是一个CMD。之前使用CMD电把参数替换了CMD的位置，而ENTRYPOINT则是把CMD当成参数来替换他的参数部分。

场景二：应用运行前的准备工作

启动容器就是启动主进程，但有些时候，启动主进程前，需要一些准备工作。

比如 mysql 类的数据库，可能需要一些数据库配置、初始化的工作，这些工作要在最终的 mysql 服务器运行之前解决。

此外，可能希望避免使用 root 用户去启动服务，从而提高安全性，而在启动服务前还需要以 root 身份执行一些必要的准备工作，最后切换到服务用户身份启动服务。或者除了服务外，其它命令依旧可以使用 root 身份执行，方便调试等。

这些准备工作是和容器 CMD 无关的，无论 CMD 为什么，都需要事先进行一个预处理的工作。这种情况下，可以写一个脚本，然后放入 ENTRYPOINT 中去执行，而这个脚本会将接到的参数（也就是 <CMD>）作为命令，在脚本最后执行。比如官方镜像 redis 中就是这么做的：

FROM alpine:3.4
...
RUN addgroup -S redis && adduser -S -G redis redis
...
ENTRYPOINT ["docker-entrypoint.sh"]

EXPOSE 6379
CMD [ "redis-server" ]

EXPOSE 6379 CMD [ "redis-server" ] 可以看到其中为了 redis 服务创建了 redis 用户，并在最后指定了 ENTRYPOINT 为 docker-entrypoint.sh 脚本。

#!/bin/sh
...
# allow the container to be started with `--user`
if [ "$1" = 'redis-server' -a "$(id -u)" = '0' ]; then
    chown -R redis .
    exec su-exec redis "$0" "$@"
fi

exec "$@"

该脚本的内容就是根据 CMD 的内容来判断，如果是 redis-server 的话，则切换到 redis 用户身份启动服务器，否则依旧使用 root 身份执行。比如：

$ docker run -it redis id uid=0(root) gid=0(root) groups=0(root)

MAINTAINER <author name>镜像作者，从官方文档来看，这个参数是过时的，不建议使用的。官方提出使用标签来代替这个指令

MAINTAINER <name>
使用标签来代替这个指令
LABEL maintainer="SvenDowideit@home.org.au"

EXPOSE

暴露端口，指定容器在运行时监听的端口。不知道为什么在容器里喜欢说暴露。

EXPOSE <port> [<port>...]

ADD/COPY

ADD <src>... <dest>
ADD ["<src>",... "<dest>"](推荐这种，即使有空格也好使）

ADD hom* /mydir/        # 复制所有以hom开头的文件
ADD hom?.txt /mydir/    # ? 能代替任意一个字符e.g., "home.txt"

ADD test relativeDir/          # 把"test" 复制到`WORKDIR`/relativeDir/
ADD test /absoluteDir/         # 把"test" 复制到绝对路径/absoluteDir/

有特殊字符即需要转义。
ADD arr[[]0].txt /mydir/    # copy a file named "arr[0].txt" to /mydir/

COPY <src>... <dest>
COPY ["<src>",... "<dest>"]
COPY hom* /mydir/
COPY hom?.txt /mydir/

目标路径可以是容器内的绝对路径，也可以是相对于工作目录的相对路径。工作目录可使用WORKDIR来设定。
使用 COPY 指令，源文件的各种元数据都会保留。比如读、写、执行权限、文件变更时间等。这个特性对于镜像定制很有用。特别是构建相关文件都在使用 Git 进行管理的时候。
与ADD不同的是，ADD支持 URL。这个时候Docker会试图下载这个链接的文件放到目标路径。被下载的文件权限为600。如果需要调整权限需要使用RUN命令来调整。
如果<源路径>为一个tar压缩文件，压缩格式为gzip/bzip2/xz的话，ADD指令会自动解压文件到<目标路径>去
因此在 COPY 和 ADD 指令中选择的时候，可以遵循这样的原则，所有的文件复制均使用 COPY 指令，仅在需要自动解压缩的场合使用 ADD。

VOLUME定义匿名卷

这是比较重要一节，这是关系到数据持久化的问题。

VOLUME ["/data"]
例：
FROM ubuntu
RUN mkdir /myvol
RUN echo "hello world" > /myvol/greeting
VOLUME /myvol

这样的操作是自动挂载匿名卷，这样任何写在/data中的信息都不会记录在容器存储层。也可以在运行的时候代替这个data

在这里，我们可以定义，web目录、定义配置目录、定义数据库目录、定义日志目录等。

USER

USER <user>[:<group>] or
USER <UID>[:<GID>]

改变环境状态，影响到以后的层，使RUN/CMD/ENTRPOINT使用指定身份运行。

WORKDIR

WORKDIR 指定RUN/CMD/ENTRYPOINT命令的工作目录。
WORKDIR /PATH/TO/WORKDIR

用来设定RUN, CMD, ENTRYPOINT, COPY 和 ADD这些操作的默认路径。其参数如果是相对路径，则是相对于workdir的路径

WORKDIR /a
WORKDIR b
WORKDIR c
RUN pwd
=》/a/b/c

ONBUILD

ONBUILD [INSTRUCTION]

这个命令后面接其RUN/COPY等指令，但个在当前镜像构建时并不会执行，而是在下次构建时才会执行的。

HEALTHCHECK

HEALTHCHECK 设置检查容器的健康情况
HEALTHCHECK [option] <command>
HEALTHCHECK NONE：如果基础镜像有健康检查指令，使用这行可以屏蔽掉其健康检查指令

LABEL标签

LABEL <key>=<value> <key>=<value> <key>=<value> ...

标签指令能为镜像增加元数据，一个标签就是一个键值对。
可以使用引号或反斜杠。

举个粟子：

LABEL "com.example.vendor"="ACME Incorporated"
LABEL com.example.label-with-value="foo"
LABEL version="1.0"
LABEL description="This text illustrates \
that label-values can span multiple lines."

一个镜像，可以有一个或多个标签，多个标签也可以写成一个命令行。例如：

LABEL multi.label1="value1" multi.label2="value2" other="value3"
等效于
LABEL multi.label1="value1" \
      multi.label2="value2" \
      other="value3"

posted @ 2017-08-04 17:18 gorgage 阅读(583) 评论(0) 编辑收藏举报

刷新页面返回顶部

gorgage

docker file

公告