我已经看到了在 Dockerfile
中使用 RUN
命令的两种不同方法,我将其命名为 v1 和 v2。
v1
每行一个命令
FROM ubuntu/latest
ENV DEBIAN_FRONTEND noninteractive
RUN apt-get update
RUN apt-get -y install php5-dev
RUN libcurl4-openssl-dev
...
v2
每行多个命令
FROM ubuntu/latest
ENV DEBIAN_FRONTEND noninteractive
RUN apt-get update && \
apt-get -y install \
php5-dev \
libcurl4-openssl-dev
...
两种方法各有优势,使用缓存的不同方法最为明显。还有什么其他原因可以使用一种方法而不是另一种方法?
注意如果这个问题被认为太含糊或太开放,我向社区的意愿低头;但是,我在这里发布它是因为我希望有好的情况可以对命令进行分组,而好的情况不会 - 我想知道它们是什么。
最佳答案
要回答这个问题,首先要了解“提交”的概念,以及 Docker 的缓存。最后,我提供一个经验法则供您使用。
提交
这是一个例子:
# Dockerfile
FROM ubuntu/latest
RUN touch /commit1
RUN touch /commit2
当您运行 docker build .
时,docker 会执行以下操作:
- 它从
ubuntu/latest
镜像启动一个容器。 - 它运行容器中的第一个命令(
touch/commit1
),并创建一个新图像。 - 它重用在 #2 中创建的镜像来启动一个新容器。
- 它在第二个容器中运行第二个命令 (
touch/commit2
),并创建一个新图像。
这里你需要了解的是,如果你将命令分组在一个 RUN
语句中,那么它们都将在同一个容器中执行,并且将对应于一个提交。
相反,如果您将命令分解为单独的 RUN
语句,它们将不会在同一个容器中运行,以后的命令将重用之前命令创建的图像。
缓存
当您运行 docker build .
时,docker 会重用之前创建的图像。换句话说,如果您编辑上述 Dockerfile 以在末尾包含 RUN touch/commit3
,并运行 docker build .
,那么 Docker 将重用 # 中创建的镜像4.
这很重要,因为当您在 Dockerfile 中包含 RUN apt-get update
时,不能保证它会在 RUN apt-get install php5
之前运行几秒钟.
就您所知,使用 RUN apt-get update
的提交可能是在一个月前创建的。 APT 缓存不再是最新的,但 Docker 仍在重用该提交。
经验法则
通常更容易将所有内容分组到单个 RUN
命令中,并在您想开始利用缓存时开始分解它(例如,加快构建过程)。
当你这样做时,只要确保你没有将必须在某个时间间隔内运行的命令分开(例如更新和升级)。
一个好的做法是避免命令的副作用(即在安装所需的软件包后清理 APT 缓存)。
结论
在您的示例中,v2
是正确的,而 v1
是错误的(因为缓存 apt-get update
会适得其反)。
关于Docker RUN 命令 : When To Group Commands, 什么时候不?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25943274/