作者|徐伟

来源|尔达 Erda 公众号

简介

容器镜像类似于虚拟机镜像,封装了程序的运行环境,保证了运行环境的一致性,使得我们可以一次创建任意场景部署运行。镜像构建的方式有两种,一种是通过 docker build 执行 Dockerfile 里的指令来构建镜像,另一种是通过 docker commit 将存在的容器打包成镜像,通常我们都是使用第一种方式来构建容器镜像。

在构建 docker 容器时,我们一般希望尽量减小镜像,以便加快镜像的分发;但是不恰当的镜像构建方式,很容易导致镜像过大,造成带宽和磁盘资源浪费,尤其是遇到 daemonset 这种需要在每台机器上拉取镜像的服务,会造成大量资源浪费;而且镜像过大还会影响服务的启动速度,尤其是处理紧急线上镜像变更时,直接影响变更的速度。如果不是刻意控制镜像大小、注意镜像瘦身,一般的业务系统中可能 90% 以上的大镜像都存在镜像空间浪费的现象(不信可以尝试检测看看)。因此我们非常有必要了解镜像瘦身方法,减小容器镜像。

如何判断镜像是否需要瘦身

通常,我们可能都是在容器镜像过大,明显影响到镜像上传/拉取速度时,才会考虑到分析镜像,尝试镜像瘦身。此时采用的多是 docker image history 等 docker 自带的镜像分析命令,以查看镜像构建历史、镜像大小在各层的分布等。然后根据经验判断是否存在空间浪费,但是这种判断方式起点较高、没有量化,不方便自动化判断。当前,社区中也有很多镜像分析工具,其中比较流行的 dive 分析工具,就可以量化给出_容器镜像有效率镜像空间浪费率_等指标,如下图:



采用 dive 对一个 mysql 镜像进行效率分析,发现镜像有效率只有 41%,镜像空间浪费率高达 59%,显然需要瘦身。

如何进行镜像瘦身

当判断一个镜像需要瘦身后,我们就需要知道如何进行镜像瘦身,下面将结合具体案例讲解一些典型的镜像瘦身方法。

多阶段构建

所谓多阶段构建,实际上是允许在一个 Dockerfile 中出现多个 FROM 指令。最后生成的镜像,以最后一条 FROM 构建阶段为准,之前的 FROM 构建阶段会被抛弃。通过多阶段构建,后一个阶段的构建过程可以直接利用前一阶段的构建缓存,有效降低镜像大小。一个典型的场景是将编译环境和运行环境分离,以一个 go 项目镜像构建过程为例:

# Go语言编译环境基础镜像
FROM golang:1.16-alpine # 拷贝源码到镜像
COPY server.go /build/ # 指定工作目录
WORKDIR /build # 编译镜像时,运行 go build 编译生成 server 程序
RUN CGO_ENABLED=0 GOOS=linux GOARCH=amd64 GOARM=6 go build -ldflags '-w -s' -o server # 指定容器运行时入口程序
ENTRYPOINT ["/build/server"]

这种传统的构建方式有以下缺点:

  • 基础镜像为支持编译环境,包含大量go语言的工具/库,而运行时并不需要
  • COPY 源码,增加了镜像分层,同时有源码泄漏风险

采用多阶段构建方式,可以将上述传统的构建方式修改如下:

## 1 编译构建阶段
# Go语言编译环境基础镜像
FROM golang:1.16-alpine AS build # 拷贝源码到镜像
COPY server.go /build/ # 指定工作目录
WORKDIR /build # 编译镜像时,运行 go build 编译生成 server 程序
RUN CGO_ENABLED=0 GOOS=linux GOARCH=amd64 GOARM=6 go build -ldflags '-w -s' -o server ## 2 运行构建阶段
# 采用更小的运行时基础镜像
FROM scratch # 从编译阶段仅拷贝所需的编译结果到当前镜像中
COPY --from=build /build/server /build/server # 指定容器运行时入口程序
ENTRYPOINT ["/build/server"]

可以看到,使用多阶段构建,可以获取如下好处:

  • 最终镜像只关心运行时,采用了更小的基础镜像。
  • 直接拷贝上一个编译阶段的编译结果,减少了镜像分层,还避免了源码泄漏。

减少镜像分层

镜像的层就像 Git 的提交(commit)一样,用于保存镜像的当前版本与上一版本之间的差异,但是镜像层会占用空间,拥有的层越多,最终的镜像就越大。在构建镜像时,RUN, ADD, COPY 指令对应的层会增加镜像大小,其他命令并不会增加最终的镜像大小。下面以实际工作中的一个案例讲解如何减少镜像分层,以减小镜像大小。

背景

测试项目 mysql 镜像时,遇到了容器创建比较慢的情况,我们发现主要是因为容器镜像较大,拉取镜像时间较长,所以就打算看看 mysql 镜像为什么这么大,是否可以减小容器镜像。

镜像大小分析

通过 docker image history 查看镜像构建历史及各层大小。

镜像大小:2.9GB



其相应 Dockerfile 如下:

##
## MySQL 5.7
##
FROM centos:7
... RUN yum -y install crontabs
RUN groupadd -g ${MY_GID} -r ${MY_GROUP} && \
adduser ${MY_USER} -u ${MY_UID} -M -s /sbin/nologin -g ${MY_GROUP} # RUN wget https://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar
COPY mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar /
RUN tar -vxf /mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar
RUN rm /mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar
RUN yum clean all
RUN yum -y install libaio
RUN yum -y install numactl
RUN yum -y install net-tools
RUN yum -y install perl # RUN rpm -e --nodeps mariadb-libs-1:5.5.52-1.el7.x86_64
RUN rpm -ivh mysql-community-common-5.7.29-1.el7.x86_64.rpm
RUN rpm -ivh mysql-community-libs-5.7.29-1.el7.x86_64.rpm
RUN rpm -ivh mysql-community-client-5.7.29-1.el7.x86_64.rpm
RUN rpm -ivh mysql-community-server-5.7.29-1.el7.x86_64.rpm
RUN rm -rf mysql-community-*
RUN yum clean all ##
## Entrypoint
##
ENTRYPOINT ["/bin/bash","/docker-entrypoint.sh"]

可以发现:Dockerfile 中存在过多分散的 RUN/COPY 指令,而且还是大文件相关操作,导致了过多的镜像分层,使得镜像过大,可以尝试合并相关指令,以减小镜像分层。

合并 RUN 指令

该 Dockerfile 中 RUN 指令较多,可以将 RUN 指令合并到同一层:

RUN yum -y install crontabs && \
mv /tmp/dumb-init_1.2.5_x86_64 /usr/bin/dumb-init && \
chmod +x /usr/bin/dumb-init && \
groupadd -g ${MY_GID} -r ${MY_GROUP} && \
adduser ${MY_USER} -u ${MY_UID} -M -s /sbin/nologin -g ${MY_GROUP} && \
tar -vxf /tmp/mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar && \
yum clean all && \
yum -y install libaio numactl net-tools perl && \
rpm -ivh mysql-community-common-5.7.29-1.el7.x86_64.rpm && \
rpm -ivh mysql-community-libs-5.7.29-1.el7.x86_64.rpm && \
rpm -ivh mysql-community-client-5.7.29-1.el7.x86_64.rpm && \
rpm -ivh mysql-community-server-5.7.29-1.el7.x86_64.rpm && \
rm -rf mysql-community-* && \
rm -rf /tmp/mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar

编译后镜像大小显著下降:

镜像大小:1.92GB

COPY 指令转换合并到 RUN 指令

从上图中可以看到,一个较大的镜像层是 COPY 指令导致的,拷贝的文件较大,所以我们考虑将 COPY 指令转换合并到 RUN 指令;具体做法是将文件上传到 oss,在 RUN 指令中下载。当然也可以发现之前还有一个 RUN 指令漏掉没有合并,需要继续合并到已有 RUN 指令中。

RUN curl -o /tmp/mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar http://xxx.oss.aliyuncs.com/addon-pkgs/mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar && \
tar -vxf /tmp/mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar && \
...

编译后镜像大小显著下降:

镜像大小: 1.27GB

注意:此处主要是因为 COPY 指令操作的相关文件较大,对应层占用空间较多,才会将 COPY 指令转换合并到RUN 指令;如果其对应层占用空间较小,则只需分别合并 COPY 指令、RUN 指令,会更加清晰,而没必要将两者转换合并到一层。

减少容器中不必要的包

还是以上述 mysql 镜像为例,我们发现下载的包 mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar 包含如下 rpm 包:



而安装所需的 rmp 包只有:



删除不必要的包,用最新的最小 rpm 压缩包替换 mysql-5.7.29-1.el7.x86_64.rpm-bundle.tar 后重新编译镜像:

镜像大小: 1.19GB

镜像分析工具

前面我们通过 docker 自带的 docker image history 命令分析镜像,本节主要讲解镜像分析工具 dive 的使用,其主要特征如下:

  • 按层显示 Docker 镜像内容
  • 指出每一层的变化
  • 评估 “镜像的效率”,浪费的空间
  • 快速的构建/分析周期
  • 和 CI 集成,方便自动化检测镜像效率是否合格

镜像效率分析

之前是通过 docker image history 分析镜像体积分布,并进行镜像瘦身,此处将采用 dive 分析镜像有效率。

使用方法:dive <image_name>

优化前

原始镜像有效率: 41%,大部分镜像体积都是浪费的。

如下:

优化后

优化后镜像有效率:97%

注意:优化后,镜像分层明显减少,镜像有效率显著提高;但是此时的镜像效率提升主要是依靠减少浪费空间获取的,如果要继续优化镜像体积,需要结合镜像体积瓶颈点评估下一步优化方向。一个通常的继续优化点是:减小基础镜像体积和不必要的包。

如下所示:

番外篇:如何通过镜像恢复 Dockerfile

前面主要通过镜像分析工具分析镜像体积分布,发现浪费空间,优化镜像大小。镜像分析工具的另一个典型应用场景是:当只有容器镜像时如何通过镜像恢复 Dockerfile?

镜像构建历史查看

一般,我们可以通过 docker image history 查看镜像构建历史、镜像层及对应的构建指令,从而还原出对应Dockerfile。

注意:docker image history 查看对应的构建命令可能显示不全,需要带上 --no-trunc 选项。

这种方法有如下缺陷:

  • 一些指令信息提取不完整、不易读,如 COPY/ADD 指令,对应的操作文件用 id 表示,如下图所示。

  • 对于一些镜像层,不是通过 Dockerfile 指令构建出来的,而是直接通过修改容器内容,然后 docker commit 生成,不方便查看该层变更的文件。

借助 dive 分析工具还原

借助 dive 分析工具还原 Dockerfile,主要是因为 dive 可以指出每一层的变化,如下:

  • 可以根据 COPY 层变化内容(右侧),直观判断拷贝的文件。
  • 因为可以查看每一层的变化,所以对于 docker commit 也更容易分析相关操作对应的变动范围。



思考

镜像变胖的原因

镜像变胖的原因很多,如:

  • 无用文件,比如编译过程中的依赖文件对编译或运行无关的指令被引入到镜像
  • 系统镜像冗余文件多
  • 各种日志文件,缓存文件
  • 重复编译中间文件
  • 重复拷贝资源文件
  • 运行无依赖文件

但是一般情况是,用户可能对少量的镜像空间浪费不那么敏感;但是在操作大文件时,一些不当的指令(RUN/COPY/ADD)使用方式却很容易造成大量的空间浪费,此时尤其要注意镜像分析与镜像瘦身。

镜像瘦身难吗

对于基础镜像的减小、系统包的减小,将镜像体积从 200M 减小到 190M 等可能相对难些,此时需要对程序镜像非常熟悉,并结合专门的分析工具具体分析。但是一般场景下,镜像的浪费很可能仅仅是因为镜像构建命令的使用姿势不佳。此时结合本文的镜像瘦身方法,和 Dockerfile 最佳实践,一般都能实现镜像瘦身。

如何评价瘦身效果(镜像效率)

如果可以评价镜像的空间使用效率,一方面可以比较直观的判断哪些镜像空降浪费严重,需要瘦身;另一方面也可以对瘦身的效果进行评价。上文介绍的,镜像分析工具 dive 即可满足要求。

CI 集成

如果需要对大量镜像的体积使用效率进行把关,就必须将效率检测作为自动化流程的一环,而 dive 就比较容易集成到 CI 中,只需执行如下指令:

CI=true dive <image-name>

优化前 mysql 镜像执行结果:由上文可知,优化前实际效率值为 41%,由于默认效率阈值为 90%,所以执行失败。



优化后镜像执行结果:效率值为 97%,由于默认效率阈值为 90%,所以执行通过。



同时项目也可以根据其对镜像大小的敏感度,将镜像大小最为一个检测条件,如只有镜像大小超过 1G 时,才进行镜像效率检测,这就可以避免大量小镜像的检测,加快 CI 流程。

如何自动化的检测 Docerfile 并给出优化建议呢

结合上文,ADD/COPY/RUN 指令对应层会增加最终镜像大小,而一般镜像的构建过程包含:文件准备、文件操作等。文件准备阶段在 ADD/COPY/RUN 指令中都有可能出现;文件操作阶段主要由 RUN 指令实现,如果指令过于分散,文件操作阶段会根据 写时复制 原则,拷贝一份到当前镜像层,造成空间浪费,尤其是在涉及大文件操作时。更严重的情况是,假如对文件的操作分散在不同的 RUN 指令中,不就造成了多次文件拷贝浪费了。试想一下,如果拷贝和操作在同一层进行,不就可以避免这些文件跨层拷贝了吗。

所以有以下一些通用的优化检测方法和建议:

  • 检测 RUN 指令是否过于分散,建议合并。
  • 检测 COPY/ADD 指令是否有拷贝大文件,且在 RUN 指令中有对文件进行操作,则建议将 COPY/ADD 指令转换合并到 RUN 指令中。当然此种检测方法,仅仅只有 Dockerfile 还是不够的,还需要有上下文,才能检测相关文件的大小。

当然还有很多其他的检测方向和优化建议,有待进一步完善,欢迎添加小助手微信(Erda202106)进入交流群讨论!

参考

欢迎参与开源

Erda 作为开源的一站式云原生 PaaS 平台,具备 DevOps、微服务观测治理、多云管理以及快数据治理等平台级能力。点击下方链接即可参与开源,和众多开发者一起探讨、交流,共建开源社区。欢迎大家关注、贡献代码和 Star!

我可以减肥失败,但我的 Docker 镜像一定要瘦身成功!的更多相关文章

  1. 记录线上与本地docker镜像一致,但Dockerfile却构建失败的问题

    背景 公司新开了某个项目,我在新的服务器部署了docker环境,本着ctrl+c 和ctrl+v的惯例,直接把以前的php环境的Dockerfile文件直接复制到新项目服务器那里,结果构建失败,失败的 ...

  2. 第四章 使用Docker镜像和仓库

    第4章 使用Docker镜像和仓库 回顾: 回顾如何使用 docker run 创建最基本的容器 $sudo docker run -i -t --name another_container_mum ...

  3. 玩转docker镜像和镜像构建

    摘要 本文从个人的角度,讲述对于docker镜像和镜像构建的一些实践经验.主要内容包括利用docker hub进行在线编译,下载镜像,dind的实践,对于镜像的一些思考等.本文是对当时微信分享内容的一 ...

  4. Jenkins集成Docker镜像实现自动发布

    1. 思路&流程 Jenkins集成Docker镜像实现自动发布与Jenkins发布mavne项目思路一样总体流程 为:Jenkins 拉去远端源码 -- gitl实现应用打包 -- jenk ...

  5. 微服务架构 - 巧妙获取被墙的Docker镜像

    在国内由于种种原因,有些Docker镜像直接是获取不到的,特别是k8s中的一些镜像.本人在部署k8s中的helm组件时需要获取tiller镜像,如果直接用如下命令: docker pull gcr.i ...

  6. Docker 镜像编排并部署SpringBoot应用

    Docker-compose是一个基于Docker的编排工具,所谓编排个人理解就是将不同的镜像通过配置,组成一个新的运行环境,官方定义是:Compose is a tool for defining ...

  7. 制作自己的docker镜像

    制作自己的Docker镜像主要有如下两种方式: 1.使用docker commit 命令来创建镜像 通过docker run命令启动容器 修改docker镜像内容 docker commit提交修改的 ...

  8. doris 0.9.0版本docker镜像制作与使用

    1. 安装docker 详情请参见本人博客 2. 编译doris 详情请参见doris官网文档 3. 在编译好的doris output文件夹下编写两个Dockerfile 3.1  Dockerfi ...

  9. 004.Docker镜像管理

    一 镜像基本操作 镜像是一个包含程序运行必要依赖环境和代码的只读文件,其本质是磁盘上一系列文件的集合.它采用分层的文件系统,将每一次改变以读写层的形式增加到原来的只读文件上.镜像是容器运行的基石. 1 ...

随机推荐

  1. createContext 你用对了吗?

    目录 前言 性能问题的根源 问题1(整体重复渲染):Provider组件包裹的子组件全部渲染 问题2(局部重复渲染):使用useContext导致组件渲染 解决方案 解决问题1 解决问题2 参考 前言 ...

  2. Treevalue(0x01)——功能概述

    TreeValue--一个通用树状数据结构与函数计算库 Treevalue v1.0.0版本已经于2021年10月24日正式发布,欢迎下载体验:opendilab / treevalue. 这算是tr ...

  3. binary-tree-maximum-path-sum leetcode C++

    Given a binary tree, find the maximum path sum. The path may start and end at any node in the tree. ...

  4. Lambda-让人又爱又恨的“->"

    写在前边 聊到Java8新特性,我们第一反应想到的肯定是Lambda表达式和函数式接口的出现.要说ta到底有没有在一定程度上"优化"了代码的简洁性呢?抑或是ta在一定程度上给程序员 ...

  5. Jmeter 运行结果的csv文件生成报告

    把运行结果保存到本地,下次可以直接用结果生成测试报告. 一.首先保证脚本能正常运行 二.本地创建csv文件,用来保存运行结果 三.察看结果树,选择本地文件(上一步创建好的csv文件),保存运行结果,如 ...

  6. 3D 穿梭效果?使用 CSS 轻松搞定

    背景 周末在家习惯性登陆 Apex,准备玩几盘.在登陆加速器的过程中,发现加速器到期了. 我一直用的腾讯网游加速器,然而点击充值按钮,提示最近客户端升级改造,暂不支持充值(这个操作把我震惊了~).只能 ...

  7. 8大原则带你秒懂Happens-Before原则

    摘要:在并发编程中,Happens-Before原则是我们必须要掌握的,今天我们就一起来详细聊聊并发编程中的Happens-Before原则. 本文分享自华为云社区<[高并发]一文秒懂Happe ...

  8. 美妙绝伦面向node引用-zico图标(逐浪矢量全真图标)1.9发布

    15年前,那个农村小伙初入广告行业被讥笑没有审美 于是他狠下决心,积极研发,缔就技术之核, 再后来,那些PPT和美工er们随便怎么自好,无法让其心怵. 因为他是中华人民共和国唯一具备web.cms.o ...

  9. .Net Core微服务——Ocelot(3):超时、熔断、限流

    基本概念 超时.熔断.限流听起来好像很远,但实际上用在方方面面.很多人可能还搞不懂熔断是做什么,其实可以把熔断理解为一种防护措施.做个假设,在微服务体系下,某个下游服务响应很慢,然后随着时间推移,会有 ...

  10. 菜鸡的Java笔记 api 文档

    package 包的用法    为什么需要 package ?        为了解决类之间的重名问题        为了便于管理类:合适类位于合适的包        package 怎么用?     ...