“AI 技术+人才”如何成为企业增长新引擎?戳此了解>>> 了解详情
写点什么

Docker 镜像优化:从 1.16GB 到 22.4MB

  • 2020-12-31
  • 本文字数:1354 字

    阅读完需:约 4 分钟

Docker镜像优化:从1.16GB到22.4MB

Docker 是一个供软件开发人员和系统管理员使用容器构建、运行和与分享应用程序的平台。容器是在独立环境中运行的进程,它运行在自己的文件系统上,该文件系统是使用 docker 镜像构建的。镜像中包含运行应用程序所需的一切(编译后的代码、依赖项、库等等)。镜像使用 Dockerfile 文件定义。


术语 dockerization 或 containerization 通常用于定义创建 Docker 容器的过程。


因为容器具备如下优点,所以很受欢迎:


  • 灵活性:即使是最复杂的应用程序也可以容器化。

  • 轻量化:容器共享主机内核,使得它们远比虚拟机高效。

  • 便携性:可以做到本地编译,到处运行。

  • 松耦合:容器自我封装,一个容器被替换或升级不会打断别的容器。

  • 安全性:容器对进程进行了严格的限制和隔离,而无需用户进行任何配置。


在这篇文章中,我将重点讨论如何优化 Docker 镜像以使其轻量化。


让我们从一个示例开始,在该示例中,我们构建了一个 React 应用程序并将其容器化。运行 npx 命令并创建 Dockerfile 之后,我们得到了如图 1 所示的文件结构。


npx create-react-app app --template typescript



图 1:文件结构


如果我们构建一个基础的 Dockerfile(如下所示),我们最终会得到一个 1.16 GB 的镜像:


FROM node:10

 

WORKDIR /app

COPY app /app

RUN npm install -g webserver.local

RUN npm install && npm run build

 

EXPOSE 3000

CMD webserver.local -d ./build



图 2:镜像的初始大小为 1.16GB


第一步优化:使用轻量化基础镜像


Docker Hub(公共 Docker 仓库)中,有一些镜像可供下载,每个镜像都有不同的特征和大小。


通常,相较于基于其他 Linux 发行版(例如Ubuntu)的镜像,基于AlpineBusyBox的镜像非常小。这是因为 Alpine 镜像和类似的其他镜像都经过了优化,其中仅包含最少的必须的软件包。在下面的图片中,你可以看到 Ubuntu、Alpine、Node 和基于 Alpine 的 Node 镜像之间的大小比较。



图 3:基础镜像的不同大小


通过修改 Dockerfile 并使用 Alpine 作为基础镜像,我们的镜像最终大小为 330MB:


FROM node:10-alpine

 

WORKDIR /app

COPY app /app

RUN npm install -g webserver.local

RUN npm install && npm run build

 

EXPOSE 3000

CMD webserver.local -d ./build


图 4:经过第一步优化后镜像大小为 330MB


第二步优化:多阶段构建


通过多阶段构建,我们可以在 Dockerfile 中使用多个基础镜像,并将编译成品、配置文件等从一个阶段复制到另一个阶段,这样我们就可以丢弃不需要的东西。


在本例中,我们部署 React 应用程序需要的是编译后的代码,我们不需要源文件,也不需要 node_modules 目录和 package.json 文件等。


通过将 Dockerfile 修改为如下内容,我们最终得到的镜像大小为 91.5MB。请记住,来自第一阶段(第 1-4 行)的镜像不会被自动删除,Docker 将它保存在 cache 中,如果我们在另一个构建镜像过程中执行了相同的阶段,就可以使镜像构建更快。所以你必须手动删除第一阶段镜像。


FROM node:10-alpine AS build

WORKDIR /app

COPY app /app

RUN npm install && npm run build

 

 

FROM node:10-alpine

WORKDIR /app

RUN npm install -g webserver.local

COPY --from=build /app/build ./build

EXPOSE 3000

CMD webserver.local -d ./build



图 5:第二步优化后的镜像大小为 91.5MB


现在我们有了一个 Dockerfile,它有两个阶段:在第一个阶段中,我们编译项目,在第二个阶段中,我们在 web 服务器上部署应用程序。然而,Node 容器并不是提供网页(HTML、CSS 和 JavaScript 文件、图片等)服务的最佳选择,最好的选择是使用像 Nginx 或 Apache 这样的服务。在本例中,我将使用 Nginx。


通过将 Dockerfile 修改为如下内容,我们的镜像最终大小是 22.4MB,如果我们运行这个容器,我们可以看到网页可以正常工作,没有任何问题(图 7)。


FROM node:10-alpine AS build

WORKDIR /app

COPY app /app

RUN npm install && npm run build

 

 

FROM nginx:stable-alpine

COPY --from=build /app/build /usr/share/nginx/html

EXPOSE 80

CMD ["nginx", "-g", "daemon off;"]



图 6:第三步优化后的镜像大小为 22.4MB



图 7:最终容器的运行结果


参考



原文链接:


https://medium.com/the-agile-crafter/docker-image-optimization-from-1-16gb-to-22-4mb-53fdb4c53311


2020-12-31 16:443469

评论 2 条评论

发布
用户头像
在构建GO服务镜像过程中,我用到了UPX,能将镜像处理到6M大小
2021-01-01 21:16
回复
用户头像
即使已经做了如此多的优化,但仅仅一个react的前端应用,都需要22MB的硬盘空间,虽然目前硬盘不值钱,但这个资源也是有点大啊。。。
2020-12-31 18:20
回复
没有更多了
发现更多内容

腾讯资深架构师整理出来的Java高级开发需要的分布式技术,简直绝了

小二,上酒上酒

Java 编程 JAVA开发

牛啊牛啊,这篇Spring Cloud Alibaba笔记一应俱全,几乎涵盖了所有操作

小二,上酒上酒

spring spring cloud alibaba

全网疯传,SpringBoot笔记(全彩版)顶翻天

程序知音

Java spring 源码 springboot 后端技术

这份神仙级Spring Security源码手册,真的很强悍

小二,上酒上酒

spring spring security springboot

【转载】Byzer + OpenMLDB 实现端到端的,基于实时特征计算的机器学习流程

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

五面腾讯,六h灵魂拷问,终拿下 58W offer

程序知音

Java 腾讯 java面试 后端技术 Java面试八股文

大型企业选择低代码的主要原因是什么?

优秀

低代码 低代码平台

ConcurrentDictionary<T,V> 的这两个操作不是原子性的

有态度的马甲

太牛了,这份Spring Cloud Alibaba学习文档清晰全面,一应俱全

小二,上酒上酒

spring Spring Cloud

还不懂Spring?阿里架构师整理的Spring宝典助你一臂之力

小二,上酒上酒

spring spring cloud ali spring宝典

Koordinator v0.7: 为任务调度领域注入新活力

阿里巴巴云原生

阿里云 云原生 Koordinator

全网独家首发Java面试题,包含Spring全家桶+高并发+Netty+Redis+Dubbo等面试专题

小二,上酒上酒

Java Linux Netty 高并发 Spring全家桶

耗时182天肝出来1015页分布式全栈手册太香了

程序知音

Java 程序员 架构 分布式 后端技术

【融云出海白皮书免费看】出海洞察之美国的「高线市场模型」

融云 RongCloud

互联网 数据 模型

阿里内部整理的Spring boot保姆级笔记,简直太牛了

小二,上酒上酒

spring springboot

活动预告 | Feature Store Summit 2022

第四范式开发者社区

机器学习 数据库 开源 时序数据库 特征

多图详解kafka生产者消息发送过程

石臻臻的杂货铺

Kafk Kafka实战 10月月更

进击的PyTorch,和它背后的开源领袖

OneFlow

人工智能 机器学习 深度学习 开源

P9力鉴!Alibaba9月最新出品776页JDK源码+并发核心原理解析小册

程序知音

Java 架构 jdk 并发编程 后端技术

Vector、ArrayList、LinkedList的区别

zarmnosaj

10月月更

澳鹏Appen田小鹏博士:以高质量数据赋能AI驱动的元宇宙时代

澳鹏Appen

人工智能 AR/VR 训练数据 元宇宙 数据训练

开源机器学习数据库 OpenMLDB:线上线下一致的生产级特征平台

第四范式开发者社区

人工智能 机器学习 数据库 特征 开源、

活动预告 | AI for Good 2022 峰会

第四范式开发者社区

机器学习 数据库 开源 时序数据库 特征

精彩演讲推荐|智能化变更防控方法、架构与组织实践

TRaaS

数据中台建设5大关键步骤

阿泽🧸

数据中台 10月月更

SAP | 在abap开发过程中常用的Tcode

暮春零贰

SAP abap 10月月更

来了来了,阿里p9整理的Netty速成笔记,应有尽有

小二,上酒上酒

Netty

双活数据中心建设要点

穿过生命散发芬芳

10月月更 双数据中心

【一Go到底】第十二天---switch

指剑

Go Goalng 10月月更

惊为天人,百度推出的Redis笔记真的太香了

小二,上酒上酒

redis 面试

阿里出品的这份Java性能调优实战手册,直接涨薪25K,真的香啊

小二,上酒上酒

Java 阿里 阿里面试

Docker镜像优化:从1.16GB到22.4MB_架构_The Agile Crafter_InfoQ精选文章