写点什么

Docker 镜像优化:从 1.16GB 到 22.4MB

  • 2020-12-31
  • 本文字数:1354 字

    阅读完需:约 4 分钟

Docker镜像优化:从1.16GB到22.4MB

Docker 是一个供软件开发人员和系统管理员使用容器构建、运行和与分享应用程序的平台。容器是在独立环境中运行的进程,它运行在自己的文件系统上,该文件系统是使用 docker 镜像构建的。镜像中包含运行应用程序所需的一切(编译后的代码、依赖项、库等等)。镜像使用 Dockerfile 文件定义。


术语 dockerization 或 containerization 通常用于定义创建 Docker 容器的过程。


因为容器具备如下优点,所以很受欢迎:


  • 灵活性:即使是最复杂的应用程序也可以容器化。

  • 轻量化:容器共享主机内核,使得它们远比虚拟机高效。

  • 便携性:可以做到本地编译,到处运行。

  • 松耦合:容器自我封装,一个容器被替换或升级不会打断别的容器。

  • 安全性:容器对进程进行了严格的限制和隔离,而无需用户进行任何配置。


在这篇文章中,我将重点讨论如何优化 Docker 镜像以使其轻量化。


让我们从一个示例开始,在该示例中,我们构建了一个 React 应用程序并将其容器化。运行 npx 命令并创建 Dockerfile 之后,我们得到了如图 1 所示的文件结构。


npx create-react-app app --template typescript



图 1:文件结构


如果我们构建一个基础的 Dockerfile(如下所示),我们最终会得到一个 1.16 GB 的镜像:


FROM node:10

 

WORKDIR /app

COPY app /app

RUN npm install -g webserver.local

RUN npm install && npm run build

 

EXPOSE 3000

CMD webserver.local -d ./build



图 2:镜像的初始大小为 1.16GB


第一步优化:使用轻量化基础镜像


Docker Hub(公共 Docker 仓库)中,有一些镜像可供下载,每个镜像都有不同的特征和大小。


通常,相较于基于其他 Linux 发行版(例如Ubuntu)的镜像,基于AlpineBusyBox的镜像非常小。这是因为 Alpine 镜像和类似的其他镜像都经过了优化,其中仅包含最少的必须的软件包。在下面的图片中,你可以看到 Ubuntu、Alpine、Node 和基于 Alpine 的 Node 镜像之间的大小比较。



图 3:基础镜像的不同大小


通过修改 Dockerfile 并使用 Alpine 作为基础镜像,我们的镜像最终大小为 330MB:


FROM node:10-alpine

 

WORKDIR /app

COPY app /app

RUN npm install -g webserver.local

RUN npm install && npm run build

 

EXPOSE 3000

CMD webserver.local -d ./build


图 4:经过第一步优化后镜像大小为 330MB


第二步优化:多阶段构建


通过多阶段构建,我们可以在 Dockerfile 中使用多个基础镜像,并将编译成品、配置文件等从一个阶段复制到另一个阶段,这样我们就可以丢弃不需要的东西。


在本例中,我们部署 React 应用程序需要的是编译后的代码,我们不需要源文件,也不需要 node_modules 目录和 package.json 文件等。


通过将 Dockerfile 修改为如下内容,我们最终得到的镜像大小为 91.5MB。请记住,来自第一阶段(第 1-4 行)的镜像不会被自动删除,Docker 将它保存在 cache 中,如果我们在另一个构建镜像过程中执行了相同的阶段,就可以使镜像构建更快。所以你必须手动删除第一阶段镜像。


FROM node:10-alpine AS build

WORKDIR /app

COPY app /app

RUN npm install && npm run build

 

 

FROM node:10-alpine

WORKDIR /app

RUN npm install -g webserver.local

COPY --from=build /app/build ./build

EXPOSE 3000

CMD webserver.local -d ./build



图 5:第二步优化后的镜像大小为 91.5MB


现在我们有了一个 Dockerfile,它有两个阶段:在第一个阶段中,我们编译项目,在第二个阶段中,我们在 web 服务器上部署应用程序。然而,Node 容器并不是提供网页(HTML、CSS 和 JavaScript 文件、图片等)服务的最佳选择,最好的选择是使用像 Nginx 或 Apache 这样的服务。在本例中,我将使用 Nginx。


通过将 Dockerfile 修改为如下内容,我们的镜像最终大小是 22.4MB,如果我们运行这个容器,我们可以看到网页可以正常工作,没有任何问题(图 7)。


FROM node:10-alpine AS build

WORKDIR /app

COPY app /app

RUN npm install && npm run build

 

 

FROM nginx:stable-alpine

COPY --from=build /app/build /usr/share/nginx/html

EXPOSE 80

CMD ["nginx", "-g", "daemon off;"]



图 6:第三步优化后的镜像大小为 22.4MB



图 7:最终容器的运行结果


参考



原文链接:


https://medium.com/the-agile-crafter/docker-image-optimization-from-1-16gb-to-22-4mb-53fdb4c53311


2020-12-31 16:444128

评论 2 条评论

发布
用户头像
在构建GO服务镜像过程中,我用到了UPX,能将镜像处理到6M大小
2021-01-01 21:16
回复
用户头像
即使已经做了如此多的优化,但仅仅一个react的前端应用,都需要22MB的硬盘空间,虽然目前硬盘不值钱,但这个资源也是有点大啊。。。
2020-12-31 18:20
回复
没有更多了
发现更多内容

微店API系列:商品详情接口接入与应用

tbapi

微店商品详情接口 微店API 微店商品采集

TiDB 观测性解读(一)丨索引观测:快速识别无用索引与低效索引

TiDB 社区干货传送门

阿里云可观测 2025 年 3 月产品动态

阿里巴巴云原生

阿里云 云原生 可观测

高可靠架构+智能运维,华为云会议“始终在线”!

平平无奇爱好科技

南京大学与阿里云联合启动人工智能人才培养合作计划,已将通义灵码引入软件学院课程体系

阿里云云效

阿里云 云原生 通义灵码

TiDB × AI :DeepSeek 时代你需要什么样的数据基座

TiDB 社区干货传送门

TiDB 可观测性解读(二)丨算子执行信息性能诊断案例分享

TiDB 社区干货传送门

AI 浪潮下企业身份管理:特点凸显,安全挑战升级

TechLead Studio

AI 企业身份安全

开源项目:一行代码,批量 PDF 转 Word 轻松搞定!

程序员晚枫

PDF word 自动化办公

智能驾驶中预测模块简介

地平线开发者

自动驾驶 算法工具链 地平线征程6

征程 6|工具链 VP 示例中日志打印解读

地平线开发者

自动驾驶 算法工具链 地平线征程6

微店商品列表API接口(Micro.item_search)

tbapi

微店API 微店商品列表接口 微店商品列表数据采集

人工智能+牙科:临床应用中的几个问题

算AI

人工智能 算法 医疗AI 视觉模型

Rust 如何轻松实现 RTMP 流媒体推送?深入解析直播推流场景与解决方案

Yeauty

rust ffmpeg Video RTMP media

如何使用 Nginx 代理 Easysearch 服务

极限实验室

nginx easysearch

Maven实战

Java随想录

Java maven

LLM 不断提升智能下限,MCP 不断提升创意上限

阿里巴巴云原生

阿里云 微服务 云原生 LLM

5分钟手把手教你开发一个MCP服务

巫山老妖

MCP协议

使用kvmtool运行和调试Linux内核

Linux内核拾遗

虚拟化 Linux内核 kvm kvmtool

CAD怎么创建块遮挡效果

极客天地

大模型 MCP:开启 AI 与现实世界的无缝交互革命

巫山老妖

MCP协议

《Operating System Concepts》阅读笔记:p552-p579

codists

操作系统

掌握 JSON 到表格转换:全面指南

数据追梦人

GraalVM 24 正式发布阿里巴巴贡献重要特性 —— 支持 Java Agent 插桩

阿里巴巴云原生

阿里云 云原生

《Operating System Concepts》阅读笔记:p580-p583

codists

操作系统

百度开放3000+实习机会,AI相关岗位占比87%

科技大数据

【超详细】Mac读取移动硬盘速度很慢的原因及解决方法

阿拉灯神丁

文件存储 磁盘管理 Mac软件 苹果电脑 Tuxera NTFS2024

大模型是否有必要本地化部署?

程序员架构进阶

#架构 4月月更 #大模型 DeepSeek

硬盘格式化NTFS好还是exFAT好?ntfs和exfat有什么区别 Mac电脑读取不了移动硬盘怎么办

阿拉灯神丁

文件系统 硬盘 Mac软件 NTFS 磁盘管理器 Tuxera NTFS2024

数据库选型指南:TiDB 与 MySQL 全方位对比清单新鲜出炉!

TiDB 社区干货传送门

南京大学与阿里云联合启动人工智能人才培养合作计划,已将通义灵码引入软件学院课程体系

阿里巴巴云原生

阿里云 云原生 通义灵码

Docker镜像优化:从1.16GB到22.4MB_架构_The Agile Crafter_InfoQ精选文章