Shopify 的 Docker 使用经验

  • 张天雷

2014 年 12 月 1 日

话题:语言 & 开发架构

Shopify 是一个电子商务平台,提供专业的网上店面。目前的客户超过 12 万,包括 GE、特斯拉汽车、GitHub 等。作为首家市值超过 10 亿美元的加拿大网络公司,Shopify 在欧美市场的影响力也与日俱增。Shopify 是一个大型的 Ruby on Rails 应用,其产品服务器能通过给 1700 个处理核心和 6TB RAM 分配任务来完成每秒处理 8000 多个请求。Shpify 为了更加便捷、跨平台跨版本地进行分包任务,采用了时下炙手可热的 Docker 封装技术。近日,Shopify 在其博客上分享了自己的Docker 技术使用经验

关于封装格式的选择,Docker 提供很多封装格式,从轻量级的单进程容器到重量级的富应用容器,一应俱全。Shopify 的开发者选择“纤薄”路径的容器,并隔绝外部影响,目的就是为了减少 CPU 和内存的负担。不过虽然运行纤薄容器,但还有一个初始化进程 (PID=1) 使得监测工具、保密管理和服务能够紧密集成。除了初始化进程,还添加了一个在每个容器内占用 PID=2 并且简单启动应用进程(PID=3)的 ppidshim。有该 ppidshim,应用程序不会直接从 (i.e. ppid != 1) 继承。除此以外还提供了健康检查,以保证其正常运行。

有一个要特别注意的一点,Shopify 称之为“容器的 100 定律”。在选择将何种服务放入容器中时,假设一台主机中运行 100 个小容器,评估是需要运行一个给定服务 100 次,还是共享一台主机的服务更好。用于最佳效率的选择,这个评判标准在实际中很有用处。100 定律的使用需要一定的灵活性。一些情况下,仅仅需要写一下组件的“黏合器”,也可以通过配置来达到目的。最终,你应该获得一个容器,内含你的应用程序运行所需的东西,以及一个提供了 Docker 托管和共享服务的主机环境。

关于 Debug,没有特别需要注意的,容器内运行应用在绝大多数情况下和他们未封装时行为相同,而且,大多数标准的 Debug 工具和技术在 Docker 主机上能正常运行。所以开发者只需照常调试。

命名方面。选取容器名称的时候,尽量描述其工作内容(例如:unicorn-1, resque-2),为了便于追溯,还要结合主机名(例如 unicorn-1.server2.shopify.com.)。在使用过程中,将 Docker 的主机名标签也传入容器中,方便问题的追踪。

注册和部署。使用 GitHub 的提交挂钩触发一个容器生成每一个主推,并提交状态,表明构建是否成功。使用 Git 的提交 SHA 来 Docker tag 容器,如此可以一目了然容器中的代码是什么版本。还把 SHA 放入 (/app/REVISION) 文件夹,容器内的文件夹更容易进行 debug 和脚本使用。一旦构建成功,希望把容器推到一个中央注册处。开发者选择运行自己数据中心的注册表以加速部署和尽量减少外部依赖。运行 Nginx 的反向代理,可以缓存 GET 请求背后的标准 Python 注册表的多个副本。大型网络接口(10Gbps)和反向代理能有效处理“惊群效应”。代理方式也使我们能够运行多个注册,并在注册中断时提供自动故障切换。


感谢郭蕾对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

语言 & 开发架构