EC2 容器服务介绍

阅读数:3630 2015 年 11 月 2 日

EC2 容器服务(ECS) 是亚马逊 web 服务 (AWS) 新发布的一款产品。

ECS 的目的是让Docker容器变的更加简单,它提供了一个集群和编排的层,用来控制主机上的容器部署,以及部署之后的集群内的容器的生命周期管理。

ECS 是诸如Docker Swarm,Kubernetes,Mesos等工具的替代,它们工作在同一个层,除了作为一个服务来提供。这些工具和 ECS 不同的地方在于,前者需要你自己来部署和管理,而 ECS 是“作为服务”来提供的。

ECS 是基于一种专有的集群技术,而不是通过诸如 Docker Swarm,Kubernetes,Mesos 等引擎实现的。这可以和Google 容器引擎(GCE) 作一对比,GCE 后台使用的就是基于 Kubernetes 的。

我们为什么需要容器编排?

由 ECS,Swarm,或者 Kurbernetes 所提供的容器编排这一层,在整个部署和运行基于容器的应用程序的整个蓝图中占有非常重要的位置。

首先,我们为了可扩展性需要容器组成集群。随着我们负载的增长,我们需要增加更多的容器,横向的扩展它们,跨服务器来并行的处理更高的负载。

第二,我们需要组建容器集群来保证健壮性和高可用性。当一台主机或一个容器失效时,我们希望容器可以重新构建,或许是在另外一台健康的主机上重新启动,从而让整个系统不会受到任何的影响。

最后,编排层的工具所提供的一个重要功能就是抽象,让开发者远离具体的底层实现细节。在容器化的世界中,我们毋需关心每个独立的主机,只需要关注我们期望的容器有多少在运行,在‘适当的地方’运行。编排和集群工具为我们做这些,让我们能够轻松的将容器部署到集群中,而且还能够计算出最佳的调度方式,从而决定容器应该运行在哪些主机上。

设计健壮性和高性能分布式集群系统的难度是非常大的。所以诸如 Kubernetes 和 Swarm 这样的工具让我们自己毋需去构建集群。ECS 借此更进一步,通过简化编排层的设置、运行和管理来实现毋需人工参与。基于此缘故,ECS 无疑是哪些使用容器来运行应用的开发者们应该密切关注的项目。

ECS 架构

ECS 并非是一个黑匣子的服务,它运行在你的 EC2 服务实例中,你可以使用 SSH 登录,像管理其它的 EC2 服务一样进行管理。

在集群中的 EC2 服务均会运行着一个 ECS 代理,ECS 代理是一个连接主机到中心的 ECS 服务的轻量级进程。ECS 代理响应主机注册到 ECS 服务,且掌控所有的请求,用于容器的部署或者是诸如启动/停止容器之类的生命周期事件。顺便说一下,使用 go 实现的 ECS 代理已经开源。

当创建一个新的服务器时,我们既可以选择手动的配置 ECS 代理,也可以选择使用预构建的已经配置完毕的 AMI 镜像。

通过亚马逊 CTO Werner Vogels 的博客, 我们得知集中的服务已经逻辑上分为集群管理和在主机上控制容器部署的调度。这背后的缘由就是让容器的调度成为可插拔式的,所以我们甚至可以使用其它的调度器,例如 Mesos 或者是其它开发者自定义的调度器。自定义调度器的文档在本文撰写时还在开发当中,但是我们可以阅读此博客以及参考其源代码,这是目前为止最佳的参考实践。

下面的示意图很好的演示了 ECS 集群的逻辑层次:容器实例包含多个任务,任务包含多个容器,EC2 容器实例集群可以分散到多个可用区域中,Elastic Load Balancers 可以用于跨任务的动态分布负载。此图可以帮助读者在阅读接下来的内容整理思路。

(点击放大图像)

服务和任务

在 ECS 中,Docker 负载被描述为任务。

一个任务本质上是定义了一个或多个容器,其中包括你打算运行的容器的名称(和Docker Hub的名称保持一致),以及在容器实例启动时相应的端口和磁盘卷的映射信息。

当任务运行时,则启动了底层的容器。当所有的容器进程完成使命时,任务也就结束了。任务既可以是很短的也可以是长时间运行的,举例来说,提供一个数据处理任务的短的事件驱动,或者是一个 web 服务进程。

这里需要提醒一件事情,那就是架构上给定的一个任务,其所有的容器均运行在同一台主机中。如果我们打算定位容器的话,那么就使用在同一个任务下来组织它们的方法来实现。如果我们打算将服务运行在不同的主机,我们则仅需定义多个任务来实现控制即可。初看这似乎是一种约束,但最终它给我们的和Kubernetes pods一样的对容器定位在一定程度的控制能力。

为了说明上述问题,如下面截图所示,我们可以看到定义了一个特定的任务,此任务拥有一个容器,容器托管 nginx web 服务。

(点击放大图像)

除了任务之外,服务是 ECS 概念中排名第二重要的。一个服务是给定一个任务所请求运行的特定的实例数量。举例来说,如果我们有一个如上述所定义的运行 nginx web 服务容器的任务的话,我们则要定义一个服务,来请求 3 个或更多的实例组成集群,从而完成 web 服务的任务。

服务是 ECS 如何提供弹性的保证。当一个服务启动后,服务就会监控其中的任务是否是活动的,实例的数量是否正确,以及其中容器的数量是否正常。如果任务停止运行了,或者是无响应了,又或者是出现问题了。服务就会请求启动更多的任务,以及必要的话清理任务。

下面截图所示,在集群中一个 nginx 服务被定义为 3 个运行的任务。这些任务个个都处于运行状态。

(点击放大图像)

部署第一个容器

当用户第一次使用终端访问 ECS 服务时,会看到一个简单的向导。尽管手动的去配置 ECS 也不是多么繁重的事情,但是第一次的话,使用该向导还是值得尝试的,它能够为你配置好所有-你的 EC2 服务器,一个合适的安全组,以及一个自动伸缩组,正确的 AMI(此 AMI 内置了 ECS 代理),等等。这是启动和运行,并获得 ECS 经验的最快方法。

(点击放大图像)

步骤 1 定义任务

首先,作为向导的一部分,我们需要定义任务。这个演示的目的, 我们将使用免费的 NGINX 的 Docker 镜像。(NGINX 是一款开源的 web 服务软件,已经被社区容器化了,并上传到了官方 hub。)

以为容器指定一个名称开始,例如本示例为nginx-task

(点击放大图像)

接下来,点击添加容器定义,即定义 nginx 容器。 这里主要需提醒的是镜像的名称,务必和 Docker hub(ngnix) 上公开的镜像名称一致。当然,也可以指定专有镜像

内存字段是内存的最大值,以兆字节计算,这是用于分配给运行中的容器的。CPU 单元是一个抽象的数字,每个 CPU 核心有 1024 个单元,此数字即是要赋予的单元数。

此信息用处非常的大,因为它增加了一定程度的灵活性以及智能的容器调度。ECS 将监视那些实例拥有空闲资源,然后智能的分配容器,从而达到实现有效的利用服务器资源的目的。

(点击放大图像)

步骤 2 定义服务

第二步,我们需要定义服务,即描述为此任务要在集群中运行多少个实例。

选择创建服务的单选框,为服务命名,本例为 nginx-service,然后设置要运行的任务数,本例为 3。这就意味着此服务一旦运行起来,就会创建 3 个任务,每个任务就是一个独立的实例,每个实例中都运行着 nginx 容器。

至于更加复杂的配置,你可选择 Elastic Load Balancer (ELB),然后在它们被实例化后动态的将服务注册到 ELB,并实现集群化。这些在后面有详细的描述。

(点击放大图像)

步骤 3 创建 ECS 集群

我们需要创建 EC2 服务器的集群,这些服务器是用来运行容器的。此演示环境使用 3 个 t2.micro 实例即可实现预料的效果。这也就意味着 1 个任务和 1 个容器将分布到这 3 台服务器的每一个上。我们当然也可以实现在集群中使用实例多于任务的配置,或者使用这些服务器来运行不同的任务,但是目前还未能实现在同一台服务器中运行给定任务的多个实例。

选择你首要的密钥对,然后点击后面的按钮以创建IAM 角色,IAM 角色非常重要,有了它,集群中的主机就可访问中央 ECS 服务了。

(点击放大图像)

步骤 4 创建栈

向导的最后一步是展示汇总任务、服务、和集群的配置。

页面如下所示会展示所生成的 JSON 代码,这些代码同样可以用于命令行,如果有人习惯于使用命令行的话,或者是打算自动创建它们的集群的话。

(点击放大图像)

在创建过程中,你会看到使用 Cloud Formation 来构建栈。构建栈可能要花上 2 到 3 分钟的时间。

(点击放大图像)

步骤 5 回顾栈和 NGINX 服务

现在若是访问 EC2 的面板,我们可以看到已经创建好的服务器,且是处于运行状态的。向导已经帮助我们创建了跨可用区域的主机以演示弹性的好处。

(点击放大图像)

然后回到 ECS 面板,就可以检查服务了,当然我们希望看到的是它处于准备好的状态,且拥有 3 个任务。

记住,在创建实例的过程要花费几分钟的时间,从 hub 拉下容器镜像启动也要花费几分钟的时间,以及服务达到可用状态也会花费一些时间,所以,不用担心这整个过程会稍有些慢。

(点击放大图像)

深入服务中某个任务的细节,我们会看到任务处于 RUNNING(运行)状态。

(点击放大图像)

展开nginx-container。在外部链接下方,我们可以看到一个 HTTP 链接,指向任务内的容器。

点击此链接,我们可以看到的是 Nginx 容器所提供的 web 欢迎页面。

(点击放大图像)

此时,我们完成了将 NGINX 容器部署到 ECS 的步骤,而且可通过 web 浏览器访问 NGINX 服务。现在你可以考虑整理下思路和对概念的验证了。

后续步骤

在建立了一个简单的容器之后,我们接下来为了将应用部署到生产环境,需要做一些更加高级的配置。

ELB 负载均衡

在上述的例子中,我们使用浏览器直接链接到三个容器中的一个,实现对 NGINX 的访问。这不能够做到健壮性,理论上当容器宕机,或者是重新启动到不同的服务器上,那么原来指定的静态 IP 地址就不在有效了。

我们可以将服务注册到EC2 Elastic Load Blance(ELB)以实现动态的地址。作为底层的任务不管如何的启动、停止以及在 EC2 实例池中如何的移动,ELB 都可以通过服务保持最新,能够将相应的流量路由到正确的地址。

要配置负载均衡,我们首先需要在 EC2 的面板中创建一个 ELB。然后重新创建服务,在服务创建的过程中将 ELB 添加进来,如下面截图所示:

(点击放大图像)

自动伸缩

ECS 也可以整合EC2 autoscaling,而且也是在面临增加的负载时扩充集群的首选方法。

Autoscaling 的工作要依赖于对诸如 CPU,内存和 IO 的计量监控的,而且添加节点或删除节点是在打破一定的条件时候进行的。

实例化后的新的节点会自动注册到 ECS 集群中,然后才有资格成为未来部署容器的实例。

这很实用,但是目前 ECS 还没有实现扩充任务数量或者是增长容器集群的 Hook。但我们仍然能在新的容器启动后加入到新的规模的集群中受益,我们可以通过 GUI 或API来引入新的容器到集群,并能在更大规模的集群中分发负载。

容器链接

当在任务中定义容器时,是可以使用Docker 原生的容器链接来实现它们之间彼此的互连互通。

这样就不在需要静态的端口映射或者是多容器环境中的服务发现了,让部署分布式的微服务更加的轻松。

AWS 命令行工具

虽然上面的演练是基于 UI 控制台,但ECS 完全整合到了 AWS 命令行中

故障排查

若发生了问题,你可以通过 SSH 直接访问集群的节点,以进行调试。

为了能够使用 SSH 登陆到节点,你需要在安全组中打开 22 端口,因为通过向导所创建的节点默认不会打开此端口。

登陆到服务器节点后,你就可以查看 ECS 代理的日志文件:/var/log/ecs 了。

你也可以运行标准的 Docker 命令,例如,docker imagesdocker ps ,来参看服务器上的镜像和容器的状态。

总结

本文的目的是对 ECS 做一介绍,且讲述了一个实际演示环境的例子,即部署你的第一个容器集群。

ECS 是一款新的产品。很多功能还不是很健全,但是它目前足够的稳定。我们在我们的测试环境中创建了超过 100+ 个节点的集群,试验了容器和节点的失效切换,测试了自动伸缩、负载均衡、运行服务,均表现良好。现在我们打算为一些客户提供 ECS 到它们的生产环境。

ECS 以及和它等同的 Googel Container Engine 对于容器生态系统来说都是非常重要的。基于容器开发代码和部署变得更为容易,在其上运行诸如 Kubernetes 或 Mesos 的编排层,对于普通用户来说这是进入成熟的标记。ECS 为容器提供了一个简单的、可访问的、稳定的、类似 PaaS 平台的产品,这非常的令人兴奋,尽管它现在还处于整个进化过程的早期阶段。

关于作者

Benjamin WoottonContino的联合创始人和首席顾问,Contino 是一家英国的咨询公司,主要是为一些企业提供 DevOps,持续交付工具等方面的实践和方法。

查看英文原文:Introdcution to EC2 Container Service


感谢张龙对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

立即免费注册 AWS 账号,获得 12 个月免费套餐:点击注册

有云计算问题?立刻联系 AWS 云计算专家:立即联系

收藏

评论

微博

发表评论

注册/登录 InfoQ 发表评论