云架构尚未经过深思熟虑

  • Abel Avram
  • 王丽娟

2009 年 2 月 22 日

话题:架构AWS云计算DevOps

应用程序已有很多成熟的软件模式,但对云来说可并不是这样。每个供应商都使用他们自己的解决方案,解决方案可是最有可能发生变化、改进的东西。虽然云计算还没成熟到能促成一组明确模式出现的地步,但现在已经有了第一个范例。

亚马逊建议在如下任务中使用他们的云

处理管线化

  • 文档处理管线化——将数十万个微软 Word 文档转换为 PDF,对数百万个网页 / 图片进行光学字符识别(OCR)、转换为原始的可搜索文本。
  • 图片处理管线化——创建图片的缩略图或低分辨率版本,调整数百万张图片的大小。
  • 视频转码管线化——将 AVI 格式的电影转码为 MPEG 格式。
  • 索引——创建网页检索数据索引。
  • 数据挖掘——对百万条记录进行搜索。

批处理系统

  • (金融、保险或零售行业的)后台应用。
  • 日志分析——分析并生成每日 / 每周报告。
  • 夜间构建——每晚并行执行源码库的夜间自动构建。
  • 自动化单元测试和部署测试——每晚在不同的部署配置环境上测试、部署、执行自动化(功能、负载、质量)单元测试

网站

  • 夜间“休眠”、白天自动伸缩的网站
  • 即时网站——针对会议或活动(美国橄榄球超级杯大赛和体育赛事)的网站
  • 推广型网站
  • 季节性网站——只在税季或节假日(“黑色星期五”或圣诞节)期间运行的网站

亚马逊的 GrepTheWeb 是云架构的一个例子

放大后,架构如下所示:

亚马逊的 Web Services 传播者 Jinesh Varia 在 InfoQ 视频中详细地解释了GrepTheWeb

SmugMug的架构也构建在亚马逊 EC2 上,Todd Hoff 列举了他们的架构中使用的基本组件:

  • 工作启动器——工作从网站或其它软件子系统进入,在队列服务中排队等候处理。工作不一定非是大请求,可以是整个管线中独立的一小部分。不要把状态保存到工作执行器里。把需要做的事打包进工作请求,放回到队列服务中等候处理。
  • 规划服务——它是亚马逊的基础设施,允许实例根据工作负载自动伸缩。这是与自有的虚拟服务器(VPS)或典型的数据中心方案主要的不同之处。它有一套启停 AMIS 的 API,以及自动配置、运行 VM 的机制。
  • 工作执行器——它们从队列中取出工作,完成具体处理。对 SmugMug 来说,工作结果存储在 S3 之上,但你也可以存储在自己的数据库、SimpleDB 或其它地方。
  • 队列服务——队列存储工作执行器要接受的工作。SmugMug 建立了自己的队列服务,你也可以直接使用亚马逊的 SQS,用起来同样简单。创建一个可伸缩、分布式、高性能、高可用的队列服务并非易事,所以你可以考虑一下“Flickr——先完成必不可少的工作,其它的放进队列”中推荐的大量队列产品。
  • 控制器——该组件监控工作流相关的大量变量,并以最优化一小组参数为目标,决定需要多少 EC2 实例。按需增减实例。

每家供应商都有他们自己的解决方案,预计以后还会出现不同的解决方案。各家的云都还没有得到充分的探究,目前都正在缓慢而稳步地推敲着云的架构解决方案。

查看英文原文:Cloud Architectures Are Not Fully Thought Out Yet

架构AWS云计算DevOps