【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

Netflix 开发者大赛,云计算 1.0,还是 2.0?

  • 2013-04-06
  • 本文字数:2391 字

    阅读完需:约 8 分钟

Joe Emison 是 BuildFax 公司的 CTO 和创始人,该公司为企业提供地产方面的数据,在技术架构上以云计算为基础。最近,Joe Emsion 在信息周刊上发表文章《 Netflix 如何毁掉云计算》,指责 Netflix 最近举办的云计算开发者大赛抱有“以 AWS 为中心”的心态。

Emison 认为:Netflix 是“云计算 1.0”时代的典范,表现出了巨大的收益,也暴露出不少问题。

云计算 1.0 基本上就是 Amazon Web Service 的事情,它是第一家,也是唯一一家,提供的特性能够满足构建相当大规模应用的需求。因此,Netflix 拥抱 AWS 很正常。但是在云计算 1.0 手中,Netflix 在 2012 年就遇到 4 次故障。最大的一次在圣诞节前夜,依赖一个不是很重要的 AWS 负载均衡服务,是问题的主要原因。

而最近 Netflix 设立的头奖 10 万美元的开源云计算管控工具大赛,更是被 Emison 认为:

这种做法,会让未来几年的云计算实践和架构都处于十分被动的局面。 …… 因为这个做法完全是“云计算 1.0”的思维模式,建立在“Amazon 是唯一厂商”这个观点的基础之上。 …… Netflix 这个以 AWS 为中心的竞赛令人生厌,除此之外,还有更深层次的问题:Netflix 有些工具所考虑的架构,在云计算 1.0 时代没有问题,但随着时间推进,问题越来越多。对于一家公司来说,很难放弃目前没有问题的代码和系统,特别是它们看起来很不错的时候,而且还能争取一点时间,上述都是正确的内部决策,这些我都可以理解。但是,Netflix 没有自己努力从中绞出最后一点价值,而是把大把钞票扔到外面,让所有人都去拥抱、扩展他们的工具和代码,而这些代码和工具对于未来的云架构来说,算不上多么好的实践。

接下来,Emison 列举了 Netflix 的 Aminator 工具,作为 Netflix 不良实践的例子。该工具基于一个 AMI 模板和一些代码,使得更易于批量构建 Amazon Machine Image 镜像。他认为:该工具几年前用还可以接受,但现在:

如今,我们已经有了 Chef 和 Puppet 这样广泛使用的配置管理工具,再大规模创建 AMI 就不是什么好实践了。AWS 自己最近还发布了 OpsWork 服务,用它处理应用部署要好得多,它就用了 Chef。

他还列举了 Edda 和 Asgard,指出这些工具:

在架构上,是为了解决一些多少已经解决了的问题,这就像是一个仍在频繁依赖和使用 SOAP 的开源项目,而不是用 RESTful 方法。

不过他认为 Denominator 还是一个出色的 DNS 管理工具,Simian Army 对于测试云架构来说,是一个极好的、有开创意义的想法,可惜,只能用在 AWS 上。

Emison 在文末指出:

有可能 Netflix 的竞赛会将世界引向云计算 2.0 时代,拥抱多云架构,同时使用写作和配置管理作为最优的方式。……但 Netflix 刚刚发布 AMInator 这个事实说明:Netflix 很乐意推广他们开发的任何工具,不管这些工具是否符合当今云架构的最佳实践。

针对 Emison 的这些观点,Netflix 的云架构师 Adrian Cockcroft 在自己的博客上做出了回应

他先对比了“云计算 1.0”和“2.0”:

我认为:大部分人目前用云的方法,是把一部分现有的架构迁移到云中,运行混合的设置环境。这是我眼中的云计算 1.0。Netflix 所做的,是开发灵活度更高的原生云应用,这更适于成为“云计算 2.0”。至于底层用哪些特定的 IaaS 服务,或者是否用公有云和私有云,这与我们构建的架构无关。

对于可移植性问题,他认为:

其他云厂商的功能和规模,还只能相对于 Amazon 在 2008 到 2009 年的水平。我们还在等他们跟上来。他们做出了很多承诺,但对 Netflix 而言却没多少能用的。不过,还是有些小规模而且更简单的应用有使用 NetflixOSS 的需求。Eucalyptus 在公共云和私有云中都已经把 Asgard、Edda 和 Chaos Monkey 跑了起来,而且会放在 Eucalyptus 3.3 中交付。还能看到一些信号,人们想要在 OpenStack、CloudStack 和 Google Compute 中加入一些缺失的功能,让 NetflixOSS 能在上面运行。

至于 AMinator 工具,他认为有其特定优势:

如果你想要启动 500 个完全相同的实例,在它们启动后各自运行 Chef 或是 Puppet,很容易让它们依赖 Chef 或是 Puppet,浪费启动时间,而且如果安装出现问题,就会得到一堆不一致的实例。使用 AMInator 在构建阶段只运行一次 Chef,这就降低了运行时出现问题的几率。

对于 Netflix 举办的大赛,Adrian 的回应是:

奖励中包含可移植性的类别,这个类别很广,要是有人为 NetflixOSS 加入其他编程语言的支持,比如 Erlang、GO 或是 Ruby,或是让 NetflixOSS 能够运行在更多 IaaS 选择之上,都有可能获奖。现实情况是:AWS 确实统治了目前的云部署市场,所以,能在 AWS 上运行,也就能保证能让最多人收益。很多人都在吹捧 AWS 之外的方案,但它们都还有一段路要走。

Joe 也看到了这篇文章,并在评论中说道:

我认为你的回应是只见树木,不见森林。

森林是这样的:Netflix 的云架构,不管是从公开演讲还是从开源代码中看,从根本上,

a)跟 AWS 紧密交织,基本上是无法分离的;

b)从配置管理和协作角度来看,大大落后于最佳的“通用”开放解决方案。

同时远远落后于“Unix 方式”——封装、抽象可与其他彼此互相交换使用的工具,无法构建最佳架构。

……

Netflix 在云架构领域中,有很大的权力和影响力,很多人都指望着 Netflix 指导他们如何完成云部署。如果从长远考虑你的云架构,Netflix 做出的一些选择就是不好。从历史上看,也很难引证好的先例,证明这样跟一家 IT 厂商紧密交织是好的决策。对于在云中部署的人们来说,不管出于什么目的和意图,了解、理解配置管理,远比会用某种可以忽略这个过程的工具来得重要得多。

Adrian 和 Emison 在评论中展开一系列交锋,感兴趣的同学,可前往关注。

坐在大洋彼岸隔岸观火的我们,恐怕大部分人都没有太多机会真正使用 AWS,1.0 还没有尝到甜头,奢谈 2.0 似乎有些为时尚早。但他们的讨论还是可以给国内的公共云运营商以启示,对广大想要使用公共云的开发者们来说,更是一个提醒。不管 1.0 还是 2.0,先把配置管理弄明白才是最重要的事。

2013-04-06 23:241404
用户头像

发布了 479 篇内容, 共 152.7 次阅读, 收获喜欢 47 次。

关注

评论

发布
暂无评论
发现更多内容

时间管理的本质到底是什么?

非著名程序员

程序员 提升认知 时间管理

印度下黑手!59款中国APP被禁用,微信微博QQ抖音等在列

程序员生活志

架构师训练营 - 系统架构

Pontus

极客大学架构师训练营

数据库周刊30丨数据安全法草案将亮相;2020数据库产业报告;云南电网上线达梦;达梦7误删Redo Log;Oracle存储过程性能瓶颈;易鲸捷实践案例……

墨天轮

MySQL 数据库 oracle mongodb 周刊

自己动手编译一个HEIF图片转jpeg工具(Mac平台)

GeorgeMR

HEIF HEIC jpeg 图片

架构师训练营 第4周作业

坂田吴奇隆

极客大学架构师训练营

架构师训练营-第4周总结

坂田吴奇隆

极客大学架构师训练营

架构师训练营 No.4 周总结

连增申

可读代码编写炸鸡三 - 审美

多选参数

代码质量 代码 代码注释

架构师训练营第四周作业

Bruce Xiong

JDBC拾遗

qihuajun

一个大型互联网应用采用的技术方案和手段

李白

第四周学习总结

李白

猿灯塔:关于Java面试,你应该准备这些知识点

猿灯塔

面试

第三周总结

李白

程序员面试与 HR 谈薪资技巧

张小方

程序员 面试 offer 年终奖 月薪

分布式计算DAG1-画猫

Hervor。

Python中进行None判断时,为什么用is而不是==

王坤祥

Python 编程 进阶 计算机基础

作业 - 第4周

Happy-Coming

架构师训练营 - 作业 - 第四周

心在飞

极客大学架构师训练营

父亲节会员礼遇免费送,联想来酷重点发力"健康赛道"

Geek_116789

出海蓝军先锋联想来酷,今夏再征"丝路"

Geek_116789

第三周作业

李白

可读代码编写炸鸡四(上篇) - 来写注释

多选参数

代码质量 代码 代码注释

架构师训练营第 04周——总结

李伟

极客大学架构师训练营

架构师训练营第四周总结:互联网架构概要

hifly

高可用 高性能 极客大学架构师训练营 互联网架构

Mac开发环境 React Native0.60 环境 安卓环境Java变量 及~/.zshrc文件配置

蛋蛋

React

消息队列(六)如何处理消费者故障导致的百万消息积压?

奈何花开

Java MQ 消息队列

真棒! 20 张图揭开内存管理的迷雾,瞬间豁然开朗

小林coding

Linux 操作系统 计算机基础 内存管理

为什么大公司一定要使用DevOps?

张启华

架构师训练营——第四周作业

jiangnanage

Netflix开发者大赛,云计算1.0,还是2.0?_DevOps & 平台工程_郑柯_InfoQ精选文章