AWS re:Invent 深度观察(计算篇):全球计算网络正在成为兵家必争之地,啃硬骨头时代已经开始

阅读数:3993 2019 年 12 月 9 日 15:33

AWS re:Invent深度观察(计算篇):全球计算网络正在成为兵家必争之地,啃硬骨头时代已经开始

AWS re:Invent深度观察(计算篇):全球计算网络正在成为兵家必争之地,啃硬骨头时代已经开始

AWS re:Invent 2019 的主题演讲上,Andy Jassy 分享了这样一个数据:尽管云计算已经如火如荼的发展了十多年,然而在当前全球的所有 IT 消费中,在云上的消费仅仅占了 3%,其余的 97% 仍在企业内部(on premise)。

在这 3% 当中,AWS 占了 47.8%(Gartner 在 2019 年的数据),是处于领先地位的服务提供者。增速方面,AWS 在 2018 年一年营收超过 250 亿美元,比 2017 年增长了 47%,可以说保持了相当惊人的增长速度。

但是,AWS 对这样的现状显然并不满足。

啃硬骨头时代的开始

早年的 AWS 更专注于服务好那些云原生的、初创企业的开发者们——这个群体是云端世界的首批居民。如果云计算不存在,他们的业务多半都不会存在,因此 AWS 与他们的关系是你情我爱、共同生长的关系。共同生长了十多年,这部分的需求基本上都被满足的差不多了,经验都沉淀到了各个产品线的硬件、代码与文档里,全自助式服务,AWS 的产品团队无需在这方面再费多大力气。

早年的 AWS 不太去强攻大客户的项目,并非它不想做,实在是时机不成熟,有那个精力热脸贴冷屁还不如先去专注把新市场做大。直到 2013 年,AWS 抢下了 CIA 一笔价值 6 亿美元的大单,从此开始有了与 IBM、EMC、Oracle、微软等传统 IT 大厂在大客户项目中同台竞技的角色。数年来,各厂之间时而协作、时而竞争,大约是生意好做的季节协作多一些,生意不好做的季节竞争多一些。

2019 年,AWS 与微软大大的闹掰了。微软抢下了美国国防部百亿美元大单,这条新闻在 2019 年的十月底闹得满城风雨,政治之争甚至超过了技术之争;而就在那条新闻出现的两个月之前,微软宣布把自家产品的许可证收费方式给改了,极大的增加了所有客户在各大云计算平台上使用微软产品的成本,AWS 是首当其冲受到影响的一家(同时受到影响的还有阿里云和 Google 云)。

诚实地说,微软 Azure 这几年的进步也是很快的。至于更改许可证收费方式,微软也的确有权这么做。但,有权这么做也无法改变这种行为实际上是前辈对新人使绊子的事实。

对于 AWS 而言,这是一次很大的警告。这意味着他们的步伐还要再快一些,才能在其他前辈大厂对其形成完全的合围之前,带出一批有影响力的客户冲出合围。

这场速度的竞赛,其目标的名字叫做:

跨越了骨干网、公网、企业内网与 5G 网络的全球计算网络。

根据 InfoQ 编辑在本次 re:Invent 大会上的观察,AWS 在这场竞赛中采取了三个重要策略:第一,全速将 AWS 部署渗透到各个网络的各个角落;第二,全速将 Serverless 打造成软件开发的第一入口;第三,全速建设通往机器学习的平民入口。

一、全速进军混合云

我们在上一篇观察中介绍了 AWS 本次发布的 AWS Outposts、AWS Local Zone 和 AWS Wavelength,这几个新发布都有一个共同的特点:它们发挥作用的场景,都脱离了 AWS 自家骨干网的限制——AWS Outposts 在企业内网,AWS Local Zone 在公网,AWS Wavelength 在运营商的 5G 网络。

一直以来,AWS 的部署环境都是自己的专线网络、自己的机房、自己的软件(现在连自己的硬件也越来越多了)、自己的定价……什么都是自己说了算,这是 AWS 的核心竞争力之一。

但是,私有部署的需求一直是真实存在的需求。常见的私有部署需求有三种用户场景:

  1. 客户有还要继续跑的老应用遗留在企业内部

  2. 客户有低延时的需求

  3. 客户有数据需要在私有环境下处理

不过,私有部署的生意可并不好做!这里面有非常多的坑,往往通向无数个定制化解决方案,耗费极大的人力成本,并且这些人工很难沉淀到一个通用的产品上面。本次 re:Invent 上有一个来自 Dropbox 的分享,里面有一张图非常形象的描述了混合云部署的难处:

AWS re:Invent深度观察(计算篇):全球计算网络正在成为兵家必争之地,啃硬骨头时代已经开始

可能很多人还记得 2016 年有一条新闻,说 Dropbox 离开了 AWS 改为自建数据中心,原因之一是需要降低存储成本,原因之二是需要低延时。而后来的发展是,随着 AWS 每年发布大量的新产品和新特性,Dropbox 现在又接着用起了 AWS:他们以混合云的方式同时使用自建数据中心与 AWS,并且其自建的开发工具链与 AWS 的工具链保持了兼容。这里面虽然还没有 AWS Outposts 什么事儿,但也已经是相当有意思的一则现象。

把企业级私有部署做成标准化的样子,是多少 IT 服务商想做而没做成的事情,AWS 真的能做到吗?目前我们还无法回答这个问题。不过可以肯定的是,这方面一旦有所进展,将是值得期待的一件事。

值得注意的是,AWS 做了一些功课,乍看之下与此事似乎无关。本次 Werner Vogels 在其主题演讲的最后发布了一个在线文档集合 Amazon Builders’ Library ,里面有大量文档介绍 Amazon 是如何开发维护自己的软件系统的思路与经验,直击四大灵魂问题:如何保持分布式系统的健壮性?如何进行规模化工程?如何运维?如何保持高速的交付能力?这些思路与经验,仅仅使用云服务的用户未必能听懂,却对那些自建云的客户与同样做云计算的“友商”相当有用。

事实上,Werner Vogels 整个的演讲,从为什么做 Nitro、怎么做的 Nitro,到为什么做 No Dom0、怎么做的 No Dom0,到为什么做单元化、怎么做的单元化,这些普通用户基本听不懂、几乎只有“友商”才最关心的内容,被放在主题演讲的环节讲给所有人听,这已经不是第一年才这样做。在今年的 3000 场技术分享当中,也不乏一些相关的课程,对 Nitro、对 Graviton2 等议题进行了更加细节的分享。

我们有理由相信,通过分享底层思路与经验来建立信任,这也是 AWS 推动混合云部署标准化的策略之一。

(不过 Vogels 也在开场说了,There is no [compression algorithm] for experience。我猜这句话的意思是:如果你们要做把我们走过的路都走一遍,那么我们踩过的坑你们也一个都少不了!)

二、全速捧热 Serverless

“Serverless 一定是未来的主流开发方式。”说这句话的人叫做 Aaron Kao,是 AWS 容器、Serverless 与开发者工具部门的负责人,所以我们可以认为他说这句话有他的偏见。

不过,InfoQ 编辑在现场接触了一些使用过 AWS Lambda 与 AWS Fargate 的企业级开发者,发现他们确实正在将越来越多的开发放在 Serverless 上,并且越来越不愿意从 EC2 开始重新构建一套需要自己维护的中间架构层。

这种操作固然存在被 AWS 锁入的风险,但是跟 Serverless 带来的开发速度的提升与资源使用的节省相比,他们选择了后者。这听起来就好像是用过自来水的用户再也不想去从井里挑水吃的感觉。

当然了,我们也看到一些不愿意用 Lambda 与 Fargate 的用户。这些用户的特点是:原本已经有一个比较强大的底层研发团队、有一套现成的自家的资源管理系统,更愿意直接管理 EC2 底层计算资源。比如说,一些国内大厂出海使用 AWS,就以此种情况居多。

说到底,用了 Lambda 与 Fargate,到底会不会被 AWS 锁入?

其实,我们可以认为 Lambda 与 Fargate 都是 EC2 的客户——这一描述得到了 EC2 部门副总裁 Dave Brown 的认可,并且得到了他的手绘图一张作为补充说明:

AWS re:Invent深度观察(计算篇):全球计算网络正在成为兵家必争之地,啃硬骨头时代已经开始

理论上,任何一个研发团队都可以基于 EC2 来为自己打造一套定制化的 Serverless 开发平台,并且可以自行选择是否要与 AWS 这套 API 体系兼容。

目前来说,各个云计算厂商都已经陆续在各自的云平台上推出了各自的 Serverless 服务。可以预见的是,随着越来越多的开发者熟悉了 Serverless 的使用方式,当他们开始在不同的企业之间流动之后,会愈发的促进此种开发方式在各地的普及,提升各个领域的研发速度。

那将会是各个企业进一步嫌弃传统 IT 的时刻。

三、全速打造机器学习平民入口

“SageMaker Studio 是机器学习领域第一个一条龙式的开发者工具。”

Joel Minnick 是 AWS AI 产品线负责人,对数据科学家们原本的工作方式十分熟悉。与软件工程师需要对软件进行版本控制一样,数据科学家们对模型也需要进行版本控制,而且版本控制的维度更高、复杂度更高。虽然我们现在还无法断言本次发布的 Amazon SageMaker Experiments、Amazon SageMaker Debugger 等系列工具是否就是最佳的工具,不过应该已经比用 Excel 表格来跟踪各个参数变化的方法方便多了。

机器学习在今年的 re:Invent 几乎到处都被提起。在诸多客户分享当中,几乎十个里面有九个都说自己在 AWS 上搞机器学习,包括但不限于造药的 Insitro 与 Cerner、造汽车的 F1 方程式与大众、造环大洋自动驾驶帆船的 Saildrone,至于一直都在大量跟数据打交道的金融客户就更不用说了。其中,Insitro 的创始人、曾经跟 Andrew Ng 共同创办 Coursera 的犹太裔数据科学家 Daphne Koller 甚至断言说机器学习进入生命科学将会引发下一次科学革命,让人印象深刻。

看起来,AWS 想要把那些一旦门槛降低就会发生的机器学习计算都囊括到自家的平台上!不遗余力的把研发能力投入到“降低机器学习门槛”这件事上,得到了包括 S3 数据湖与 Amazon SageMaker Studio 开发者全家桶在内的一系列新服务,这是 AWS 目前交出的答卷。

虽然,Joel Minnick 并没有具体告知现在运行机器学习负载的实例个数,而只是说“实例很多”、“增长很快”。但我们不妨猜测一下,如果能够成为今天大部分普通开发者都能使用的低门槛机器学习计算平台,那么在 AWS 上运行的计算量将会比今天超出多少?

更重要的是,这同时也是敲开企业级用户的一块重量级敲门砖!那些不会为了 Serverless 而心动的企业,却会为了可以低门槛的用到机器学习而心动,这是完全有可能的。

毕竟,那些可以被计算而还没有被计算也不知道该如何被计算的数据,实在太多了。这里面所蕴含的潜在价值是巨大的,而目前看来,机器学习是能够挖掘这些数据隐含价值的最有效的入口。

四、全球计算网络格局

截止到目前,我们看到正在形成的全球计算网络已经分成了两个阵营:

  1. 全球的云

  2. 中国的云

这种格局已是既成事实,预计在短期内不会改变。虽然没有统一,但与国家电网相比,计算网络的集中程度实际上是相当惊人的!而,中国的 AWS 在当下这个时刻实际上扮演了一个历史上非常特殊的角色:帮助中国团队出海,以及让外国团队更愿意进入中国。

我们看到那些出海的中国团队,无论是网易游戏、猎豹移动这种本身就以技术见长的,还是我爱我家这种主营业务并不是技术的,都很容易的就能够掌握 AWS 的用法、在各自的业务中充分发挥 AWS 的作用。

我们也看到那些进入中国的海外团队,虽然在进来之后面对这个中国版 AWS 陷入短暂的懵逼状态,但在摸清楚情况之后,也往往接受了其中国业务同时使用 AWS 与中国的其他云的混合方案。

最后,小编还想推荐各位关注本次 re:Invent 上的另外两个发布:

  1. Nitro Enclaves

  2. Accelerated Site-to-Site VPN

Nitro Enclaves 是最底层的加密,并且可以验证你部署的软件(binary)是否在中途被篡改过。加速 VPN 则是基于 AWS 去年发布的 Global Accelerator 实现的功能,号称可以将 VPN 提速 20% 以上,虽然没有 DirectConnect 快,但毕竟比 DirectConnect 价格便宜很多,更加普惠。

对于脱离了骨干网的云部署而言,除了标准化之外,安全与速度也是影响用户体验的关键要素。这三块真正做好了,混合云才有真正的未来。


欲了解更多 AWS re:Invent 信息,请关注 InfoQ AWS re:Invent 2019 专区

欲了解 AWS 的更多信息,请访问【AWS 技术专区】

评论

发布