AWS re:Invent 第二天:SageMaker 开发者工具全家桶闪亮登场

阅读数:2401 2019 年 12 月 4 日 09:02

AWS re:Invent第二天:SageMaker开发者工具全家桶闪亮登场

拉斯维加斯时间 2019 年 12 月 3 日,AWS re:Invent 大会进入第二天。在早上的主题演讲环节,AWS CEO Andy Jassy 再次发布了一连串新服务,简单挑选部分、总结如下,供各位读者参考。

基础架构层

新的 EC2 实例: M6g、R6g 与 C6g

这三款新实例采用了第二代 AWS 定制的 ARM 芯片——graviton2。有意思的是这次的实例不再以 A 系列命名(第一代使用 graviton 的实例名称叫做 A1),而是直接放入了 M 系列、R 系列与 C 系列。

新的 EC2 实例: Inf1

这款实例专门针对机器学习过程中的推断(inference)负载进行了优化。

新的容器服务: Amazon Fargate for Amazon EKS

Fargate 首次在去年发布,可以让上层用户以 serverless 的方式使用容器。去年仅支持 ECS,今年增加了对 EKS 的支持。

新的网络服务

网络服务的增强目前看来是今年 AWS re:Invent 的重头,不过 Andy Jassy 表示后面几天才会深入介绍这一系列的网络服务。目前看到的产品名称有 AWS Transit Gateway Multicast、AWS Accelerated Site to Site VPN、AWS Transit Gateway Inter-Region Peering、AWS Transit Gateway Network Manager,有助于客户建立全球性的私有网络。

数据层

Amazon S3 Access Points

配合 IAM,管理员可以更加精准的控制哪些应用有权限访问 S3 上的哪些数据。

Amazon Redshift RA3 Instances with Managed Storage

这个 RA3 实例的特点是可以把计算资源的使用与存储资源的使用分别计费,那些只使用存储的部分就只需要为存储空间付费,不需要为计算资源付费。

AQUA for Amazon Redshift

这是一个非常有意思的新发布!可以说它是 AWS 团队为应对未来的性能优化趋势的一个尝试。对于云计算三大核心组件——计算、存储、网络,目前网络是一个很大的性能瓶颈,所以 AWS 做了 nitro 系统在这方面做了很多优化。但是除了网络之外,我们看到自从 2012 年以来至今,CPU 的吞吐能力仅仅增加了 2 倍,而 SSD 存储的吞吐能力已经增长了 12 倍,按照这个趋势下去,下一个性能瓶颈将会出现在 CPU 上,而 SSD 的吞吐能力将有冗余。这个 AQUA 的全称叫做 Advanced Query Accelerator,是一个查询加速器,加速器的工作原理是把原本放在 CPU 上处理的查询放到 SSD 上运行——这也是一种因为 nitro 系统而成为可能的操作方式。

UltraWarm

数据有冷数据,也有热数据。S3 有 Glacier 针对冷数据的低成本存储,而这次发布的 UltraWarm 则是针对 ElasticSearch 上的热数据——那些新鲜的日志文件。因为企业用户常有分析日志的需求,一直放在 ElasticSearch 上成本又太高,这种情况就可以把这些数据放到 UltraWarm 上,成本可以降低 90%。

数据库产品线新成员: Amazon Managed Cassandra Service

如果你需要在 AWS 上用 Cassandra,那么这个服务可以帮你省下不少维护的功夫。坦白讲在 2019 年看到这个服务的发布让小编有点吃惊——这说明现在在 AWS 上运行 Cassandra 的客户不会在少数。

机器学习

TensorFlow、PyTorch、mxnet

AWS 对这三个机器学习框架在 AWS 上的性能做了全面优化,号称比山景城某司的私有部署环境的性能还要超出 20% 以上。

Amazon SageMaker Studio 全家桶

开发者对集成开发环境(IDE)不陌生,但目前看来针对机器学习的开发者还没有特别合适的 IDE。这一次发布的 SageMaker Studio 号称是针对机器学习开发者的 IDE,并且从本次发布的阵营来看,远远不仅仅是一个在线代码编辑器而已!本次发布已经包含如下组件:

  • Amazon SageMaker Notebooks - 用来存放机器学习工作流、代码片段、文档、运行结果等信息

  • Amazon SageMaker Experiments - 一个项目里可以保存多个实验(experiments),不同的实验可以有不同的配置,可以方便的对不同实验进行搜索、比对。

  • Amazon SageMaker Debugger - 一个调试工具,调试结果可以在 Notebooks 里面查看。

  • Amazon SageMaker Model Monitor - 有的时候,一个模型在 2016 年、2017 年都能做出很好的预测,到 2018 年却不行了,因为外部环境改变了——比如银行利率的影响因子、乃至于影响方式的改变。这个 Monitor 工具可以自动检测模型是否仍然可以准确预测,在预测变得不准确的时候发出提醒以及给出可能的猜测。

  • Amazon SageMaker Autopilot - 在春天,你把训练数据列表放到一个 csv 文件里;到秋天,你收获了一堆模型,可以选一个最好的进行部署。这个自动化机器学习工具是不是像它描述的这么神奇?试试看大概会知道吧。

如果说今天的主题演讲最热门的发布是啥,小编觉得一定就是这套 Amazon SageMaker 开发者工具全家桶了。

AWS re:Invent第二天:SageMaker开发者工具全家桶闪亮登场

AI 应用层服务

Amazon Fraud Detector

如果你有一个用户的历史登录行为数据与购买数据,你把这个数据告诉这个 Web 服务,这个服务就会告诉你这个用户是不是骗子。

Amazon CodeGuru

如果你在 Github 或者 CodeCommit 上做开发,你可以在发 pull request 的时候同步给这位 CodeGuru,然后它就会给你做自动化的代码审查(code review),并且把审查结果发布到评论里。对那些缺乏 reviewer 的项目来说,这个 CodeGuru 简直像是一大神器!具体效果如何,还要等那些具体用过的同学们反馈了才知道。无论如何,有 code review 总是比没有强。而且这个 CodeGuru 号称自己最擅长做的事情是“找到代码中最拖累效率的那一行”,非常有助于提升整体代码的性能。

Contact Lens for Amazon Connect

Amazon Connect 智能客服服务已经上线运行了几年,于是有客户提出各种意见:能不能自动分析客户的通话?客户对我们生气的地方是什么?我能不能搜索客户的历史通话?等等。于是 AWS 就把一系列服务打了个包,做成了这个 Contact Lens 数据分析服务。同时,AWS 团队意识到这么一个服务其实也可以用在企业的内部数据上、产生新的价值,于是又同时做了另一个服务:

Amazon Kendra

这个 Kendra 服务的用法是,企业可以把自己过去的内部文档——无论是 word 还是 pdf 还是在线文档——授权给该服务,然后添加一些 FAQ(常见问题)。之后,该服务会巡逻这些文档、建成索引,生成能听懂人话的问答服务。

至此,AWS 在人工智能领域的服务能力又往前走了一大截。

不同部署环境下的 AWS

私有云部署 AWS Outposts

AWS 在去年发布的 Outposts 服务回应了企业对私有化部署的需求,不过当时还是一个 Preview,本次则正式可用了,这意味着以后用私有云的企业客户也可以在私有云环境里使用跟 AWS 公有云上一样体验的 API。另外,VMware Cloud on AWS 的部署将在 2020 年可用。

让没有 AZ 的城市也能低延迟用上 AWS 服务的 Local Zones

AWS 目前虽然在全球已经做了 22 个区域(Region)、69 个可用区(AZ),但全球一共有一万多城市,很多城市用 AWS 的延时还是比较高的,有一定的用户数量。于是就有了 Local Zones:这是一个 Region 的延伸单元,可以由 AWS 原有基础架构中就存在的边缘站点(Placement Group)改造而成,也可以新建,配备了 EC2、EBS、FSx、VPC、ELB、RDS 等最基本的 AWS 服务,放置在一个城市的周边为该城市的用户提供服务。

让 5G 用户也能低延迟用上 AWS 服务的 AWS Wavelength

AWS 把基础架构延伸到运营商合作伙伴的 5G 网络边缘,作为一个 Wavelength Zone,给 5G 网络覆盖的用户就近提供 Web 服务。目前公开的运营商合作伙伴,在美国是 Verizon,欧洲是 Vodafone,日本是 KDDI,韩国是 SK Telecom。


欲了解更多 AWS re:Invent 信息,请关注 InfoQ AWS re:Invent 2019 专区

延展阅读

AWS re:Invent 第一日新品发布一览

欲了解 AWS 的更多信息,请访问【AWS 技术专区】

评论

发布