写点什么

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它

  • 2019-08-05
  • 本文字数:1932 字

    阅读完需:约 6 分钟

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它

7 月 31 日,AWS技术峰会2019在北京举行,今年 AWS 技术峰会以「即刻构建」为主题,形象地阐释了云上服务的快捷性。



AWS 副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆


在开场演讲中,AWS 副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆(Ian Massingham)针对 AWS 的优势和技术进行了主题演讲,再次强调 AWS 的重点是提供给软件开发人员和构建者更多的工具,让开发者构建以及扩展自己的应用,重点分享了关于云迁移、微服务、数据库、分析、机器学习、IoT 等方面的技术布局及最佳合作实践。


去年的 re:Invent 2018 峰会上,AWS 就明确了 2019 年在 AI 方向主打的战略:通过平台和工具让开发人员低成本的完成项目开发、对机器学习推理服务的重视、对 AI 工具的开发和重视。本次峰会上,InfoQ 很荣幸地采访到了 AWS 副总裁、全球技术与开发者布道师团队 伊恩 · 马辛哈姆(Ian Massingham),并聚焦于 AWS 机器学习板块和伊恩进行了交流。伊恩也在采访中透露,今年的 re:Invent 2019 还将在机器学习领域发布更多的重磅发布和新的消息。


回顾 AWS 在机器学习上的持续动作,可以看到其近几年的演进和革新,也可以窥见出其在 Machine Learning 这项技术上的推进思路:


  • 2015 年,AWS 首次推出 Amazon Machine Learning 服务;

  • 2016 年,AWS 针对机器视觉和语音交互推出了 Amazon Polly 、Amazon Rekognition 等 API;

  • 2017 年,AWS 推出了一个更全面的机器学习平台Amazon SageMaker

  • 2018 年,SageMaker 新增 200 多种机器学习新功能和服务;

  • 2019 年,AWS 推出 SageMaker Neo,解决边缘设备运行的问题,推出深度学习容器对 DeepLearning AMI 进行补充;为提升机器学习推理速度,AWS Inferentia 将在今年落地。


对于机器学习的火热,伊恩分享了自己的看法:一是因为机器学习平台、框架、软件的大量涌现,最近才能够让非政府的一些技术企业或者是非超大型企业也可以用得起机器学习;另一方面,云的发展让机器学习更容易,解决了需要大型计算设备以及数据不足的问题,有了云,数据的储存和计算变得更加方便,企业做机器学习方面的尝试成本就低得多了。


在 AWS 机器学习的技术架构中,上层是托管的人工智能或机器学习的应用服务,底层包括计算、存储在内的基础架构,中间层则是框架接口以及平台服务,形成广泛且深入的功能集合的机器学习技术栈,整个架构构成了用户可快速在 AWS 构建机器学习服务的基石,SageMaker 作为中间层承上启下的云机器学习平台,位置举足轻重。


对于 SageMaker 的作用,AWS 希望让有能力去改进框架和算法的开发者,尽可能少花费精力在那些跟主业无关的事情上,例如数据准备、部署集群、安装框架等需要耗费大量精力的事情。


到今天,SageMaker 的客户数量超过一万,AWS 仍在不断充实完善它。伊恩特别强调了竞价实例,“ 我们最近给 SageMaker 做了一个事情,就是开发者可以用它的 Spot Instance 竞价实例,类似于实例现货市场,通过 Spot Instance 竞价实例实现打折,它要比按需订购的 EC2 的折扣力度大得多,可以用它来做模型的训练。” 另外对 Ground Truth、SageMaker Neo、增强学习(RL)、DeepAR 等,伊恩也进行了重点介绍推荐。


除此之外,伊恩透露,由 AWS 设计的、专用于机器学习的芯片——AWS Inferentia或将在今年年底面世。关于 AWS 在机器学习芯片方向的发力,伊恩表示,AWS 看好机器学习在推理方向的发展,“事实上 AWS 开发硬件产品唯一的目的就是帮助客户降低他们使用技术的成本以及后期的运营成本,让开发人员能够更多的去使用这些机器学习的技术,为客户解决问题。“


对于 SageMaker 生态下一步计划,伊恩没有正面做回答,但是关于 SageMaker 最好的应用场景,伊恩提到了自己最喜欢的、来自美国一家电信商 T-Mobile 的应用案例。T-Mobile 当前正在使用 AWS 的机器学习服务来提升自身的客户服务,其开发出一套用于自然语言理解的机器学习模型,能从大量文本数据中提取信息,包括每天数十万量级的传入客户请求,以及包含可能回答客户查询的答案的知识库。在前期数据标注的过程中,T-Mobile 使用 Ground Truth 自动标记,然后通过机器学习模型预测哪些信息将满足特定客户的需求,实时为代理提供相关信息以确保快速准确地解决每个客户的问题。


“它会预测客户会打电话要什么样的服务,比如客户说我想问一下我的账单,后台就会了解一下客户账户的信息,通过出现的一些事件,一些合约签订等记录,用这样的数据来预测客户打进来可能最想问的是什么。然后,这个后台就能够有相应的人员和资源来应对这样的问答。比如,后台发现账单上一旦有错误,那代理之前就会知道,这个可能就是他想要问的问题。只有 T-Mobile 有这样自有的数据,它用 Sagemaker 来培训它的算法,所以机器学习用私有的数据来做训练其实是很主流的用途。“伊恩说。


2019-08-05 17:597163
用户头像
王利莹 InfoQ编辑

发布了 48 篇内容, 共 19.4 次阅读, 收获喜欢 36 次。

关注

评论

发布
暂无评论
发现更多内容

如何将外连接向内连接转换?

华为云开发者联盟

sql 数仓 GaussDB(DWS) 外连接 内连接

简单聊聊汽车OTA给OEM和Tire1带来的变化

SOA开发者

程序员 职业成长 汽车

数据中心建设很复杂,但选择却能很简单:华为数据中心的多维创新

穿越时空,跟我一起探索云栖数字谷(2021云栖大会免费送票)

阿里云CloudImagine

人工智能 云计算 阿里云 行业资讯 视频云

【上汽零束SOA】云管端一体化SOA软件平台系列介绍之五:服务实现篇

SOA开发者平台

软件 车联网 物联网 汽车

Apollo 配置中心详细教程

牧小农

Apollo 阿波罗

数字货币钱包开发,imtoken钱包系统搭建

13530558032

Opus从入门到精通(二):编解码器使用

轻口味

android 音视频 编解码 9月日更

【OpenIM原创】IM服务端docker、源码、集群部署 非常实用

OpenIM

3年才能驾驭新技术,不如试试这个低代码魔方

华为云开发者联盟

低代码 开发 华为云应用魔方 应用程序 魔方

【上汽零束SOA】云管端一体化SOA软件平台系列介绍之五:服务实现篇

SOA开发者

软件 SOA

等保三级多久测评一次?每年都要测评吗?

行云管家

网络安全 信息安全 等保

百度智慧输入,会是企业降本增效的“新生产力”吗?

ToB行业头条

百度 企业服务 百度输入法

终于完成了私有NPM和PYPI repo的搭建

吴脑的键客

npm nexus pypi

高可用 | 关于 Xenon 高可用的一些思考

RadonDB

MySQL 数据库

Java 17 正式发布,Oracle 宣布从 JDK 17 开始正式免费,Java 迈入新时代

Java 编程 源码 架构

【云计算】从事云计算运维可以考取哪些证书?

行云管家

云计算 阿里云 运维 华为云 云运维

分布式系统中协调和复制技术的原理

博文视点Broadview

计划会议要开始了,产品负责人却没来…

华为云开发者联盟

Scrum PO 开发团队 计划会议 Sprint

NQI质量基础设施一站式方案,NQI一站式线上平台搭建

13530558032

量化交易APP开发,量化交易系统源码

13530558032

【上汽零束SOA】云管端一体化SOA软件平台系列介绍之六:数字生态篇

SOA开发者

自动驾驶 SOA 智能汽车 OTA

Canal Admin 高可用集群使用教程

Se7en

建立测试自动化策略【译】

FunTester

自动化测试 测试框架 测试管理 测试策略 FunTester

【上汽零束SOA】云管端一体化SOA软件平台系列介绍之六:数字生态篇

SOA开发者平台

软件 SOA 生态 汽车 OTA

模块3-作业

笑看风雨情

Python——静态方法与类方法、类的导入

在即

9月日更

MapReduce 示例:减少 Hadoop MapReduce 中的侧连接

华为云开发者联盟

hadoop mapreduce 排序 侧连接 联接

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它_服务革新_王利莹_InfoQ精选文章