【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它

  • 2019-08-05
  • 本文字数:1932 字

    阅读完需:约 6 分钟

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它

7 月 31 日,AWS技术峰会2019在北京举行,今年 AWS 技术峰会以「即刻构建」为主题,形象地阐释了云上服务的快捷性。



AWS 副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆


在开场演讲中,AWS 副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆(Ian Massingham)针对 AWS 的优势和技术进行了主题演讲,再次强调 AWS 的重点是提供给软件开发人员和构建者更多的工具,让开发者构建以及扩展自己的应用,重点分享了关于云迁移、微服务、数据库、分析、机器学习、IoT 等方面的技术布局及最佳合作实践。


去年的 re:Invent 2018 峰会上,AWS 就明确了 2019 年在 AI 方向主打的战略:通过平台和工具让开发人员低成本的完成项目开发、对机器学习推理服务的重视、对 AI 工具的开发和重视。本次峰会上,InfoQ 很荣幸地采访到了 AWS 副总裁、全球技术与开发者布道师团队 伊恩 · 马辛哈姆(Ian Massingham),并聚焦于 AWS 机器学习板块和伊恩进行了交流。伊恩也在采访中透露,今年的 re:Invent 2019 还将在机器学习领域发布更多的重磅发布和新的消息。


回顾 AWS 在机器学习上的持续动作,可以看到其近几年的演进和革新,也可以窥见出其在 Machine Learning 这项技术上的推进思路:


  • 2015 年,AWS 首次推出 Amazon Machine Learning 服务;

  • 2016 年,AWS 针对机器视觉和语音交互推出了 Amazon Polly 、Amazon Rekognition 等 API;

  • 2017 年,AWS 推出了一个更全面的机器学习平台Amazon SageMaker

  • 2018 年,SageMaker 新增 200 多种机器学习新功能和服务;

  • 2019 年,AWS 推出 SageMaker Neo,解决边缘设备运行的问题,推出深度学习容器对 DeepLearning AMI 进行补充;为提升机器学习推理速度,AWS Inferentia 将在今年落地。


对于机器学习的火热,伊恩分享了自己的看法:一是因为机器学习平台、框架、软件的大量涌现,最近才能够让非政府的一些技术企业或者是非超大型企业也可以用得起机器学习;另一方面,云的发展让机器学习更容易,解决了需要大型计算设备以及数据不足的问题,有了云,数据的储存和计算变得更加方便,企业做机器学习方面的尝试成本就低得多了。


在 AWS 机器学习的技术架构中,上层是托管的人工智能或机器学习的应用服务,底层包括计算、存储在内的基础架构,中间层则是框架接口以及平台服务,形成广泛且深入的功能集合的机器学习技术栈,整个架构构成了用户可快速在 AWS 构建机器学习服务的基石,SageMaker 作为中间层承上启下的云机器学习平台,位置举足轻重。


对于 SageMaker 的作用,AWS 希望让有能力去改进框架和算法的开发者,尽可能少花费精力在那些跟主业无关的事情上,例如数据准备、部署集群、安装框架等需要耗费大量精力的事情。


到今天,SageMaker 的客户数量超过一万,AWS 仍在不断充实完善它。伊恩特别强调了竞价实例,“ 我们最近给 SageMaker 做了一个事情,就是开发者可以用它的 Spot Instance 竞价实例,类似于实例现货市场,通过 Spot Instance 竞价实例实现打折,它要比按需订购的 EC2 的折扣力度大得多,可以用它来做模型的训练。” 另外对 Ground Truth、SageMaker Neo、增强学习(RL)、DeepAR 等,伊恩也进行了重点介绍推荐。


除此之外,伊恩透露,由 AWS 设计的、专用于机器学习的芯片——AWS Inferentia或将在今年年底面世。关于 AWS 在机器学习芯片方向的发力,伊恩表示,AWS 看好机器学习在推理方向的发展,“事实上 AWS 开发硬件产品唯一的目的就是帮助客户降低他们使用技术的成本以及后期的运营成本,让开发人员能够更多的去使用这些机器学习的技术,为客户解决问题。“


对于 SageMaker 生态下一步计划,伊恩没有正面做回答,但是关于 SageMaker 最好的应用场景,伊恩提到了自己最喜欢的、来自美国一家电信商 T-Mobile 的应用案例。T-Mobile 当前正在使用 AWS 的机器学习服务来提升自身的客户服务,其开发出一套用于自然语言理解的机器学习模型,能从大量文本数据中提取信息,包括每天数十万量级的传入客户请求,以及包含可能回答客户查询的答案的知识库。在前期数据标注的过程中,T-Mobile 使用 Ground Truth 自动标记,然后通过机器学习模型预测哪些信息将满足特定客户的需求,实时为代理提供相关信息以确保快速准确地解决每个客户的问题。


“它会预测客户会打电话要什么样的服务,比如客户说我想问一下我的账单,后台就会了解一下客户账户的信息,通过出现的一些事件,一些合约签订等记录,用这样的数据来预测客户打进来可能最想问的是什么。然后,这个后台就能够有相应的人员和资源来应对这样的问答。比如,后台发现账单上一旦有错误,那代理之前就会知道,这个可能就是他想要问的问题。只有 T-Mobile 有这样自有的数据,它用 Sagemaker 来培训它的算法,所以机器学习用私有的数据来做训练其实是很主流的用途。“伊恩说。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-08-05 17:596715
用户头像
王利莹 InfoQ编辑

发布了 48 篇内容, 共 16.6 次阅读, 收获喜欢 36 次。

关注

评论

发布
暂无评论
发现更多内容

一文带你了解什么是GitOps

华为云开发者联盟

DevOps 运维 测试 软件开发 gitops

体育锻炼的好处

Tiger

28天写作

使用 Python Poetry 进行依赖管理

华为云开发者联盟

Python Python Poetry 依赖项管理 Poetry

2022 用好这 8 个工具,提升前端工程师软技能

开源之巅

Web 前端开发

上百台linux服务器管理用什么软件好?谁给推荐一下!

行云管家

Linux 服务器 服务器管理

Linux环境变量配置

恒生LIGHT云社区

Linux 运维 环境配置 环境变量

短视频如何有效去重?vivo 短视频分享去重实践

Zilliz

数据库 Milvus Zilliz

面对持续不断生成的流数据—— Amazon Kinesis Data Analytics 实现及时分析与处理

亚马逊云科技 (Amazon Web Services)

分析

kafka的JavaAPI操作

编程江湖

大数据

如何摆脱机房教师控制?

喀拉峻

网络安全 安全 信息安全 计算机

外贸订单回暖,集装箱持续爆舱,低代码或将成外贸行业新财富密码

优秀

低代码 外贸管理

使用Amazon RDS for Oracle配合Oracle Active Data Guard建立托管的灾难恢复与只读副本

亚马逊云科技 (Amazon Web Services)

分析

技术分享| 如何快速实现音视频在线通话

anyRTC开发者

音视频 语音通话 视频通话 呼叫邀请 离线推送

在高并发环境下该如何构建应用级缓存

华为云开发者联盟

缓存 高并发 负载 应用级缓存 缓存命中率

通过Amazon SageMaker与Amazon Step Functions实现机器学习的CI/CD 方案

亚马逊云科技 (Amazon Web Services)

分析

​虚幻引擎5更新:头部工作室如何使用Perforce Stream实现虚幻升级

龙智—DevSecOps解决方案

虚幻引擎 虚幻引擎5 UE5

直播预告丨和我们一起过圣诞吧!Hackathon 创意攻略等你查收

PingCAP

使用 Amazon Athena 做漏斗分析——实现更高效的数据湖检索

亚马逊云科技 (Amazon Web Services)

分析

借助Amazon EMR与外部KDC进行身份认证,有效集成业务场景

亚马逊云科技 (Amazon Web Services)

分析

Vue.js关于响应式部分的优化

编程江湖

前端开发

2022 年最有前景的 5 个 Web IDE

开源之巅

开发者工具 WebIDE

Amazon Timestream 在车联网场景的典型应用和性能测试

亚马逊云科技 (Amazon Web Services)

分析

在Amazon SageMaker上快速、灵活构建TensorFlow模型的在线推理服务

亚马逊云科技 (Amazon Web Services)

分析

风云叱咤,尚硅谷云原生实战教程(下篇)发布

编程江湖

Java 开发

Go 的 golang.org/x/ 系列包和标准库包有什么区别?

AlwaysBeta

golang Go 语言

大数据开发 Spark 模块之SparkSQL

@零度

大数据 spark Sparksql

“你最崇拜的人是谁”,从面试问题看标杆学习法

编程江湖

面试题

读《思辨与立场》-08设计你的人生

wood

28天写作 批判性思维 思辨与立场

模块7作业

panxiaochun

架构实战营

互联网行业办理过等保业务,选择哪款堡垒机好?

行云管家

互联网 网络安全 堡垒机 云堡垒机

如何做好技术 Team Leader?

阿里技术

技术管理 技术人 内容合集

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它_服务革新_王利莹_InfoQ精选文章