写点什么

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它

  • 2019-08-05
  • 本文字数:1932 字

    阅读完需:约 6 分钟

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它

7 月 31 日,AWS技术峰会2019在北京举行,今年 AWS 技术峰会以「即刻构建」为主题,形象地阐释了云上服务的快捷性。



AWS 副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆


在开场演讲中,AWS 副总裁、全球技术与开发者布道师团队伊恩 · 马辛哈姆(Ian Massingham)针对 AWS 的优势和技术进行了主题演讲,再次强调 AWS 的重点是提供给软件开发人员和构建者更多的工具,让开发者构建以及扩展自己的应用,重点分享了关于云迁移、微服务、数据库、分析、机器学习、IoT 等方面的技术布局及最佳合作实践。


去年的 re:Invent 2018 峰会上,AWS 就明确了 2019 年在 AI 方向主打的战略:通过平台和工具让开发人员低成本的完成项目开发、对机器学习推理服务的重视、对 AI 工具的开发和重视。本次峰会上,InfoQ 很荣幸地采访到了 AWS 副总裁、全球技术与开发者布道师团队 伊恩 · 马辛哈姆(Ian Massingham),并聚焦于 AWS 机器学习板块和伊恩进行了交流。伊恩也在采访中透露,今年的 re:Invent 2019 还将在机器学习领域发布更多的重磅发布和新的消息。


回顾 AWS 在机器学习上的持续动作,可以看到其近几年的演进和革新,也可以窥见出其在 Machine Learning 这项技术上的推进思路:


  • 2015 年,AWS 首次推出 Amazon Machine Learning 服务;

  • 2016 年,AWS 针对机器视觉和语音交互推出了 Amazon Polly 、Amazon Rekognition 等 API;

  • 2017 年,AWS 推出了一个更全面的机器学习平台Amazon SageMaker

  • 2018 年,SageMaker 新增 200 多种机器学习新功能和服务;

  • 2019 年,AWS 推出 SageMaker Neo,解决边缘设备运行的问题,推出深度学习容器对 DeepLearning AMI 进行补充;为提升机器学习推理速度,AWS Inferentia 将在今年落地。


对于机器学习的火热,伊恩分享了自己的看法:一是因为机器学习平台、框架、软件的大量涌现,最近才能够让非政府的一些技术企业或者是非超大型企业也可以用得起机器学习;另一方面,云的发展让机器学习更容易,解决了需要大型计算设备以及数据不足的问题,有了云,数据的储存和计算变得更加方便,企业做机器学习方面的尝试成本就低得多了。


在 AWS 机器学习的技术架构中,上层是托管的人工智能或机器学习的应用服务,底层包括计算、存储在内的基础架构,中间层则是框架接口以及平台服务,形成广泛且深入的功能集合的机器学习技术栈,整个架构构成了用户可快速在 AWS 构建机器学习服务的基石,SageMaker 作为中间层承上启下的云机器学习平台,位置举足轻重。


对于 SageMaker 的作用,AWS 希望让有能力去改进框架和算法的开发者,尽可能少花费精力在那些跟主业无关的事情上,例如数据准备、部署集群、安装框架等需要耗费大量精力的事情。


到今天,SageMaker 的客户数量超过一万,AWS 仍在不断充实完善它。伊恩特别强调了竞价实例,“ 我们最近给 SageMaker 做了一个事情,就是开发者可以用它的 Spot Instance 竞价实例,类似于实例现货市场,通过 Spot Instance 竞价实例实现打折,它要比按需订购的 EC2 的折扣力度大得多,可以用它来做模型的训练。” 另外对 Ground Truth、SageMaker Neo、增强学习(RL)、DeepAR 等,伊恩也进行了重点介绍推荐。


除此之外,伊恩透露,由 AWS 设计的、专用于机器学习的芯片——AWS Inferentia或将在今年年底面世。关于 AWS 在机器学习芯片方向的发力,伊恩表示,AWS 看好机器学习在推理方向的发展,“事实上 AWS 开发硬件产品唯一的目的就是帮助客户降低他们使用技术的成本以及后期的运营成本,让开发人员能够更多的去使用这些机器学习的技术,为客户解决问题。“


对于 SageMaker 生态下一步计划,伊恩没有正面做回答,但是关于 SageMaker 最好的应用场景,伊恩提到了自己最喜欢的、来自美国一家电信商 T-Mobile 的应用案例。T-Mobile 当前正在使用 AWS 的机器学习服务来提升自身的客户服务,其开发出一套用于自然语言理解的机器学习模型,能从大量文本数据中提取信息,包括每天数十万量级的传入客户请求,以及包含可能回答客户查询的答案的知识库。在前期数据标注的过程中,T-Mobile 使用 Ground Truth 自动标记,然后通过机器学习模型预测哪些信息将满足特定客户的需求,实时为代理提供相关信息以确保快速准确地解决每个客户的问题。


“它会预测客户会打电话要什么样的服务,比如客户说我想问一下我的账单,后台就会了解一下客户账户的信息,通过出现的一些事件,一些合约签订等记录,用这样的数据来预测客户打进来可能最想问的是什么。然后,这个后台就能够有相应的人员和资源来应对这样的问答。比如,后台发现账单上一旦有错误,那代理之前就会知道,这个可能就是他想要问的问题。只有 T-Mobile 有这样自有的数据,它用 Sagemaker 来培训它的算法,所以机器学习用私有的数据来做训练其实是很主流的用途。“伊恩说。


2019-08-05 17:597048
用户头像
王利莹 InfoQ编辑

发布了 48 篇内容, 共 18.9 次阅读, 收获喜欢 36 次。

关注

评论

发布
暂无评论
发现更多内容

Spring MVC—XML配置与注解配置+使用注解完成请求参数绑定

Java 程序员 后端

Spring 数据库配置文件进行解密操作,和网易大佬的技术面谈

Java 程序员 后端

SpringBoot基于微服务架构的前后端分离博客系统源码免费赠送

Java 程序员 后端

Spring Cloud入门-Zuul服务网关(Hoxton版本)

Java 程序员 后端

Spring--快速入门,rabbitmq面试题总结

Java 程序员 后端

SpringBoot配置文件,springboot项目案例百度云

Java 程序员 后端

Spring MVC面试题(2020最新版),java书籍入门下载

Java 程序员 后端

springboo 使用自定义的 Tomcat,java常用的设计模式面试

Java 程序员 后端

SpringBoot源码学习系列之嵌入式Servlet容器

Java 程序员 后端

SpringCloudRPC调用核心原理:RxJava响应式编程框架,其他操作符

Java 程序员 后端

Spring动态代理时是如何解决循环依赖的?为啥用三级缓存?

Java 程序员 后端

Spring入门后半部分----JDBCTemplate和事务控制

Java 程序员 后端

Spring-Boot-+-Redis-实现接口幂等性,看这篇就太好了

Java 程序员 后端

springboot 整合 thymeleaf,java技术核心卷二

Java 程序员 后端

SpringBoot---错误处理机制,kafka实现负载均衡的原理

Java 程序员 后端

SpringBoot2---指标监控,kalilinux教程下载

Java 程序员 后端

SpringMVC--请求参数绑定,spring菜鸟教程

Java 程序员 后端

Spring中的循环依赖及解决,springboot入门与实践PDF

Java 程序员 后端

Spring Cloud Gateway自定义过滤器实战(观测断路器状态变化)

Java 程序员 后端

SpringBoot基于微服务架构的前后端分离博客系统源码免费赠送(1)

Java 程序员 后端

Spring中注解,java电话面试技巧

Java 程序员 后端

Spring总结以及在面试中的一些问题,java面试笔试题代码

Java 程序员 后端

Spring MVC+Spring+Mybatis实现支付宝支付功能

Java 程序员 后端

SpringBoot---入门和配置,深入java虚拟机百度云

Java 程序员 后端

springboot入门教程,4000多页合集的计算机、网络、算法知识总结

Java 程序员 后端

SpringBoot整合SpringSecurity超详细入门教程

Java 程序员 后端

Springboot过滤器和拦截器详解及使用场景,nginx原理和架构

Java 程序员 后端

Spring Cloud原理详解,java程序员进阶

Java 程序员 后端

SpringBoot中好用的数据连接池,入职3个月的Java程序员面临转正

Java 程序员 后端

SpringBoot中的yaml语法及静态资源访问问题,mysql面试笔试题

Java 程序员 后端

SpringCloud Alibaba 入坑(六),java开发程序员面试题

Java 程序员 后端

Amazon SageMaker 用户数量已过万,AWS 仍在不断充实完善它_服务革新_王利莹_InfoQ精选文章