AI Agent、AI Infra、RAG 、出海合规,2024 前瞻性和实用性技术案例都在这里了 了解详情
写点什么

AWS 如何将机器学习送到每位开发者和 BI 分析师手中

  • 2020-04-07
  • 本文字数:2867 字

    阅读完需:约 9 分钟

AWS 如何将机器学习送到每位开发者和BI分析师手中

今天,AWS 宣布推出了数种轻松地向应用程序和 BI 控制面板中添加机器学习预测能力的新方法。仅需在您的结构化查询语言 (SQL) 中添加一些语句,在Amazon QuickSight中进行几次点击,即能轻松使用您的 Amazon Aurora 数据库中的关系型数据或Amazon S3 中的非结构化数据,为应用程序和商业智能 (BI) 控制面板添加机器学习 (ML) 预测。Aurora、Amazon Athena 和 Amazon QuickSight 可以直接调用 Amazon SageMakerAmazon Comprehend 等 AWS ML 服务,因此您无需从自己的应用程序中调用它们。这使得您可以以更直接的方式向应用程序添加 ML 预测,无需构建定制集成,来回复制数据,学习多种独立工具,编写多行复杂代码等等,甚至无需具备 ML 经验。


这些新的特性允许通过 SQL 查询和控制面板执行尖端的 ML 预测,从而使 ML 变得更加实用,更方便数据库开发人员和商业分析师使用。在以前,您可能会耗费多日编写应用程序中定制代码,并需要考虑在生产环境中扩展、管理和支持。而现在,任何具备编写 SQL 能力的人,都可以在没有任何定制的”胶合代码”的情况下,在应用程序中构建和使用 ML 预测。

数据横流的世界

AWS 坚信,在不久的未来,每个应用程序均会融入 机器学习(ML) 和人工智能 (AI)。数万客户可通过 Amazon SageMaker 享受 ML 带来的好处。Amazon SageMaker 是一种完全托管服务,可以帮助数据科学家和开发人员轻松、快速地构建、训练和部署大规模 ML 模型。


虽然目前有多种可用于构建模型及通过易用 API (如 Amazon Comprehend)使应用程序智能化的方法,但要将这些模型整合到您的数据库、分析和商业智能报告中,依然面临着技术挑战。请考虑一个相对简单的客户服务示例。Amazon Comprehend 可以快速评估一段文字所表达的情绪(是积极的还是消极的?)。假设我在一家商店的客户服务页面留下这样一条反馈:“你的产品太差劲了,我不会再购买你的产品!” 商店根据用户反馈进行情绪分析,然后立即联系我试图作出弥补,这一系列工作对他们来说可能非常琐碎。尽管他们的数据库中有可用的数据,同时也有广泛的 ML 服务可用。


难点在于,构建预测流程需要在模型和应用程序之间移动数据。


在过去,开发人员被迫执行大量复杂的人工作业才能够获取这些预测,再将相关结果加入到更广泛的应用程序、流程或分析控制面板当中。相关工作包括,在向 ML 模型提交数据前,以及将预测结果提供给您的应用程序使用前,需要开发毫无价值的枯燥的应用程序级代码,用于在不同数据库和存储位置之间复制数据,转换各种数据格式。整个过程相当繁琐。这样的工作复杂累赘,浪费了开发人员的宝贵时间,且效率低下。此外,把数据库的数据移入和移出也会对安全造成压力,使管理变得更加复杂。

让机器学习成为每个开发人员手中的利器

在 AWS,我们有着明确的使命:我们致力于让机器学习成为每个开发人员的利器。让您更轻松地运用尖端的 ML 服务,以帮助您提升业绩。不同规模的企业客户依赖于 Amazon SageMaker 和 Amazon Comprehend 等 AWS ML 服务,其中不乏 NFL、Intuit、AstraZeneca 和 Celgene 等企业。以 Celgene 为例,该公司使用 AWS ML 服务进行毒理学预测,通过虚拟方式分析潜在药物的生物学影响,不必让病患冒险试药。以前需要花上两个月时间训练的模型,现在只需要四个小时就能完成。


尽管 AWS 提供的 AI 和 ML 服务覆盖面最广、最深入,同时我们仅在 2018 年一年当中就推出了 200 余种机器学习功能和能力,但我们认为还需要更多。在各种各样的创新实践中,最佳的选择便是让您现有的人员能够直接具备 ML 生产力。


尤其是现有的开发人员和商业分析师。


尽管我们所提供了能够提高数据科学家们的工作效率的服务,但我们仍希望让更多的应用程序开发人员也可以使用完全云原生的 尖端 ML 服务。有众多的客户使用 Aurora,同时也擅长使用 SQL 进行编程。我们认为,让您在此数据上运行机器学习预测才是最重要的,这样您可以在不影响既有的事务处理的情况下,获取创新的数据分析方式。您可以像之前一样针对您的业务数据使用 Amazon SageMaker 训练 ML 模型,然后运用 Aurora 或 Athena 的新能力,在一行 SQL 里利用该模型运行预测。这使得 ML 模型可供更多应用程序开发人员获取和使用。


销售线索评分就是一个好例子。例如,如果您基于 Aurora 构建一个 CRM 系统,那么您将会把所有的客户关系数据、市场触达和销售线索等信息保存到数据库中。当销售线索从网页上录入后,就会保存进 Aurora,而您的销售团队则会对其进行跟进,将它们转化为真正的订单。


但要是您希望帮助您的销售团队加快处理效率,又该从何入手呢? 销售线索评分是一个预测模型。该模型有助于验证和评估新增的销售线索,让销售团队可以判断哪些最有可能转化为订单,从而提高团队的效能。您可以使用自己构建的模型,或者从 AWS 机器学习市场(AWS ML Marketplace 购买模型,将其部署到 Amazon SageMaker,再根据模型预测的优先级对所有销售队列进行排序。与过去不同的是,您不必编写任何胶合代码。


又或者,您可能想搭配使用这些服务实现一个最佳优惠的使用案例。例如,您的客户可能会致电您的呼叫中心进行投诉。客户服务代表成功解决了问题,继而向客户推荐新产品和服务。但要如何推荐产品和服务呢? 其实,该客户服务代表可以在显示多个视图和建议的 Amazon QuickSight 控制面板上拉取产品推荐。


第一个视图根据 Aurora 查询显示产品推荐。查询可拉取到客户资料、购物记录和产品目录,并调用 Amazon SageMaker 中的模型生成产品推荐。第二个视图显示了拉取到客户浏览历史或 S3 数据湖点击流数据的 Athena 查询,并调用 Amazon SageMaker 模型生成产品推荐。第三个视图显示了从第一个视图和第二个视图获取结果的 Amazon QuickSight 查询,调用 Amazon SageMaker 中的联合模型,然后生成产品推荐。现在您可以根据客户的不同意见提供多种优惠信息。所有信息都在一个控制面板中显示出来。


在 BI 分析师方面,我们经常听闻客户的挫败体验,即在从模型获取预测前必须先构建和管理预测管道。之前,开发人员需要花数天时间编写应用程序级代码,以在多个模型和应用程序之间来回移动数据。您现在可以选择弃用您的预测管道,改用 Amazon QuickSight 将您的所有 ML 预测可视化并作出报告。


对于应用程序开发人员和商业分析师来说,这些新特性使得他们可以以更直接的方式向应用程序添加 ML 预测,无需尝试构建定制集成,移动数据,学习多种独立工具,编写多行复杂代码等等,甚至在不具备 ML 经验的条件下也可以使用。如今您可以向 SQL 查询添加一些语句,在 Amazon QuickSight 中几次点击,即可完成过去占用开发人员多日的工作。


透过这些方式,我们让更多开发人员和数据分析师可以获取 ML 的强大力量,而无需博士学位的加持。


作者介绍:Matt Asay(发音:“Ay-see”)是 AWS 的一名首席专家,在各大开源和大数据公司累积了近二十年从业经验。您可以关注他的 Twitter 帐号 (@mjasay)。


本文转载自 AWS 技术博客。


原文链接:https://amazonaws-china.com/cn/blogs/china/how-aws-is-putting-machine-learning-in-the-hands-of-every-developer-and-bi-analyst/


2020-04-07 17:22500

评论

发布
暂无评论
发现更多内容

劳动节,聊聊AI究竟在替代谁的工作?

脑极体

AI

2/28 业务系统高可用设计(上)

hackstoic

架构设计 TGO写作小组28天挑战

[LINUX使用] iptables/tcpdump/wireshark/tshark

百度搜索:蓝易云

云计算 Linux 运维 iptables NAT

TIKV分布式事务的异常处理逻辑

TiDB 社区干货传送门

TiKV 底层架构 学习&认证&课程

【TiDB 社区走进 360】5 月 18 日北京站!和大咖们聊聊全球视野下的 TiDB 应用实践!如何做到成本、效率两手抓!

TiDB 社区干货传送门

TiDB 升级方案选择

TiDB 社区干货传送门

实践案例 版本升级

淘宝商品详情API接口:实时获取SKU价格及库存信息

技术冰糖葫芦

API Explorer API boy pinduoduo API

开源框架 NanUI 项目宣布将暂停开发,作者转行卖钢材

源字节1号

开源 软件开发 前端开发 后端开发 小程序开发

【Java代码规范】阿里编码规约 VS CheckStyle

百度搜索:蓝易云

Java 云计算 Linux 运维 checkstyle

如何在Ubuntu 20.04|18.04上安装FreeSwitch

百度搜索:蓝易云

云计算 Linux 运维 FreeSwitch

OpenMLDB v0.9.0 发布:SQL 能力大升级覆盖特征上线全流程

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

解决SpringBoot项目war部署到tomcat下无法Nacos中注册服务问题

百度搜索:蓝易云

tomcat Linux 运维 Spring Boot nacos

Linux中的chgrp命令及示例

百度搜索:蓝易云

云计算 Linux 运维 云服务器 chgrp

阿里云ubuntu服务器搭建ftp服务器

百度搜索:蓝易云

云计算 ubuntu 运维 云服务器 vsftpd

唐刘:关于产品质量的思考 - UT in TiDB

TiDB 社区干货传送门

数据库前沿趋势

php如何设置随机数

百度搜索:蓝易云

php 云计算 Linux 运维 云服务器

《自动机理论、语言和计算导论》阅读笔记:p215-p351

codists

编译原理

OceanBase开发者大会·2024精彩PPT合集

菜根老谭

oceanbase

Linux设备驱动系列(十)——等待队列Waitqueue

Linux内核拾遗

队列 Linux内核 设备驱动

AI 如何赋能优质直播内容创作?

自象限

Linux下搭建Java环境[IDEA,JDK8,Tomcat]

百度搜索:蓝易云

Java tomcat Linux IDEA jdk8

ubuntu 20.04设置authorized_keys让VS Code ssh远程免密连接

百度搜索:蓝易云

Linux ubuntu 运维 SSH Code

唐刘:关于产品质量的思考 - 测试的窘境

TiDB 社区干货传送门

数据库前沿趋势

数据库不应该盲目的只看通用基准测试,还有更重要的东西

TiDB 社区干货传送门

数据库前沿趋势

理想中的开源社区是怎么样的?来自 TiDB 社区运营表妹的浅认识

TiDB 社区干货传送门

一次元数据锁MDL故障排查经历

TiDB 社区干货传送门

实践案例 故障排查/诊断 7.x 实践

AWS 如何将机器学习送到每位开发者和BI分析师手中_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章