写点什么

Amazon Web 服务开展机器学习服务

  • 2015-04-20
  • 本文字数:1259 字

    阅读完需:约 4 分钟

Amazon Web 服务最近启动了一项机器学习的服务,使用户可以在云端学习预测模型了。主流云服务供应商中的Google 和微软分别推出了预测API 和Azure 机器学习的项目,Amazon 在最近也紧随其后开展了类似的服务。

该服务目前提供的学习模型与应用于许多大规模学习应用的模型相似,而且可以可视化地呈现出学习模型的基础数据统计和性能预测,但是在弹性、数据导入导出、自动模型参数调优等方面仍然有一些限制。

在过去几年中,陆续涌现出许多帮助简化数据分析工作的服务和产品。其中一些为用户屏蔽了绝大多数复杂的功能,以力图精简,而另一些则极力为专家用户提供一套更加完备的数据解析工具集。

Amazon 所提供的属于第一类服务。这套服务只处理预测问题,目前其应用的学习算法我们尚不得知,但是它提供的功能与 vowpal wabbit 极为相似,VW 是 Jon Langford 基于随机梯度下降算法开发的快速机器学习算法。这个算法通过将数据有序地输入模型,并基于观察到的测量误差来自我调节,本质上来说,这个算法难以并行化运行,但它极为高效,并且消耗的内存极为有限。因此,许多大规模应用都采用了这个算法(用于像 Google 广告点击预测这样的业务中)。

此外,Amazon 机器学习服务可以为每个功能的训练数据计算基本统计信息,将学习模型的性能预测数据可视化。这两个功能允许用户检查数据并更好地理解习得的预测模型。最后,服务中还有一些进行简单数据转换的基本功能,例如提取功能,或者把文本数据转为 n-gram 的表现形式。

当然,Amazon 还规定了一些限制条款。所有数据必须驻留在 Amazon S3 存储服务或 Redshift 数据库中,整个过程不能导入和导出学习模型。如果你需要为模型添加自动训练功能,或者通过并行地评估诸多模型变量来调整模型参数,那么很抱歉,尽管这些功能非常有价值,但是 Amazon 服务不支持这些功能。

第一手的评论指出,该系统的性能与在本地使用笔记本运行类似vowpal wabbit 这样的工具相比略有不足。

Google 于 2010 年启动了预测API 服务,它提供的同样是精简过的机器学习服务。它只解决预测问题,不处理那些更复杂的问题,比如推荐或无监督学习方法(类似聚类)。操作接口基本上只允许你上传数据,进行训练,评估模型,以及用存储模型来计算预测。

与之相反,微软的 Azure 机器学习项目提供了更加丰富的接口,面向更专业的用户群。它公开了所使用的各种学习算法,用户可以构建更加复杂的功能转换管道,甚至可以结合 R 语言脚本来用。这里有 PredictionIO 以及 GraphLab Create 两个示例。

Apache Spark 同样开发了一个机器学习库,举个例子,其可以用于在云端通过 databricks 云来执行复杂的可伸缩数据分析。

查看英文原文: Amazon Web Services launches Machine Learning Service


感谢夏雪对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流。

立即免费注册 AWS 账号,获得 12 个月免费套餐:点击注册

有云计算问题?立刻联系 AWS 云计算专家:立即联系

2015-04-20 06:492194
用户头像

发布了 63 篇内容, 共 135.8 次阅读, 收获喜欢 38 次。

关注

评论

发布
暂无评论
发现更多内容

一文搞懂设计模式—适配器模式

Java随想录

Java 设计模式

Linux操作系统中软件安装

小魏写代码

AI给我们带来哪些方面惊喜呢?

小齐写代码

6个受欢迎的 Angular 库

伤感汤姆布利柏

Google Adsense探索系列_第二弹(成功通过审核)

fkys

网站 Google 审核 adsense

测试管理进阶 | 量力而行:避免成为替罪羊

测吧(北京)科技有限公司

墨天轮2023年度数据库获奖名单

墨天轮

数据库 opengauss oceanbase 达梦 polarDB

基于 Fluid+JindoCache 加速大模型训练的实践

阿里巴巴云原生

阿里云 云原生 Fluid

金芮学院派的优秀践行者

极客天地

万界星空科技电子机电行业MES系统,2000元/年起

万界星空科技

制造业 mes 电子 电子mes 电子行业

TPC-H 基准测试:Databend Cloud 与 Snowflake 对比

Databend

测试管理忠告|量力而行:避免成为替罪羊

霍格沃兹测试开发学社

AI Agent深入浅出——以ERNIE SDK和多工具智能编排为例

飞桨PaddlePaddle

百度 BAIDU 百度飞桨 开发者说 AI Agent

测试管理进阶 | 量力而行:避免成为替罪羊

测试人

软件测试 测试开发 测试管理

回顾 | E³CI效能认知与改进论坛,助力企业研发效能度量和提升

思码逸研发效能

Web3.0区块链技术开发方案:mint铭文铭刻制度开发

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

海上风电:2024智慧海上风电场数字孪生系统

2D3D前端可视化开发

智慧电力 三维可视化 智慧风电场 智慧海上风电场 数字孪生风电场

干货 | 汽车行业研发效能提升的挑战与实践案例

思码逸研发效能

思码逸荣获汽车数智未来创新峰会“年度数字化创新产品奖”

思码逸研发效能

深耕人工智能技术创新,天翼云荣获AAAI 2024竞赛冠军

编程猫

信创的全称是什么?与非信创有什么区别?

行云管家

IT 信创 国产化 非信创

详解 API 设计最佳实践

Noah

即时通讯技术文集(第33期):IM开发综合技术合集(Part6) [共12篇]

JackJiang

网络编程 即时通讯 IM

Go 首次冲进前八!曾两次夺得年度编程语言,也曾跌至百名开外 | TIOBE 2 月榜单发布

博文视点Broadview

【论文解读】| 通过大语言模型实现通用模糊测试

云起无垠

小程序生命周期解析(从概念、启动、运行、销毁场景的全面解析)

天津汇柏科技有限公司

小程序开发 开发小程序

【线上直播】KaiwuDB 分布式系统 Range Split & Merge 原理详解

KaiwuDB

数据库 数据分区

Amazon Web服务开展机器学习服务_服务革新_Mikio Braun_InfoQ精选文章