硬核干货——《中小企业 AI 实战指南》免费下载! 了解详情
写点什么

Amazon Web 服务开展机器学习服务

  • 2015-04-20
  • 本文字数:1259 字

    阅读完需:约 4 分钟

Amazon Web 服务最近启动了一项机器学习的服务,使用户可以在云端学习预测模型了。主流云服务供应商中的Google 和微软分别推出了预测API 和Azure 机器学习的项目,Amazon 在最近也紧随其后开展了类似的服务。

该服务目前提供的学习模型与应用于许多大规模学习应用的模型相似,而且可以可视化地呈现出学习模型的基础数据统计和性能预测,但是在弹性、数据导入导出、自动模型参数调优等方面仍然有一些限制。

在过去几年中,陆续涌现出许多帮助简化数据分析工作的服务和产品。其中一些为用户屏蔽了绝大多数复杂的功能,以力图精简,而另一些则极力为专家用户提供一套更加完备的数据解析工具集。

Amazon 所提供的属于第一类服务。这套服务只处理预测问题,目前其应用的学习算法我们尚不得知,但是它提供的功能与 vowpal wabbit 极为相似,VW 是 Jon Langford 基于随机梯度下降算法开发的快速机器学习算法。这个算法通过将数据有序地输入模型,并基于观察到的测量误差来自我调节,本质上来说,这个算法难以并行化运行,但它极为高效,并且消耗的内存极为有限。因此,许多大规模应用都采用了这个算法(用于像 Google 广告点击预测这样的业务中)。

此外,Amazon 机器学习服务可以为每个功能的训练数据计算基本统计信息,将学习模型的性能预测数据可视化。这两个功能允许用户检查数据并更好地理解习得的预测模型。最后,服务中还有一些进行简单数据转换的基本功能,例如提取功能,或者把文本数据转为 n-gram 的表现形式。

当然,Amazon 还规定了一些限制条款。所有数据必须驻留在 Amazon S3 存储服务或 Redshift 数据库中,整个过程不能导入和导出学习模型。如果你需要为模型添加自动训练功能,或者通过并行地评估诸多模型变量来调整模型参数,那么很抱歉,尽管这些功能非常有价值,但是 Amazon 服务不支持这些功能。

第一手的评论指出,该系统的性能与在本地使用笔记本运行类似vowpal wabbit 这样的工具相比略有不足。

Google 于 2010 年启动了预测API 服务,它提供的同样是精简过的机器学习服务。它只解决预测问题,不处理那些更复杂的问题,比如推荐或无监督学习方法(类似聚类)。操作接口基本上只允许你上传数据,进行训练,评估模型,以及用存储模型来计算预测。

与之相反,微软的 Azure 机器学习项目提供了更加丰富的接口,面向更专业的用户群。它公开了所使用的各种学习算法,用户可以构建更加复杂的功能转换管道,甚至可以结合 R 语言脚本来用。这里有 PredictionIO 以及 GraphLab Create 两个示例。

Apache Spark 同样开发了一个机器学习库,举个例子,其可以用于在云端通过 databricks 云来执行复杂的可伸缩数据分析。

查看英文原文: Amazon Web Services launches Machine Learning Service


感谢夏雪对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流。

立即免费注册 AWS 账号,获得 12 个月免费套餐:点击注册

有云计算问题?立刻联系 AWS 云计算专家:立即联系

2015-04-20 06:492266
用户头像

发布了 63 篇内容, 共 136.5 次阅读, 收获喜欢 38 次。

关注

评论

发布
暂无评论
发现更多内容

使用YashanDB构建智能化数据分析平台的最佳实践

数据库砖家

使用YashanDB实现高并发场景下的数据一致性

数据库砖家

使用YashanDB实现高效的实时数据写入

数据库砖家

使用YashanDB实现企业级数据归档与清理

数据库砖家

使用YashanDB实现企业数据保护与恢复

数据库砖家

使用YashanDB实现数据的高可用性和安全性的最佳实践

数据库砖家

使用YashanDB实现数据库自动化运维及监控

数据库砖家

使用YashanDB数据库实现智能数据分析平台

数据库砖家

使用YashanDB数据库进行数据分析的最佳工具

数据库砖家

数十万条数据秒级响应——Classact 在 Kubernetes 上的 NocoBase 应用实践

NocoBase

数据库 开源 HR 数据管理 客户案例

NocoBase 本周更新汇总:优化及缺陷修复

NocoBase

开源 低代码 无代码 版本更新

AI 英语口语陪练 APP

北京木奇科技有限公司

软件外包公司 AI英语学习 AI英语教育

使用YashanDB构建高可扩展性数据库架构

数据库砖家

使用 DWARF 还原完整的 glibc 调用堆栈

mazhen

Linux glibc perf crac bcc

使用YashanDB构筑面向未来的企业数据基础设施

数据库砖家

使用YashanDB进行企业级数据资产管理的优势

数据库砖家

使用YashanDB实现多租户数据隔离的策略

数据库砖家

Meta 多模态原班底打造感知语言模型,专为实时物理交互设计;估值 1 亿美元,Poke AI 助理无缝融入主流消息应用丨日报

声网

使用YashanDB构建企业级数据仓库的实战指南

数据库砖家

使用YashanDB进行数据库容量规划的实用建议

数据库砖家

使用YashanDB实现大数据实时分析架构

数据库砖家

火山引擎多模态数据湖:基于 Daft 与 Lance,构筑 AI 时代数据湖新范式

字节跳动数据平台

使用YashanDB进行企业数据整合的实践经验分享

数据库砖家

舞台LED屏如何打造震撼的视听盛宴

Dylan

LED LED display 虚拟演唱会 舞台表演 LED屏幕

使用YashanDB实现数据仓库构建与管理实践

数据库砖家

使用YashanDB数据库进行业务数据挖掘的步骤

数据库砖家

使用YashanDB提升企业数据处理的敏捷性与准确性

数据库砖家

AI英语教育APP的分类

北京木奇科技有限公司

AI技术开发 软件外包公司 AI英语教育

使用 Rust 实现的基础的List 和 Watch 机制

天翼云开发者社区

云计算 rust k8s

使用YashanDB实现企业数据备份自动化管理

数据库砖家

使用YashanDB实现企业数据资产管理平台

数据库砖家

Amazon Web服务开展机器学习服务_服务革新_Mikio Braun_InfoQ精选文章