写点什么

Amazon Web 服务开展机器学习服务

  • 2015-04-20
  • 本文字数:1259 字

    阅读完需:约 4 分钟

Amazon Web 服务最近启动了一项机器学习的服务,使用户可以在云端学习预测模型了。主流云服务供应商中的Google 和微软分别推出了预测API 和Azure 机器学习的项目,Amazon 在最近也紧随其后开展了类似的服务。

该服务目前提供的学习模型与应用于许多大规模学习应用的模型相似,而且可以可视化地呈现出学习模型的基础数据统计和性能预测,但是在弹性、数据导入导出、自动模型参数调优等方面仍然有一些限制。

在过去几年中,陆续涌现出许多帮助简化数据分析工作的服务和产品。其中一些为用户屏蔽了绝大多数复杂的功能,以力图精简,而另一些则极力为专家用户提供一套更加完备的数据解析工具集。

Amazon 所提供的属于第一类服务。这套服务只处理预测问题,目前其应用的学习算法我们尚不得知,但是它提供的功能与 vowpal wabbit 极为相似,VW 是 Jon Langford 基于随机梯度下降算法开发的快速机器学习算法。这个算法通过将数据有序地输入模型,并基于观察到的测量误差来自我调节,本质上来说,这个算法难以并行化运行,但它极为高效,并且消耗的内存极为有限。因此,许多大规模应用都采用了这个算法(用于像 Google 广告点击预测这样的业务中)。

此外,Amazon 机器学习服务可以为每个功能的训练数据计算基本统计信息,将学习模型的性能预测数据可视化。这两个功能允许用户检查数据并更好地理解习得的预测模型。最后,服务中还有一些进行简单数据转换的基本功能,例如提取功能,或者把文本数据转为 n-gram 的表现形式。

当然,Amazon 还规定了一些限制条款。所有数据必须驻留在 Amazon S3 存储服务或 Redshift 数据库中,整个过程不能导入和导出学习模型。如果你需要为模型添加自动训练功能,或者通过并行地评估诸多模型变量来调整模型参数,那么很抱歉,尽管这些功能非常有价值,但是 Amazon 服务不支持这些功能。

第一手的评论指出,该系统的性能与在本地使用笔记本运行类似vowpal wabbit 这样的工具相比略有不足。

Google 于 2010 年启动了预测API 服务,它提供的同样是精简过的机器学习服务。它只解决预测问题,不处理那些更复杂的问题,比如推荐或无监督学习方法(类似聚类)。操作接口基本上只允许你上传数据,进行训练,评估模型,以及用存储模型来计算预测。

与之相反,微软的 Azure 机器学习项目提供了更加丰富的接口,面向更专业的用户群。它公开了所使用的各种学习算法,用户可以构建更加复杂的功能转换管道,甚至可以结合 R 语言脚本来用。这里有 PredictionIO 以及 GraphLab Create 两个示例。

Apache Spark 同样开发了一个机器学习库,举个例子,其可以用于在云端通过 databricks 云来执行复杂的可伸缩数据分析。

查看英文原文: Amazon Web Services launches Machine Learning Service


感谢夏雪对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流。

立即免费注册 AWS 账号,获得 12 个月免费套餐:点击注册

有云计算问题?立刻联系 AWS 云计算专家:立即联系

2015-04-20 06:492379
用户头像

发布了 63 篇内容, 共 137.4 次阅读, 收获喜欢 38 次。

关注

评论

发布
暂无评论
发现更多内容

Earth Preta混合合法与恶意组件规避检测技术分析

qife122

网络安全 APT攻击 恶意软件分析 代码注入

Dify 性能瓶颈?Higress AI 网关为它注入「高可用之魂」!

阿里巴巴云原生

阿里云 云原生 dify

向量数据库在 UGC 社区个性化推荐的落地指南

老纪的技术唠嗑局

oceanbase AI' 向量化

让好知识轻松可及!百度百科19周年升级繁星计划、智能体等多项产品能力

极客天地

mockrs — 超越 Trait 的自由函数模拟与线程安全

SkyFire

rust test Mock mockrs

狼人杀法官版,EdgeOne带你轻松上手狼人杀

六月的雨在InfoQ

EdgeOne免费套餐

通义 Fun-ASR 更新:上亿小时数据训练,精确识别行业术语;钉钉发布语音转写硬件DingTalk A1丨日报

RTE开发者社区

RL 和 Memory 驱动的 Personal Agent,实测 Macaron AI

阿里巴巴云原生

阿里云 AI 云原生

ADManager Plus:突破 ADUC 与 PowerShell 局限的 AD域管理工具

运维有小邓

AD域 AD域管理 AD域组管理

配电 低压电工经验总结(13)

万里无云万里天

工业 工厂运维

有一款Agent,悄悄让你变成个人导演

脑极体

AI

在AI技术快速实现功能的时代,挖掘新需求成为关键——某知名隐私保护代理系统需求洞察

qife122

AI技术 代理系统

虚引用GC耗时分析优化(由 1.2 降低至 0.1 秒)

京东科技开发者

震坤行商品详情API秘籍!轻松获取商品详情数据

tbapi

震坤行API 震坤行商品详情API 震坤行数据采集

行业速览:中国新能源汽车市场格局与关键趋势

DevOps和数字孪生

【客户喜报】消费者追捧,勃肯鞋亚洲收入激增24%

第七在线

mockrs: 重新定义 Rust 测试——业界首个线程安全的自由函数模拟库

SkyFire

rust test Mock mockrs

大模型工具的 “京东答案”

京东科技开发者

智绘蓝图,共赢未来|Honeywell品牌发布会暨首场招商财富会圆满收官!

新消费日报

Truffle Security 重磅升级 XSS Hunter 工具,新增 CORS 误配检测与密钥扫描功能

qife122

XSS 漏洞检测

智能马桶产业进入洗牌期,谁能拿下“第一话语权”?

Alter

告别低效!元图 CAD 图像识别功能,让图纸转换快人一步

元图CAD

AI 图像识别 OCR识别 元图cad

密码学原语混合执行分析:Sandshrew工具的技术探索

qife122

符号执行 Manticore

传帮带 人才梯队建设经验总结(5)

万里无云万里天

人才培养 工厂运维

让浏览器自己工作:AI自动化技术落地全攻略【AI助力全员提效方向】

京东科技开发者

云速搭 AI 助理发布:对话式生成可部署的阿里云架构图

阿里巴巴云原生

阿里云 AI 云原生

1688商品详情API:从数据获取到商业价值落地的全攻略

Noah

为鸿蒙应用“赋智”,灵云、译图智讯OCR等人工智能类SDK适配鸿蒙5

新消费日报

Lazada 如何用实时计算 Flink + Hologres 构建实时商品选品平台

Apache Flink

大数据 flink 实时计算

在AI技术快速实现想法的时代,挖掘新需求成为核心竞争力——某知名实时数据处理框架需求洞察

qife122

需求分析 AI技术

Amazon Web服务开展机器学习服务_服务革新_Mikio Braun_InfoQ精选文章