10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

Amazon Web 服务开展机器学习服务

  • 2015-04-20
  • 本文字数:1259 字

    阅读完需:约 4 分钟

Amazon Web 服务最近启动了一项机器学习的服务,使用户可以在云端学习预测模型了。主流云服务供应商中的Google 和微软分别推出了预测API 和Azure 机器学习的项目,Amazon 在最近也紧随其后开展了类似的服务。

该服务目前提供的学习模型与应用于许多大规模学习应用的模型相似,而且可以可视化地呈现出学习模型的基础数据统计和性能预测,但是在弹性、数据导入导出、自动模型参数调优等方面仍然有一些限制。

在过去几年中,陆续涌现出许多帮助简化数据分析工作的服务和产品。其中一些为用户屏蔽了绝大多数复杂的功能,以力图精简,而另一些则极力为专家用户提供一套更加完备的数据解析工具集。

Amazon 所提供的属于第一类服务。这套服务只处理预测问题,目前其应用的学习算法我们尚不得知,但是它提供的功能与 vowpal wabbit 极为相似,VW 是 Jon Langford 基于随机梯度下降算法开发的快速机器学习算法。这个算法通过将数据有序地输入模型,并基于观察到的测量误差来自我调节,本质上来说,这个算法难以并行化运行,但它极为高效,并且消耗的内存极为有限。因此,许多大规模应用都采用了这个算法(用于像 Google 广告点击预测这样的业务中)。

此外,Amazon 机器学习服务可以为每个功能的训练数据计算基本统计信息,将学习模型的性能预测数据可视化。这两个功能允许用户检查数据并更好地理解习得的预测模型。最后,服务中还有一些进行简单数据转换的基本功能,例如提取功能,或者把文本数据转为 n-gram 的表现形式。

当然,Amazon 还规定了一些限制条款。所有数据必须驻留在 Amazon S3 存储服务或 Redshift 数据库中,整个过程不能导入和导出学习模型。如果你需要为模型添加自动训练功能,或者通过并行地评估诸多模型变量来调整模型参数,那么很抱歉,尽管这些功能非常有价值,但是 Amazon 服务不支持这些功能。

第一手的评论指出,该系统的性能与在本地使用笔记本运行类似vowpal wabbit 这样的工具相比略有不足。

Google 于 2010 年启动了预测API 服务,它提供的同样是精简过的机器学习服务。它只解决预测问题,不处理那些更复杂的问题,比如推荐或无监督学习方法(类似聚类)。操作接口基本上只允许你上传数据,进行训练,评估模型,以及用存储模型来计算预测。

与之相反,微软的 Azure 机器学习项目提供了更加丰富的接口,面向更专业的用户群。它公开了所使用的各种学习算法,用户可以构建更加复杂的功能转换管道,甚至可以结合 R 语言脚本来用。这里有 PredictionIO 以及 GraphLab Create 两个示例。

Apache Spark 同样开发了一个机器学习库,举个例子,其可以用于在云端通过 databricks 云来执行复杂的可伸缩数据分析。

查看英文原文: Amazon Web Services launches Machine Learning Service


感谢夏雪对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流。

立即免费注册 AWS 账号,获得 12 个月免费套餐:点击注册

有云计算问题?立刻联系 AWS 云计算专家:立即联系

2015-04-20 06:492234
用户头像

发布了 63 篇内容, 共 136.2 次阅读, 收获喜欢 38 次。

关注

评论

发布
暂无评论
发现更多内容

InnoDB存储引擎-锁

CodeWithBuff

MySQL innodb

关于胖指针的应用

老实人Honey

架构实战营

模块一作业

lhp

架构实战营

为了对抗内卷,我“偷”了阿里两份笔记:JDK源码+Java并发图册

Java架构师迁哥

从零开始构建企业级推荐系统(二十九)

Databri_AI

产品 推荐系统

入职腾讯一周年了

程序员鱼皮

Java 腾讯 大前端 实习 校招

区块链互操作性:大规模应用的关键

CECBC

算法面试通关

buchila11

面试

一叶红船见百年!百度大脑助力南湖红船泛起国人心中红色情怀

百度大脑

Redis 高级特性

QiLab

redis

第一周作业

Morphling

#架构实战营

5分钟速读之Rust权威指南(三十六)模式匹配

wzx

rust

[架构实战营][模块一作业]

KK_TTN

#架构实战营

关于数据安全

奔向架构师

大数据 数据安全

数字货币大趋势,DC EP出征,带老百姓进入新时代!

CECBC

Java 8 新特性

Bf-Bus

RedHat7.2 切换yum源记录

Bruce Xiong

redhat yum源

数据准备的能力,决定企业AI研发的边界

百度大脑

人工智能

就是它,帮我斩获了8家大厂offer,由于太全被各大厂要求Github连夜下架

Java架构师迁哥

模块一作业:微信业务架构图和毕设架构设计

Felix

【架构实战营1期】模块一作业

Abner S.

架构实战营 #架构实战营

一文掌握OLAP和DataCube数据魔方应用

白贺BaiHe

OLAP BI 数仓 7月日更 DataCube数据魔方

CODING 助力推进腾讯游戏国际化进程

CODING DevOps

DevOps 开发工具 腾讯游戏 软件研发

人民网发文:区块链如何跨越未来10年

CECBC

云计算还有多久能够替代高性能计算?

北鲲云

辞职1000小时后,我走进字节跳动拿了offer

Java 程序员 面试 java编程

重磅!不容错过的阿里内部微服务速成手册也太赞了(2021版)

Java 程序员 面试 java编程

程序员外包避坑指南?

孙叫兽

程序员 外包

模块一作业

Geek_35a345

当法律纽带变成“机器红线”,能让自动驾驶汽车更安全吗?

脑极体

中层管理者挖掘需求的七大法宝

石云升

读书笔记 需求 职场经验 管理经验 7月日更

Amazon Web服务开展机器学习服务_服务革新_Mikio Braun_InfoQ精选文章