写点什么

Amazon Web 服务开展机器学习服务

  • 2015-04-20
  • 本文字数:1259 字

    阅读完需:约 4 分钟

Amazon Web 服务最近启动了一项机器学习的服务,使用户可以在云端学习预测模型了。主流云服务供应商中的Google 和微软分别推出了预测API 和Azure 机器学习的项目,Amazon 在最近也紧随其后开展了类似的服务。

该服务目前提供的学习模型与应用于许多大规模学习应用的模型相似,而且可以可视化地呈现出学习模型的基础数据统计和性能预测,但是在弹性、数据导入导出、自动模型参数调优等方面仍然有一些限制。

在过去几年中,陆续涌现出许多帮助简化数据分析工作的服务和产品。其中一些为用户屏蔽了绝大多数复杂的功能,以力图精简,而另一些则极力为专家用户提供一套更加完备的数据解析工具集。

Amazon 所提供的属于第一类服务。这套服务只处理预测问题,目前其应用的学习算法我们尚不得知,但是它提供的功能与 vowpal wabbit 极为相似,VW 是 Jon Langford 基于随机梯度下降算法开发的快速机器学习算法。这个算法通过将数据有序地输入模型,并基于观察到的测量误差来自我调节,本质上来说,这个算法难以并行化运行,但它极为高效,并且消耗的内存极为有限。因此,许多大规模应用都采用了这个算法(用于像 Google 广告点击预测这样的业务中)。

此外,Amazon 机器学习服务可以为每个功能的训练数据计算基本统计信息,将学习模型的性能预测数据可视化。这两个功能允许用户检查数据并更好地理解习得的预测模型。最后,服务中还有一些进行简单数据转换的基本功能,例如提取功能,或者把文本数据转为 n-gram 的表现形式。

当然,Amazon 还规定了一些限制条款。所有数据必须驻留在 Amazon S3 存储服务或 Redshift 数据库中,整个过程不能导入和导出学习模型。如果你需要为模型添加自动训练功能,或者通过并行地评估诸多模型变量来调整模型参数,那么很抱歉,尽管这些功能非常有价值,但是 Amazon 服务不支持这些功能。

第一手的评论指出,该系统的性能与在本地使用笔记本运行类似vowpal wabbit 这样的工具相比略有不足。

Google 于 2010 年启动了预测API 服务,它提供的同样是精简过的机器学习服务。它只解决预测问题,不处理那些更复杂的问题,比如推荐或无监督学习方法(类似聚类)。操作接口基本上只允许你上传数据,进行训练,评估模型,以及用存储模型来计算预测。

与之相反,微软的 Azure 机器学习项目提供了更加丰富的接口,面向更专业的用户群。它公开了所使用的各种学习算法,用户可以构建更加复杂的功能转换管道,甚至可以结合 R 语言脚本来用。这里有 PredictionIO 以及 GraphLab Create 两个示例。

Apache Spark 同样开发了一个机器学习库,举个例子,其可以用于在云端通过 databricks 云来执行复杂的可伸缩数据分析。

查看英文原文: Amazon Web Services launches Machine Learning Service


感谢夏雪对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流。

立即免费注册 AWS 账号,获得 12 个月免费套餐:点击注册

有云计算问题?立刻联系 AWS 云计算专家:立即联系

2015-04-20 06:492367
用户头像

发布了 63 篇内容, 共 137.3 次阅读, 收获喜欢 38 次。

关注

评论

发布
暂无评论
发现更多内容

GC的前置工作,聊聊GC是如何快速枚举根节点的

Java随想录

Java JVM

加强预算管理一体化,走进全面预算管理的数智化时代

智达方通

全面预算管理 预算管理 预算管理一体化

我们招聘啦!(Java、测试、后端)

数新网络官方账号

大数据 数据仓库 企业招聘

在探索的道路上持续“做对”,火山引擎A/B测试成为这家企业数字基建

字节跳动数据平台

大数据 A/B 测试 企业号 8 月 PK 榜

使用Dubbo这么久,才知道这些功能竟如此“亮眼”

java易二三

程序员 dubbo 计算机

IPD(集成产品开发)与CMMI的对比

禅道项目管理

Android 组件化神器之Arouter

java易二三

Java 程序员 计算机

2023上海国际智慧停车展览会

AIOTE智博会

城博会 智慧停车展 智慧停车展会 智慧停车博览会

GPT-4 全面开放,首部 AIGC 监管法规出台,字节入局大模型 | AIGC 月报速览

码上跃见

AI AIGC GPT #科技 GPT-4

Java中的常量:让程序更加稳定和可维护

java易二三

Java 程序员 常量 计算机

应用管理平台Walrus开源,构建软件交付新范式

SEAL安全

开源软件 企业号 8 月 PK 榜 Walrus

MySQL运行时的可观测性

GreatSQL

数据库 greatsql

校源行丨开放原子开源基金会赴南大和南理工走访交流

开放原子开源基金会

开源

中型敏捷GenAI模型:面向企业垂直领域应用的实用型AI

Baihai IDP

AI AIGC LLM 白海科技 敏捷AI

我可能开发了世界上最快的通用排序算法,比快排快 60%

java易二三

Java 程序员 计算机

代码随想录Day46 - 动态规划(八)

jjn0703

软件测试/测试开发丨Vuetify框架的使用

测试人

vue.js 程序员 软件测试 vuetify

Spring 中 @Primary 注解的原理是什么?

江南一点雨

spring

手机直播源码开发,协议讨论篇(三):RTMP实时消息传输协议

山东布谷科技

软件开发 RTMP 源码搭建 手机直播源码 实时消息传输协议

Kafka 开飙了!5分钟,带你体验一把“速度与激情”

java易二三

Java Docker 计算机

软件测试/测试开发丨Pytest结合数据驱动

测试人

Python 程序员 软件测试 数据驱动 pytest

稳定高效!NineData x SelectDB 完成产品兼容互认证

NineData

数据管理 大数据分析 SelectDB NineData 产品兼容互认证

Amazon Web服务开展机器学习服务_服务革新_Mikio Braun_InfoQ精选文章