【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

Amazon Web 服务开展机器学习服务

  • 2015-04-20
  • 本文字数:1259 字

    阅读完需:约 4 分钟

Amazon Web 服务最近启动了一项机器学习的服务,使用户可以在云端学习预测模型了。主流云服务供应商中的Google 和微软分别推出了预测API 和Azure 机器学习的项目,Amazon 在最近也紧随其后开展了类似的服务。

该服务目前提供的学习模型与应用于许多大规模学习应用的模型相似,而且可以可视化地呈现出学习模型的基础数据统计和性能预测,但是在弹性、数据导入导出、自动模型参数调优等方面仍然有一些限制。

在过去几年中,陆续涌现出许多帮助简化数据分析工作的服务和产品。其中一些为用户屏蔽了绝大多数复杂的功能,以力图精简,而另一些则极力为专家用户提供一套更加完备的数据解析工具集。

Amazon 所提供的属于第一类服务。这套服务只处理预测问题,目前其应用的学习算法我们尚不得知,但是它提供的功能与 vowpal wabbit 极为相似,VW 是 Jon Langford 基于随机梯度下降算法开发的快速机器学习算法。这个算法通过将数据有序地输入模型,并基于观察到的测量误差来自我调节,本质上来说,这个算法难以并行化运行,但它极为高效,并且消耗的内存极为有限。因此,许多大规模应用都采用了这个算法(用于像 Google 广告点击预测这样的业务中)。

此外,Amazon 机器学习服务可以为每个功能的训练数据计算基本统计信息,将学习模型的性能预测数据可视化。这两个功能允许用户检查数据并更好地理解习得的预测模型。最后,服务中还有一些进行简单数据转换的基本功能,例如提取功能,或者把文本数据转为 n-gram 的表现形式。

当然,Amazon 还规定了一些限制条款。所有数据必须驻留在 Amazon S3 存储服务或 Redshift 数据库中,整个过程不能导入和导出学习模型。如果你需要为模型添加自动训练功能,或者通过并行地评估诸多模型变量来调整模型参数,那么很抱歉,尽管这些功能非常有价值,但是 Amazon 服务不支持这些功能。

第一手的评论指出,该系统的性能与在本地使用笔记本运行类似vowpal wabbit 这样的工具相比略有不足。

Google 于 2010 年启动了预测API 服务,它提供的同样是精简过的机器学习服务。它只解决预测问题,不处理那些更复杂的问题,比如推荐或无监督学习方法(类似聚类)。操作接口基本上只允许你上传数据,进行训练,评估模型,以及用存储模型来计算预测。

与之相反,微软的 Azure 机器学习项目提供了更加丰富的接口,面向更专业的用户群。它公开了所使用的各种学习算法,用户可以构建更加复杂的功能转换管道,甚至可以结合 R 语言脚本来用。这里有 PredictionIO 以及 GraphLab Create 两个示例。

Apache Spark 同样开发了一个机器学习库,举个例子,其可以用于在云端通过 databricks 云来执行复杂的可伸缩数据分析。

查看英文原文: Amazon Web Services launches Machine Learning Service


感谢夏雪对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流。

立即免费注册 AWS 账号,获得 12 个月免费套餐:点击注册

有云计算问题?立刻联系 AWS 云计算专家:立即联系

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2015-04-20 06:491790
用户头像

发布了 63 篇内容, 共 131.7 次阅读, 收获喜欢 38 次。

关注

评论

发布
暂无评论
发现更多内容

熬夜肝了个IDEA插件整合程序员常用的工具,总有你能用上的

Silently9527

程序员 IDEA idea插件

手机里什么APP都没有,一个很无趣的人 | 视频号28天(27)

赵新龙

28天写作

智汇华云 | ArSDN之多集群简介

华云数据

华云数据

并发队列:ArrayBlockingQueue实际运用场景和原理

叫练

阻塞队列 LinkedBlockingQueue 并发队列 阻塞List ArrayBlockingQueue

怎么和小伙伴语音连麦,你造吗?

anyRTC开发者

ios android WebRTC sdk 语音通话

浏览器同源策略,听说过么?

华为云开发者联盟

浏览器 jsonp CORS 同源策略 跨域

最最新版钱包tok量化区块链挖矿系统源码

luluhulian

腾讯基于 Flink SQL 的功能扩展与深度优化实践

Apache Flink

flink

京东扫描平台EOS—JS扫描落地与实践

京东科技开发者

大前端

解读|2020年CNCF云原生调研报告

焱融科技

容器 云原生 存储 cncf

【CSS】css控制鼠标点击事件(pointer-events)

德育处主任

html/css CSS小技巧 28天写作 纯CSS 2月春节不断更

【经验分享】如何融合CMMI与企业需求,自定义推进数字化转型

嘉为蓝鲸

DevOps 敏捷 持续交付 CMMI 能力成熟度模型

程序员成长第二篇:如何快速入门

石云升

程序员 28天写作 2月春节不断更

考前复习必备MySQL数据库(关系型数据库管理系统)

我是哪吒

MySQL 程序员 面试 后端 2月春节不断更

漫话递归与迭代

Justin

算法 方法论 成长 心灵鸡汤 28天写作

超好用的文件转换神器!拿走不谢~

白色蜗牛

程序员 软件工具 生产工具

数据中心网络技术新贵:VXLAN与园区网络虚拟化

华为云开发者联盟

网络 数据中心 虚拟化 VXLAN 二层网络

从JNOS商业操作系统,看京东零售商业化之路新探索

京东科技开发者

零售 数字化转型

webpack | 进阶用法4:如何进行构建速度和体积分析

梁龙先森

大前端 webpack 28天写作 2月春节不断更

深入理解 ProtoBuf 原理与工程实践(概述)

vivo互联网技术

数据结构 序列化 protobuf

资本市场发展趋势学习笔记

JiangX

28天写作

火出圈的Clubhouse,究竟有什么奥秘?

拍乐云Pano

flutter RTC 语音聊天室 社交APP出海 clubhouse

2天完成17TB数据量迁移,华为云数据库是如何做的?

华为云开发者联盟

数据库 mongodb 大数据 智慧地图 地理信息服务

【LeetCode】双指针反转字符串

Albert

算法 LeetCode 2月春节不断更

你需要的Docker知识点都在这里了。

后台技术汇

28天写作 2月春节不断更

工业互联网的“第一高地”,在哪?

浪潮云

工业互联网

GitHub 标星 167k!你要的优质书籍这都有,还开源!

沉默王二

GitHub 开源 电子书

Elasticsearch Document 查询内部原理

escray

七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

区块链矿机挖矿游戏开发,区块链矿机游戏开发

v16629866266

KubeEdge@MEC:Kubernetes容器生态与5G的结合

华为云开发者联盟

5G 边缘计算 网络 kubeedge 5G MEC

盘点软件开发中那些有趣的边际效应

架构精进之路

认知提升 七日更 28天写作 2月春节不断更

Amazon Web服务开展机器学习服务_服务革新_Mikio Braun_InfoQ精选文章