Amazon 宣布将 MXNet 作为 AWS 的深度学习框架

阅读数:2242 2016 年 12 月 8 日 18:00

Amazon 公司的 Werner Vogels 于上周宣布 Amazon 深度学习框架将会正式选用 MXNet ,并且 AWS 将会通过增加源代码贡献、改进文档以及支持来自其它框架的可视化、开发以及迁移工具,为实现 MXNet 成功的长远目标做出贡献。

Vogles 指出在欺诈检测、推荐流水线、库存和产品检查审计等领域,有一系列无法通过编写显式算法实现的计算任务,对此问题一类被称为深度学习机器学习方法正日益发挥重要作用,此外,在内容搜索、自主无人机、订单履行中心机器人、文本及语音识别等领域中也广泛地使用了机器学习方法。Vogels 给出了Amazon 在深度学习框架选取中所考虑的三个因素,即扩展能力、开发速度及可移植性。

深度学习程序库 Caffe CNTK 、MXNet、 TensorFlow Theano Torch 都得到了 Amazon 的评估,并且被 AWS 所支持。现在 AWS 选定了 MXNet 作为可扩展框架,并号召开源社区为 MXNet 投入更多的努力。在机器学习平台服务的开发上,AWS 所采取的方法将会如同在 RDS 中一样,并且:

“我们将通过提供最好的 EC2 实例组及适用的软件工具,支持深度学习框架领域中所有广受欢迎的深度学习框架。”

Vogels 提到了今年初发布的深度学习 AMI 及附带的云信息模板。AMI 工具集是一种64 位的Amazon Linux 发布版,其中预装了对CNTK 的支持,以及针对MXNet、 Graphviz pygal 和 Python pandas 的更新包。该发布版中预置了六种深度学习架构,分别是 NXNet、Caffe、TensorFlow、Theano、Torch 和 CNTK。AMI 中还包括 NVIDIA CUDA Toolkit cuDNN 库安装程序、 Anaconda 、Python 2 3 。评论表明这仍是第一代的 AMI,它已经可为开始使用 GPU 架构的分析工程师提供良好的工作基础。

MXNet 最初是由华盛顿大学和卡内基梅隆大学( CMU ) 开发,用于支持卷积神经网络( CNN )和长短期记忆网络( LSTM )运算。CMU 计算机科学系主任 Andrew Moore 指出:

MXNet 诞生于 CMU,并在 CMU 发展壮大。它是我目前所见到的最具扩展性的深度学习框架,也是计算机科学领域辉煌研究的代表性成果。多个不同学科交汇于其中并共同协作,实现将线性代数创造性地引入大规模分布式计算中,从而引领了深度学习的全新局面。我们很高兴看到 Amazon 对 MXNet 的投入,并迫切期待 MXNet 能不断地走向强大。

CMU 在 MXNet 上训练了 Inception V3 算法。训练运行在一个 P2 实例的集群上,并逐步增添了 GPU 数目。在运行多至 1000 层的深度网络时,MXNet 仅占用了低至 4GB 的内存。MXNet 支持多种语言的 API 接口,包括 Python、C++(并支持在 Android 和 iOS 上编译)、R、Scala、Julia、Matlab 和 JavaScript。

查看英文原文: Amazon Announces MXNet as Deep Learning Framework of Choice at AWS


感谢冬雨对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

评论

发布