NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

在 Amazon EMR 上运行带有多种 GPU 实例类型的深度学习框架

  • 2019-11-05
  • 本文字数:1592 字

    阅读完需:约 5 分钟

在 Amazon EMR 上运行带有多种 GPU 实例类型的深度学习框架

今天,AWS 很高兴地宣布 Amazon EMR 将支持 Apache MXNet 和新一代 GPU 实例类型,让您可以在进行机器学习工作流程和大数据处理的同时运行分布式深度神经网络。此外,您还可以在采用 GPU 硬件的 EMR 群集上安装并运行自定义深度学习库。通过使用深度学习框架,您可以使用新工具包来处理多种使用案例,包括无人驾驶车辆、人工智能、个性化医疗和计算机视觉。


Amazon EMR 提供一个 Hadoop 托管框架,可以让您轻松、快速且经济高效地使用 Apache Spark、Apache Hive、PrestoApache HBase 和 Apache Flink 等框架处理 Amazon S3 中的大量数据。您可以低成本安全、高效地处理大量大数据使用案例,包括日志分析、Web 索引、数据转换 (ETL)、财务分析、科学模拟、实时处理和生物信息。


多年来,EMR 一直致力于帮助您运行可扩展的机器学习工作负载。2013 年,我们增加了对 Apache Mahout 的支持,以帮助您使用 Apache Hadoop MapReduce 来运行分布式机器学习工作负载。2014 年,客户开始利用 Apache Spark (我们在 2015 年增加了官方支持),以便利用 Spark ML 中提供的各种开源机器学习库来轻松构建可扩展的机器学习管道。


在过去 2 年内,我们还增加了对 Apache Zeppelin 笔记本、易于安装的 Jupyter 笔记本以及适用于交互式 Spark 工作负载的 Apache Livy 的支持,从而让数据科学家可以轻松快速地开发、培训以及将机器学习模型投入生产。EMR 的按秒计费方式以及使用 Amazon EC2 竞价型实例可实现的高达 80% 的成本节约,使您可以低成本轻松运行大规模的机器学习管道。


现在,您可以更轻松地在 Amazon EMR 上实施深度学习。我们增加了对 Apache MXNet (0.12.0) (一种可扩展的深度学习框架)、Amazon EC2 P3P2 实例、EC2 计算优化型 GPU 实例的支持,并预先加载了所需的 GPU 驱动程序。现在借助最新的 GPU 硬件,您只需单击几下即可快速轻松地创建适用于分布式培训的可扩展式安全群集。此外,您还可以安装并使用 BigDL 或 CaffeOnSpark 等自定义深度学习库,方法是在自定义 Amazon Linux AMI 上预加载这些库或使用引导操作来自定义群集。此外,EMR 将很快增加对 TensorFlow (另一个热门的深度学习框架) 的支持。


借助 EMR,您可以在开发工作的数据探索和预处理阶段轻松开发和培训深度学习模型。首先,您可以轻松且经济高效地使用各种开源大数据框架 (包括 Apache Spark、Apache Hadoop 和 Apache Hive) 来探索和处理 S3 中的大量数据集。


其次,除了使用 S3 或群集上 HDFS 中存储的预处理数据来开发、培训和运行深度学习模型以外,您还可以使用 MXNet 和 Spark 预测或执行推理。您将按秒付费,并且可以设置自已愿意为 EC2 竞价型实例支付的最高价,还可以使用 Auto Scaling。然后,您可以在完成工作负载后关闭群集并停止付费,从而进一步降低实验和生产的成本。


在 EMR 控制台中,您只需单击几下即可使用 Spark、MXNet、Ganglia 监控和 Zeppelin 笔记本快速创建一个拥有一到数千个节点的 EMR 群集。



启动群集后,即可打开 Zeppelin 笔记本并开始使用 Spark 和 MXNet 探索数据和构建模型。



借助 EMR,您可以通过以下任一操作轻松监控和调试应用程序:



我们计划在不久的将来发布更多文章,并提供基于 EMR 利用 MXNet 和其他框架进行大规模深度学习的示例和最佳实践。有关如何入门的更多信息,请参阅 Amazon EMR 文档


作者介绍:



Jonathan Fritz 是 Amazon EMR 的首席产品经理。他领导团队的产品管理,并致力于使针对海量数据的分析和机器学习更加轻松。他在闲暇时喜欢去陌生城市旅行、参加现场音乐会和进行户外探索。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/run-deep-learning-frameworks-with-gpu-instance-types-on-amazon-emr/


2019-11-05 08:00596

评论

发布
暂无评论
发现更多内容

关于华为MetaERP,我说几句

SAP虾客

oracle 华为 SAP metaerp

阿里巴巴宣布加入Linux Foundation AI&Data基金会,捐赠首个开源项目DeepRec

阿里云大数据AI技术

人工智能 大数据

利用Appuploader上架IPA步骤

雪奈椰子

重磅来袭!豆瓣评分9.2,万人血书的多线程与高并发v2.0版本

做梦都在改BUG

Java 多线程 高并发

如何更好的分析潜在人脉?聊聊华为云图引擎GES的Cypher子查询

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 5 月 PK 榜

百人研发团队百亿销售规模的技术架构实践分享

车江毅

SET智能合约量化系统app开发案例

薇電13242772558

合约量化 量化交易

用Leangoo领歌Scrum敏捷开发工具管理产品路线图?

顿顿顿

Scrum 敏捷开发 敏捷项目管理 scrum敏捷工具

从缓存的本质说起,说服技术大佬用Redis

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

顶礼膜拜!阿里内部出品,全网首发Spring Security项目实战搭建

做梦都在改BUG

Java spring spring security Spring Security OAuth

给大家推荐一款CRMEB_Java新零售社交电商系统

CRMEB

复杂推理:大型语言模型的"北极星"能力

OneFlow

MySQL百万数据深度分页优化思路分析

做梦都在改BUG

Java MySQL 数据库

SpringBoot 结合 Liquibase 实现数据库变更管理

做梦都在改BUG

Java spring Liquibase

创业做共享电动车!如何找厂家合作

共享电单车厂家

共享电动车厂家 共享电单车厂商 共享电单车投放 共享电动车创业项目

上海国家会计学院刘勤:事项法会计支撑企业更好地应对不确定性

用友BIP

PAG动效框架源码笔记 (一)概览

olinone

ios Android; 特效

ChatGPT会对我们日常生活带来什么影响?这些技术会改变我们学习阅读工作方式吗?| 社区征文

汀丶人工智能

人工智能 ChatGPT 人工智能ChatGPT 吗? 三周年征文

NGINX 和 HAProxy:基于公有云标准环境的用户体验测试对比

NGINX开源社区

nginx 公有云 HAProxy

ShareSDK 创建应用

MobTech袤博科技

如何解决注册并发问题并提高QPS

北桥苏

队列 并发 Redis 核心技术与实战

万字长文详解如何使用Swift提高代码质量 | 京东云技术团队

京东科技开发者

swift 代码质量 代码质量检测工具 京东技术 企业号 5 月 PK 榜

云服务器管理用什么软件好?行云管家好用吗?

行云管家

云计算 云服务器 云资源 云管理

AI会对我们日常生活带来什么影响?这些技术会改变我们学习阅读工作方式吗?| 社区征文

汀丶人工智能

人工智能 ChatGPT 人工智能ChatGPT 吗? 三周年征文

定了!AIRIOT新品发布会,6月6日北京见。

AIRIOT

物联网 发布会 产品发布会 直播预约

来这公司一年碰到的问题比我过去10年都多

艾小仙

Java kafka spring spring-boot

GPT:低代码的终局性机遇

小博

人工智能 低代码 PaaS GPT

文盘Rust —— rust连接oss | 京东云技术团队

京东科技开发者

rust OSS 对象存储 rust语言 企业号 5 月 PK 榜

如何使用apache的ab压力测试小工具传参数

北桥苏

ab测试 A/B 测试

LED显示屏行业发展步伐

Dylan

发展 科技 LED显示屏

共识算法之Raft算法模拟数

TiAmo

算法 共识算法 模拟数

在 Amazon EMR 上运行带有多种 GPU 实例类型的深度学习框架_其他_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章