写点什么

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL

  • 2017-01-18
  • 本文字数:785 字

    阅读完需:约 3 分钟

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL 。BigDL 借助现有的 Spark 集群来运行深度学习计算,并简化存储在 Hadoop 中的大数据集的数据加载。

Xeon 服务器上运行的测试结果表明,BigDL 比其他开源框架 Caffe Torch TensorFlow 有显著的性能提升。BigDL 速度可与主流 GPU 匹敌,而且能够扩展到数十个 Xeon 服务器。

BigDL 库支持 Spark 1.5、1.6 和 2.0 版本,并容许将深度学习嵌入在现有的 Spark 程序中。BigDL 库中有把 Spark RDDs 转换为 BigDL DataSet 的方法,并且可以直接与 Spark ML Pipelines 一起使用。

对于模型训练,BigDL 使用了在多个执行器中执行单个 Spark 任务的同步小批量 SGD( Stochastic Gradient Descent )。每个执行器运行一个多线程引擎并处理一部分微批次数据。在当前版本中,所有的训练和验证数据都存储到存储器中。

BigDL 使用 Scala 开发,并参考了 Torch 的模型。像 Torch 一样,它有一个使用 Intel MKL 库进行计算的 Tensor 类。Intel MKL(Math Kernel Library)是由一系列为计算优化过的小程序所组成的库,这些小程序从 FFT (快速傅立叶变换)到矩阵乘法均有涉及,常用于深度学习模型训练。Module 是另一个从 Torch 借鉴而来的概念,它的灵感来自 Torch 的 nn package 。Module 代表单独的神经网络层、 Table Criterion

BigDL 提供了一个 AWS EC2 镜像和一些示例,比如使用卷积神经网络进行文本分类,还有图像分类以及如何将在Torch 或Caffe 中预训练过的模型加载到 Spark 中进行预测计算。来自社区的请求主要包括提供对 Python 的支持和 MKL-DNN (MKL 的深度学习扩展)。

查看英文原文 Intel Open-Sources BigDL, Distributed Deep Learning Library for Apache Spark


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-01-18 18:005242
用户头像

发布了 22 篇内容, 共 60890 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

第八周

Geek_fabd84

架構師訓練營 week8 總結

ilake

架构师训练营第一期第八周作业

Leo乐

极客大学架构师训练营

第四周学习总结

晴空万里

极客大学架构师训练营

架构师训练第4周:作业一

leo

极客大学架构师训练营

GitHub SSH免密登录

jiangling500

GitHub SSH 免密登录

它是世界上最好的语言,吊打PHP那种

MySQL从删库到跑路

php 少儿编程 scratch

架构师训练营第 1 期 week8

张建亮

极客大学架构师训练营

第八周作业一

天天向上

极客大学架构师训练营

第四周作业

晴空万里

第八周作业

极客大学架构师训练营

在GitHub中如何进行PR(Pull Request)

jiangling500

GitHub PR

架构师训练营第 1 期第八周总结

Leo乐

极客大学架构师训练营

Wi-Fi+BLE 通断器开发资料全开源!快速打造您的智能家居“改装神器”

智能物联实验室

人工智能 物联网 智能家居 通断器

为什么继承 Python 内置类型会出问题?!

Python猫

c Python 编程 程序员

架构师训练营第八周课后作业

Gosling

极客大学架构师训练营

【第八周】性能优化(二)

云龙

性能优化二第八周作业「架构师训练营第 1 期」

天天向善

大型互联网系统技术架构模式

Mars

架构模式 大型互联网应用系统

架构师训练营 -week08-总结

大刘

极客大学架构师训练营

系统架构总结

Mars

系统架构

架构师训练营第四周作业

丁乐洪

架构师训练营-week08

睁眼看世界

极客大学架构师训练营

深度学习-框架之 pytorch

Dreamer

框架

架构师训练营第八周学习总结

Gosling

极客大学架构师训练营

架构师训练营 - 第八周 - 作业一

行者

LeetCode题解:169. 多数元素,排序,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

Netty源码解析 -- PoolChunk实现原理(jemalloc 3的算法)

binecy

源码 Netty 内存管理

架构师系列之5:互联网大数据分析系统架构例子解析

桃花原记

架构师训练第4周:作业二

leo

极客大学架构师训练营

网上如何精确分别百家电投台子真假靠谱方法(LGF微7998)

InfoQ_ba4217df53b1

Intel开源了基于Apache Spark的分布式深度学习框架BigDL_亚马逊云科技_Alexandre Rodrigues_InfoQ精选文章