NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL

  • 2017-01-18
  • 本文字数:785 字

    阅读完需:约 3 分钟

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL 。BigDL 借助现有的 Spark 集群来运行深度学习计算,并简化存储在 Hadoop 中的大数据集的数据加载。

Xeon 服务器上运行的测试结果表明,BigDL 比其他开源框架 Caffe Torch TensorFlow 有显著的性能提升。BigDL 速度可与主流 GPU 匹敌,而且能够扩展到数十个 Xeon 服务器。

BigDL 库支持 Spark 1.5、1.6 和 2.0 版本,并容许将深度学习嵌入在现有的 Spark 程序中。BigDL 库中有把 Spark RDDs 转换为 BigDL DataSet 的方法,并且可以直接与 Spark ML Pipelines 一起使用。

对于模型训练,BigDL 使用了在多个执行器中执行单个 Spark 任务的同步小批量 SGD( Stochastic Gradient Descent )。每个执行器运行一个多线程引擎并处理一部分微批次数据。在当前版本中,所有的训练和验证数据都存储到存储器中。

BigDL 使用 Scala 开发,并参考了 Torch 的模型。像 Torch 一样,它有一个使用 Intel MKL 库进行计算的 Tensor 类。Intel MKL(Math Kernel Library)是由一系列为计算优化过的小程序所组成的库,这些小程序从 FFT (快速傅立叶变换)到矩阵乘法均有涉及,常用于深度学习模型训练。Module 是另一个从 Torch 借鉴而来的概念,它的灵感来自 Torch 的 nn package 。Module 代表单独的神经网络层、 Table Criterion

BigDL 提供了一个 AWS EC2 镜像和一些示例,比如使用卷积神经网络进行文本分类,还有图像分类以及如何将在Torch 或Caffe 中预训练过的模型加载到 Spark 中进行预测计算。来自社区的请求主要包括提供对 Python 的支持和 MKL-DNN (MKL 的深度学习扩展)。

查看英文原文 Intel Open-Sources BigDL, Distributed Deep Learning Library for Apache Spark


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2017-01-18 18:004568
用户头像

发布了 22 篇内容, 共 48779 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

漫画:一分钟快速了解VPN

OpenVPN

第四周作业总结

hunk

极客大学架构师训练营

性能优化(文件、数据结构、算法、网络IO)

ABS

架构师训练营第八周课程笔记及心得

Airs

第四周作业

jizhi7

极客大学架构师训练营

Week 8 作业01

Croesus

第四周总结

jizhi7

week4-作业二:根据当周学习情况,完成一篇学习总结

未来已来

第8周作业

paul

虽然世界给我们变化,但让我们的人生更向幸福靠近一点点,而入门票就是自学这回事

叶小鍵

第八周

等燕归

【架构师训练营 1 期】第八周学习总结

诺乐

互联网应用架构目标及技术方案

第八周总结

面试重灾区——Synchronized深度解析

执墨

并发编程 synchronized 内存布局 CAS 锁升级

架构师 01 期,第八周课后作业

子文

架构师训练营 - 第 8 周课后作业(1 期)

Pudding

找出两个链表中合并的元素

第八周作业

架构师训练营第四周作业

邢永春

架构师训练营第四周总结

邢永春

【架构师训练营 1 期】第八周作业

诺乐

架构训练营 - 第8周课后作业 - 学习总结

Pudding

架构师训练营第一期 - 第八周课后作业

卖猪肉的大叔

极客大学架构师训练营

浅谈软件研发管理体系建设

大黄蜂

Week4 系统架构

贺志鹏

极客大学架构师训练营

架构师训练营 2 期 Week04 总结

week4-一个典型的大型互联网应用系统使用了哪些技术方案和手段,主要解决什么问题?请列举描述。

未来已来

架构师训练营第一期 - 第八周学习总结

卖猪肉的大叔

极客大学架构师训练营

极客大学 - 架构师训练营 第九周

9527

不可思议,竟然还有人不会查看GC垃圾回收日志?

田维常

垃圾回收 GC

Intel开源了基于Apache Spark的分布式深度学习框架BigDL_亚马逊云科技_Alexandre Rodrigues_InfoQ精选文章