写点什么

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL

  • 2017-01-18
  • 本文字数:785 字

    阅读完需:约 3 分钟

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL 。BigDL 借助现有的 Spark 集群来运行深度学习计算,并简化存储在 Hadoop 中的大数据集的数据加载。

Xeon 服务器上运行的测试结果表明,BigDL 比其他开源框架 Caffe Torch TensorFlow 有显著的性能提升。BigDL 速度可与主流 GPU 匹敌,而且能够扩展到数十个 Xeon 服务器。

BigDL 库支持 Spark 1.5、1.6 和 2.0 版本,并容许将深度学习嵌入在现有的 Spark 程序中。BigDL 库中有把 Spark RDDs 转换为 BigDL DataSet 的方法,并且可以直接与 Spark ML Pipelines 一起使用。

对于模型训练,BigDL 使用了在多个执行器中执行单个 Spark 任务的同步小批量 SGD( Stochastic Gradient Descent )。每个执行器运行一个多线程引擎并处理一部分微批次数据。在当前版本中,所有的训练和验证数据都存储到存储器中。

BigDL 使用 Scala 开发,并参考了 Torch 的模型。像 Torch 一样,它有一个使用 Intel MKL 库进行计算的 Tensor 类。Intel MKL(Math Kernel Library)是由一系列为计算优化过的小程序所组成的库,这些小程序从 FFT (快速傅立叶变换)到矩阵乘法均有涉及,常用于深度学习模型训练。Module 是另一个从 Torch 借鉴而来的概念,它的灵感来自 Torch 的 nn package 。Module 代表单独的神经网络层、 Table Criterion

BigDL 提供了一个 AWS EC2 镜像和一些示例,比如使用卷积神经网络进行文本分类,还有图像分类以及如何将在Torch 或Caffe 中预训练过的模型加载到 Spark 中进行预测计算。来自社区的请求主要包括提供对 Python 的支持和 MKL-DNN (MKL 的深度学习扩展)。

查看英文原文 Intel Open-Sources BigDL, Distributed Deep Learning Library for Apache Spark


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-01-18 18:005367
用户头像

发布了 22 篇内容, 共 63171 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

几张图解释明白 Istio!

xcbeyond

Service Mesh istio 3月日更

融云自定义消息不显示

融云 RongCloud

融云 Web SDK 删除历史消息

融云 RongCloud

提醒小程序的产品文档——大作业心得总结

小匚

产品经理 随笔杂谈 产品经理训练营 极客大学产品经理训练营

干货分享——使用融云通讯能力库 IMLib 实现单群聊的阅读回执

融云 RongCloud

融云 IMKit 音频录制参数

融云 RongCloud

Web 端使用融云 SDK 集成实现滑动加载历史消息

融云 RongCloud

微信小程序集成融云 SDK (即时通讯) 集成必备条件

融云 RongCloud

大作业

eva

文档 用例

融云 SDK 如何实现群组操作

融云 RongCloud

作为小白接融云 IM SDK 新路体验~

融云 RongCloud

平安智慧社区解决方案,平安社区综合管理平台

13530558032

集成融云小程序 SDK 遇到的问题

融云 RongCloud

唠一唠融云的消息补偿机制

融云 RongCloud

使用融云 IM SDK 实现 H5 直播聊天

融云 RongCloud

区块链版权保护平台--催生版权保护新格局

13530558032

如何隐藏融云输入框语音按钮

融云 RongCloud

给融云的输入框上方加个功能按钮,怎么整?

融云 RongCloud

融云 Web SDK 如何实现表情的收发 ?

融云 RongCloud

区块链农产品溯源方案,区块链溯源平台

13530558032

关于融云 SDK 在使用 p8 证书的坎坷~

融云 RongCloud

融云IM SDK web 端集成 — 表情采坑篇

融云 RongCloud

融云 RTC SDK 集成实现直播,趟坑之旅~~~

融云 RongCloud

使用融云 IM 点击最近聊天记录时跳转到 @ 自己的消息

融云 RongCloud

如何利用融云 IMLib 来实现一个阅后即焚功能

融云 RongCloud

融云会话页面刷新不及时问题

融云 RongCloud

如何开好每日晨会?

石云升

项目管理 28天写作 职场经验 管理经验 3月日更

融云 Web SDK 如何实现语音的收发 ?

融云 RongCloud

Web 端集成融云 SDK 如何发送正确图片消息给移动端展示?

融云 RongCloud

自定义融云会话列表 cell 选中背景

融云 RongCloud

集成融云 SDK 怎么实现多端同步未读数

融云 RongCloud

Intel开源了基于Apache Spark的分布式深度学习框架BigDL_亚马逊云科技_Alexandre Rodrigues_InfoQ精选文章