写点什么

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL

  • 2017-01-18
  • 本文字数:785 字

    阅读完需:约 3 分钟

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL 。BigDL 借助现有的 Spark 集群来运行深度学习计算,并简化存储在 Hadoop 中的大数据集的数据加载。

Xeon 服务器上运行的测试结果表明,BigDL 比其他开源框架 Caffe Torch TensorFlow 有显著的性能提升。BigDL 速度可与主流 GPU 匹敌,而且能够扩展到数十个 Xeon 服务器。

BigDL 库支持 Spark 1.5、1.6 和 2.0 版本,并容许将深度学习嵌入在现有的 Spark 程序中。BigDL 库中有把 Spark RDDs 转换为 BigDL DataSet 的方法,并且可以直接与 Spark ML Pipelines 一起使用。

对于模型训练,BigDL 使用了在多个执行器中执行单个 Spark 任务的同步小批量 SGD( Stochastic Gradient Descent )。每个执行器运行一个多线程引擎并处理一部分微批次数据。在当前版本中,所有的训练和验证数据都存储到存储器中。

BigDL 使用 Scala 开发,并参考了 Torch 的模型。像 Torch 一样,它有一个使用 Intel MKL 库进行计算的 Tensor 类。Intel MKL(Math Kernel Library)是由一系列为计算优化过的小程序所组成的库,这些小程序从 FFT (快速傅立叶变换)到矩阵乘法均有涉及,常用于深度学习模型训练。Module 是另一个从 Torch 借鉴而来的概念,它的灵感来自 Torch 的 nn package 。Module 代表单独的神经网络层、 Table Criterion

BigDL 提供了一个 AWS EC2 镜像和一些示例,比如使用卷积神经网络进行文本分类,还有图像分类以及如何将在Torch 或Caffe 中预训练过的模型加载到 Spark 中进行预测计算。来自社区的请求主要包括提供对 Python 的支持和 MKL-DNN (MKL 的深度学习扩展)。

查看英文原文 Intel Open-Sources BigDL, Distributed Deep Learning Library for Apache Spark


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-01-18 18:004953
用户头像

发布了 22 篇内容, 共 55751 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

FCPX插件:Reflections 反射效果

Rose

【IoTDB 线上小课 12】平常的早晨,我们已经是时间数据管理大师?

Apache IoTDB

音乐NFT的线上运营

北京木奇移动技术有限公司

软件外包公司 音乐NFT 体育NFT

FCPX插件:超级慢动作变速插件Twixtor Pro mac版 v7.0.2激活版

Rose

音乐NFT项目的运营和维护

北京木奇移动技术有限公司

区块链技术 软件外包公司 音乐NFT

Manus:AI Agent的未来,还是一场营销秀?

TechubNews

人工智能 AI 科技

2025年建议买的堡垒机品牌是什么?

行云管家

网络安全 等保 堡垒机 等保评测

智能制造:数字孪生赋予企业高质量发展

积木链小链

数字化转型 数字孪生 智能制造

Capture One 23 Enterprise for Mac:高效影像处理,成就专业作品

小玖_苹果Mac软件

FCPX插件: 专业分级调色插件 ColorFinale Pro for mac v2.2.8激活版

Rose

特朗普总统签署命令建立比特币战略储备,将作为类似于诺克斯堡的价值储存手段

TechubNews

加密政策

DeepSeek与低代码:共创AI应用开发新生态,赋能未来创新

天津汇柏科技有限公司

人工智能 AI DeepSeek

FCPX插件motionVFX mLowers动态下标题

Rose

FCPX插件:3d摄像机效果3D Camera Rig

Rose

两会热议零基预算改革,数智预算平台是有力“助推器”!

用友智能财务

Path Finder for Mac:强大的文件管理工具

小玖_苹果Mac软件

Cookie for Mac:智能管理您的应用订阅

小玖_苹果Mac软件

Topaz Video AI for Mac:智能视频增强,画质提升新境界

小玖_苹果Mac软件

CCleaner Pro for Mac:优化系统,提升性能

小玖_苹果Mac软件

fcpx插件:快速宽屏效果 Widescreen v1.1 中文激活版

Rose

FCPX插件:XEffects 3D Transitions for Mac(3D视频转场效果) v1.2激活版

Rose

FCPX插件:Skin Smoother(皮肤平滑效果)

Rose

音乐NFT智能合约开发

北京木奇移动技术有限公司

软件外包公司 音乐NFT 体育NFT

Capture One Studio for Mac:高效影像处理,成就专业作品

小玖_苹果Mac软件

教育行业过等保一般是几级?

行云管家

网络安全 等保 等保测评 教育行业

MouseBoost PRO for Mac:提升鼠标操作效率的终极工具

小玖_苹果Mac软件

时序数据库 InfluxDB 3.0 版本性能实测报告:写入吞吐量提升效果验证

TDengine

数据库 tdengine 时序数据库

Autodesk AutoCAD 2025 for Mac:专业设计,精准呈现

小玖_苹果Mac软件

Intel开源了基于Apache Spark的分布式深度学习框架BigDL_亚马逊云科技_Alexandre Rodrigues_InfoQ精选文章