【锁定直播】字节、华为云、阿里云等技术专家讨论如何将大模型接入 AIOps 解决实际问题,戳>>> 了解详情
写点什么

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL

  • 2017-01-18
  • 本文字数:785 字

    阅读完需:约 3 分钟

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL 。BigDL 借助现有的 Spark 集群来运行深度学习计算,并简化存储在 Hadoop 中的大数据集的数据加载。

Xeon 服务器上运行的测试结果表明,BigDL 比其他开源框架 Caffe Torch TensorFlow 有显著的性能提升。BigDL 速度可与主流 GPU 匹敌,而且能够扩展到数十个 Xeon 服务器。

BigDL 库支持 Spark 1.5、1.6 和 2.0 版本,并容许将深度学习嵌入在现有的 Spark 程序中。BigDL 库中有把 Spark RDDs 转换为 BigDL DataSet 的方法,并且可以直接与 Spark ML Pipelines 一起使用。

对于模型训练,BigDL 使用了在多个执行器中执行单个 Spark 任务的同步小批量 SGD( Stochastic Gradient Descent )。每个执行器运行一个多线程引擎并处理一部分微批次数据。在当前版本中,所有的训练和验证数据都存储到存储器中。

BigDL 使用 Scala 开发,并参考了 Torch 的模型。像 Torch 一样,它有一个使用 Intel MKL 库进行计算的 Tensor 类。Intel MKL(Math Kernel Library)是由一系列为计算优化过的小程序所组成的库,这些小程序从 FFT (快速傅立叶变换)到矩阵乘法均有涉及,常用于深度学习模型训练。Module 是另一个从 Torch 借鉴而来的概念,它的灵感来自 Torch 的 nn package 。Module 代表单独的神经网络层、 Table Criterion

BigDL 提供了一个 AWS EC2 镜像和一些示例,比如使用卷积神经网络进行文本分类,还有图像分类以及如何将在Torch 或Caffe 中预训练过的模型加载到 Spark 中进行预测计算。来自社区的请求主要包括提供对 Python 的支持和 MKL-DNN (MKL 的深度学习扩展)。

查看英文原文 Intel Open-Sources BigDL, Distributed Deep Learning Library for Apache Spark


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2017-01-18 18:004559
用户头像

发布了 22 篇内容, 共 48480 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

冷门的 Java 应用程序安全沙箱机制了解一下

爱好编程进阶

Java 程序员 后端开发

业务学习-车企数字化转型调研

第519区

数字化生态 数据产品 汽车制造

ConcurrentHashMap

急需上岸的小谢

5月月更

API 工程化分享

郑子铭

golang protobuf Cloud Native

javaAOP

工程师日月

java 并发 5月月更

C++最佳实践 | 7. 正确性和脚本

俞凡

c++ 最佳实践

【刷题第九天】20. 有效的括号

白日梦

5月月更

架构实战营毕业项目

哈啰–J

SpringBoot之:SpringBoot的HATEOAS基础

程序那些事

Java Spring Boot 程序那些事 5月月更

架构实战营毕业总结

哈啰–J

[架构7期] - 模块一练习

极客土豆

漫谈数据安全-老板担心敏感数据泄露,该如何建设数据的安全体系?

王老狮

大数据 Clickhouse 数据安全

探秘智慧民航:融云助力“中国第一国门”数字化转型记

融云 RongCloud

C++最佳实践 | 6. 性能

俞凡

c++ 最佳实践

C语言_文件IO操作函数总结

DS小龙哥

5月月更

服务日志规范

en

日志

架构实战营模块6作业

哈啰–J

架构训练营总结

邹玉麒

「架构实战营」

架构实战营模块8作业

哈啰–J

毕业设计秒杀系统架构

Geek_28cf33

二、面向云原生环境的安全体系

穿过生命散发芬芳

云原生安全 5月月更

毕业设计项目:设计电商秒杀系统

炎彬

「架构实战营」

架构实战营 - 电商秒杀系统

邹玉麒

为 SaaS 企业提供 SaaS 服务

Authing

再议String-字符串常量池与String

爱好编程进阶

程序员 后端开发

架构训练营毕业设计—电商秒杀系统

yhjhero

#架构训练营

架构实战营-毕业总结

yhjhero

#架构训练营

电商秒杀系统设计

石小天

架构营毕业总结

Geek_28cf33

架构实战训练营毕业总结

石小天

[数据分析实践]-音频分析-BirdCLE-3

浩波的笔记

人工智能 技术分析

Intel开源了基于Apache Spark的分布式深度学习框架BigDL_亚马逊云科技_Alexandre Rodrigues_InfoQ精选文章