写点什么

深度学习框架 SINGA 升级为 Apache 顶级项目

  • 2019-12-13
  • 本文字数:1194 字

    阅读完需:约 4 分钟

深度学习框架SINGA升级为Apache顶级项目

Apache软件基金会(ASF)最近宣布,分布式深度学习框架SINGA升级为顶级项目(TLP,top-level project)。这表明了 SINGA 项目所达到的成熟度和稳定性。SINGA 已经得到了银行、医疗健康等多行业中企业的应用。


SINGA 最早由新加坡国立大学研究人员开发,并于2015年三月 进入 ASF 孵化器。SINGA 提供了一种在机器集群中分布式训练深度学习模型的计算框架,降低了模型训练所需的时间。SINGA 不仅仅是一种学术研究平台,而且已在花旗集团、世邦魏理仕等多家企业得到了商业应用,并在健康医疗行业得到多处应用,例如为糖尿病前期患者提供帮助的应用


深度学习模型所取得的成功,是由大规模数据集的使用所驱动的。例如包括成千上万图像的ImageNet、具有上百万参数的复杂模型等。谷歌的自然语言模型BERT具有近 3 亿个参数,是在近 30 亿个单词上训练得到的。但是,完成这种训练通常需要数个小时,甚至数天时间。为加速训练过程,研究人员引入了并行处理技术,将计算任务分布到计算集群的多台设备上。SINGA 研究团队负责人黄铭钧教授指出:


深度学习必须扩展到分布式计算,因为…深度学习模型通常规模巨大,并需要在大型数据集上训练。如果使用单个 GPU,通常需要数百天时间。


分布式深度学习有两种并行策略。一种是数据并行,即多台机器分别处理不同的输入数据子集;另一种是模型并行,即多台机器分别训练神经网络模型的不同部分。SINGA 同时支持上述两种策略,也支持两种策略的组合使用。为协调集群机器间的工作,并行策略将引入额外的通信和同步开销。SINGA 实现了多种优化技术,力图降低上述开销。


SINGA 升级为 TLP 项目,表明该项目已经通过了包括软件质量和社区等在内的多个里程碑 。理论上看,成为 TLP 项目将会得到更多解决方案的考虑。但采纳该软件的一个可能障碍,就是 SINGA 设计人员选择了实现自身的 API,并未基于 Kera 等现有 API 去建模神经网络。与之不同,Uber 开源的Horovod计算框架支持开发人员导出现有模型到目前广为使用的两个深度学习框架,即TensorFlowPyTorch。尤其是 PyTorch,近期得到大量研究论文采用。


ASF 还支持了多个顶级分布式机器学习数据处理项目,例如SparkIgnite。SINGA 的独特之处在于,它是专门针对大规模神经学习模型而设计的。同时,ASF 也是另一个深度学习框架MXNet的孵化器。和 TensorFlow 和 PyTorch 一样,MXNet 依然在孵化器阶段。尽管AWS在2016下半年就内定其深度学习框架为MXNet,但是 MXNet 依然并未得到广泛使用。据KDNugget调查显示,MXNet 的使用率仅在不高于2%左右波动


Apache SINGA 2.0版于 2019 年四月发布,源代码SINGA Jira项目的可追踪问题列表提供在 GitHub 上。据 ASF 介绍,SINGA 即将推出的特性包括“实现 5G 边缘设备上深度学习的 SINGA-lite,以及易于非深度 AI 背景领域专家开展 AI 计算的 SINGA-easy”。


原文链接:


Deep-Learning Framework SINGA Graduates to Top-Level Apache Project


2019-12-13 15:003175

评论

发布
暂无评论
发现更多内容

如何通过API网关保障企业的数据安全

谷云科技RestCloud

数据处理 数据安全 API网关 集成平台 ipaas

一个老码农的掏心窝推荐:微擎,我后悔没早点遇到的开发利器

微擎应用市场

工业管理 项目管理经验总结(21)

万里无云万里天

项目管理 工业 工厂运维

电通创意发布《2025首席营销官报告》:算法与人性的重构力量

财见

iPaaS驱动下的API管理新趋势

谷云科技RestCloud

数据处理 数据安全 集成平台 API管理 ipaas

抓票啦小程序 - 12306抢票小助手

Chris Zhang

工业管理 项目管理经验总结(22)

万里无云万里天

项目管理 工业 工厂运维

解构 CodexField:创作者经济到模型金融化的代币逻辑与潜力

BlockChain先知

创作者经济→模型金融化:CodexField 代币逻辑与潜力解构

石头财经

从0到1了解京东商品详情api指南

tbapi

京东商品详情接口 京东API 京东商品详情API 京东数据采集 京东数据分析

京东商品评论API开发指南

tbapi

京东商品评论API 京东评论API 京东评论采集 京东评价接口 京东评论分析

即时通讯IM国产化:BeeWorks私有化部署适配企业需求

BeeWorks

即时通讯 IM 私有化部署

阿里云 RocketMQ 5.0 可观测最佳实践

观测云

RocketMQ

CodexField 热度登顶:内容资产化赛道的加速信号

加密眼界

AI 语音调研初创 Cookiy AI 融资 700 万美元;软银 53 亿美元收购 ABB 机器人业务,布局物理 AI 丨日报

声网

时序数据库 IoTDB 集成 DataGrip,支撑跨模态多库融合管理

Apache IoTDB

MaxKB 的 RAG 引擎和向量存储实现细节

kaika1

AI 大语言模型 rag RAG应用 MaxKB

CodexField 热度登顶:内容资产化赛道的加速信号

股市老人

@Update注解批量更新始终报错

刘大猫

人工智能 云计算 大数据 算法 物联网

C#/.NET/.NET Core技术前沿周刊 | 第 57 期(2025年10.1-10.12)

追逐时光者

C# .net 微软

CodexField 热度登顶:内容资产化赛道的加速信号

石头财经

AI智能体开发!和Kiro、Kimi、PPIO、TEN、memU、MiniMax一起Vibe丨Convo AI&RTE2025

声网

自研 ERP 系统与第三方物流 API 接口的组合技能

快递鸟

“不要通过共享内存来通信”——深入理解Golang并发模型与CSP理论

poemyang

golang 并发编程 channel

Rokid Glasses 移动端控制应用开发初体验-助力业务创新

轻口味

android 智能硬件 Rokid

CodexField 热度破顶:内容资产化赛道迎来加速拐点

BlockChain先知

低代码资源管理实操:菜单权限配置避坑指南,动作 / 字段 / 数据权限一次搞懂

引迈信息

云栖实录|人工智能+大数据平台加速企业模型后训练

阿里云大数据AI技术

人工智能 大数据 阿里云

GPMI一根线终结电视内卷,长虹和海尔没有说破的秘密

脑极体

AI

内网聊天软件对B端企业的重要性

BeeWorks

即时通讯 IM 私有化部署

Easysearch 冷热架构实战

极限实验室

easysearch

深度学习框架SINGA升级为Apache顶级项目_AI&大模型_Anthony Alford_InfoQ精选文章