写点什么

深度学习框架 SINGA 升级为 Apache 顶级项目

  • 2019-12-13
  • 本文字数:1194 字

    阅读完需:约 4 分钟

深度学习框架SINGA升级为Apache顶级项目

Apache软件基金会(ASF)最近宣布,分布式深度学习框架SINGA升级为顶级项目(TLP,top-level project)。这表明了 SINGA 项目所达到的成熟度和稳定性。SINGA 已经得到了银行、医疗健康等多行业中企业的应用。


SINGA 最早由新加坡国立大学研究人员开发,并于2015年三月 进入 ASF 孵化器。SINGA 提供了一种在机器集群中分布式训练深度学习模型的计算框架,降低了模型训练所需的时间。SINGA 不仅仅是一种学术研究平台,而且已在花旗集团、世邦魏理仕等多家企业得到了商业应用,并在健康医疗行业得到多处应用,例如为糖尿病前期患者提供帮助的应用


深度学习模型所取得的成功,是由大规模数据集的使用所驱动的。例如包括成千上万图像的ImageNet、具有上百万参数的复杂模型等。谷歌的自然语言模型BERT具有近 3 亿个参数,是在近 30 亿个单词上训练得到的。但是,完成这种训练通常需要数个小时,甚至数天时间。为加速训练过程,研究人员引入了并行处理技术,将计算任务分布到计算集群的多台设备上。SINGA 研究团队负责人黄铭钧教授指出:


深度学习必须扩展到分布式计算,因为…深度学习模型通常规模巨大,并需要在大型数据集上训练。如果使用单个 GPU,通常需要数百天时间。


分布式深度学习有两种并行策略。一种是数据并行,即多台机器分别处理不同的输入数据子集;另一种是模型并行,即多台机器分别训练神经网络模型的不同部分。SINGA 同时支持上述两种策略,也支持两种策略的组合使用。为协调集群机器间的工作,并行策略将引入额外的通信和同步开销。SINGA 实现了多种优化技术,力图降低上述开销。


SINGA 升级为 TLP 项目,表明该项目已经通过了包括软件质量和社区等在内的多个里程碑 。理论上看,成为 TLP 项目将会得到更多解决方案的考虑。但采纳该软件的一个可能障碍,就是 SINGA 设计人员选择了实现自身的 API,并未基于 Kera 等现有 API 去建模神经网络。与之不同,Uber 开源的Horovod计算框架支持开发人员导出现有模型到目前广为使用的两个深度学习框架,即TensorFlowPyTorch。尤其是 PyTorch,近期得到大量研究论文采用。


ASF 还支持了多个顶级分布式机器学习数据处理项目,例如SparkIgnite。SINGA 的独特之处在于,它是专门针对大规模神经学习模型而设计的。同时,ASF 也是另一个深度学习框架MXNet的孵化器。和 TensorFlow 和 PyTorch 一样,MXNet 依然在孵化器阶段。尽管AWS在2016下半年就内定其深度学习框架为MXNet,但是 MXNet 依然并未得到广泛使用。据KDNugget调查显示,MXNet 的使用率仅在不高于2%左右波动


Apache SINGA 2.0版于 2019 年四月发布,源代码SINGA Jira项目的可追踪问题列表提供在 GitHub 上。据 ASF 介绍,SINGA 即将推出的特性包括“实现 5G 边缘设备上深度学习的 SINGA-lite,以及易于非深度 AI 背景领域专家开展 AI 计算的 SINGA-easy”。


原文链接:


Deep-Learning Framework SINGA Graduates to Top-Level Apache Project


2019-12-13 15:003190

评论

发布
暂无评论
发现更多内容

为快递包裹提速——选车就选中国重汽汕德卡G7H,营运无短板!

科技经济

YashanDB数据库的最佳实践:成功企业的经验分享

数据库砖家

工程师变身AI“指挥者”,吉利与阿里云的软件开发变革实验

科技汇

Flink 的 RocksDB 状态后端在 vivo 的实践

vivo互联网技术

大数据 推荐系统 RocksDB 内存泄漏 Apache Flink

临析智镜 ClinLens AI 亮相 2025 DIA 临床试验数据大会,破解真实世界数据应用困局

ModelWhale

人工智能 大模型 临床研究 医学 医学数据

YashanDB数据库的优化技巧:提升性能的实用建议

数据库砖家

YashanDB数据库与微服务架构的完美结合

数据库砖家

YashanDB数据库的用户权限与安全管理指南

数据库砖家

YashanDB数据库与物联网的融合前景分析

数据库砖家

安全第一:如何确保YashanDB数据库的数据保护?

数据库砖家

防止数据丢失:YashanDB数据库的备份与恢复方法

数据库砖家

嘿嘿,一个简单ElasticSearch小实现

BugShare

Docker 大数据 elasticsearch Vue springboot

闲鱼商品详情API秘籍!轻松获取SKU属性数据

Datafox(数据狐)

闲鱼API 闲鱼商品数据采集 闲鱼商品详情API

从数据到决策:海外舆情监测全托管服务

沃观Wovision

海外舆情 海外舆情监测 舆情监测平台 舆情监测服务

舆情监测软件如何计算ROI?这份价值评估模型请收好

沃观Wovision

舆情监测 舆情监测软件 舆情监测平台

观测云产品更新 | 监控、Obsy AI 智能体、管理、场景、LLM 监测等

观测云

产品迭代

「腾讯云NoSQL」技术之向量数据库篇:腾讯云向量数据库如何实现召回不变,成本减半?

腾讯云数据库

数据库 腾讯云 索引 向量数据库 腾讯云NoSQL

YashanDB数据库的应用开发环境搭建指南

数据库砖家

YashanDB数据库中的数据建模:最佳实践

数据库砖家

关键指标:如何衡量YashanDB数据库的性能?

数据库砖家

MyEMS:双碳目标下开源能源管理的创新实践者与全场景价值赋能者

开源能源管理系统

开源 开源能源管理系统

全生命周期能源管控:MyEMS 如何重塑企业用能管理逻辑

开源能源管理系统

开源 能源管理系统

深入解析YashanDB数据库的调试与监控工具

数据库砖家

MyEMS:数据驱动的全生命周期能源管控系统,开启智能赋能双碳新时代

开源能源管理系统

开源 能源管理系统

国家数据局优秀案例解读——数据堂“教育高质量数据集构建及应用”

数据堂

人工智能 数据标注 多模态数据 AI教育 高质量数据集

YashanDB数据库的性能指标:评估与监控方法

数据库砖家

开发者必读:YashanDB数据库的核心功能概览

数据库砖家

YashanDB数据库的行业应用价值深度探讨

数据库砖家

YashanDB数据库的用户体验:提升用户满意度的策略

数据库砖家

了解YashanDB数据库的备份策略与实施步骤

数据库砖家

数据可视化的逻辑:舆情监测网站如何将复杂数据转化为决策洞察

沃观Wovision

舆情监测 海外舆情监测 舆情监测网站

深度学习框架SINGA升级为Apache顶级项目_AI&大模型_Anthony Alford_InfoQ精选文章