在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

DMLC:最大开源分布式机器学习项目

  • 2015-06-04
  • 本文字数:852 字

    阅读完需:约 3 分钟

为了实现分布式机器学习领域中代码的共享与共同开发,分布式机器学习社区(DMLC)近日正式发布。作为一个开源项目,DMLC 的相关代码直接托管在 GitHub 中,并采用 Apache2.0 协议进行维护。DMLC 项目的发起者陈天奇怪(网名)表示,项目最初的想法是减少分布式机器学习开发的成本以及新算法被大家接受测试的时间。目前,该项目已经集成了XGBoost、CXXNET 及Minerva 等机器学习库与rabit 和参数服务器等系统组件。接下来,本文就对这些基础库及组件进行简单介绍。

XGBoost 是一个大规模、分布式的通用 Gradient Boosting(GBDT、TBRT 或者 GBM)库。它在 Gradient Boosting 的框架下实现了 GBDT 和广义线性模型等机器学习算法。通过采用分布式计算方法,XGBoost 能够明显加快算法中迭代运算的速度。而作为一个快速、精确的分布式深度学习框架, CXXNET 主要具有轻量、支持多 GPU 和分布式并行系统、非常好的可扩展性以及与其他语言之间的接口清晰等特性。它使用 mshadow 库为用户提供了良好的编程体验和高效的工作能力。与 CXXNET 不同的是, Minerva 提供了一个高效灵活的并行深度学习引擎。它提供了一个类似 Numpy 的 NDarray 编程接口,并支持 Python 和 C++ 语言。其天然的并行性保证了其能够高效地利用多 GPU 进行相关计算。

rabit 是一个提供 Allreduce 和 Broadcast 容错接口的轻量通信框架。它简化了 MPI 的设计,在 Allreduce 和 Boradcast 操作的基础上加入了容灾的支持。其最大的特点在于可移植、可扩展以及非常可靠。另外一个通信框架——参数服务器(Parameter Server),主要负责对 XGBoost 等应用提供分布式的系统支持。它支持工作机与服务器之间的异步、零拷贝键值对的通信。异步的参数服务器接口加上同步的 Rabit 接口基本能够满足各种分布式机器学习算法中的通信需求。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

2015-06-04 09:4511731
用户头像

发布了 268 篇内容, 共 138.8 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

通义灵码+支付 MCP:30 分钟实现创作打赏智能体

阿里巴巴云原生

阿里云 云原生 通义灵码

大庆企业选等保测评公司,牢记这 5 个筛选要点

等保测评

分布式架构基础

天翼云开发者社区

中间件 计算

工业管理 项目管理经验总结(7)

万里无云万里天

项目管理 工业 工厂运维

大数据-85 Spark Action 操作详解:从 Collect 到存储的全景解析

武子康

Java 大数据 flink spark 分布式

从 Oracle 到 TiDB,通过ETL工具,高效实现数据拉通

谷云科技RestCloud

oracle 数据同步 ETL TiDB 数据集成平台

通义灵码+支付 MCP:30 分钟实现创作打赏智能体

阿里云云效

阿里云 云原生 通义灵码

qData 数据中台【开源版】发布 1.0.4 版本,全面升级数据清洗与资产管理能力

千桐科技

数据中台 qData 开源数据中台 Java数据中台 千数平台

崩了!Nacos升级到3.0竟不能用了,哭死!

王磊

CMDB配置漂移治理方案

智象科技

自动化 CMDB IPMI SNMP协议 自动采集

分布式系统-秒杀

天翼云开发者社区

大数据 安全 中间件

节能LED显示技术:点亮未来

Dylan

广告 LED LED display LED显示屏 LED屏幕

kafka数据同步到mysql

天翼云开发者社区

数据库复制

2025 HarmonyOS创新赛线上解读会成功举办 助力开发者把握生态机遇

最新动态

《小K闪电课堂》:秒懂 KaiwuDB/KWDB 数据库技术内核

KaiwuDB

数据库 数据库教程

黑龙江等保测评安全技术服务:打造数字时代安全堡垒的秘密武器

等保测评

智能运维新范式:自动化如何提升企业IT效率

智象科技

自动化 智能运维 告警系统 告警规则 一体化智能运维

如何让后端工程师愿意写文档?API管理的好处

谷云科技RestCloud

API 集成平台 API文档 API管理 ipaas

基于 Amazon Q Developer+Remote MCP 访问 Amazon Redshift

亚马逊云科技 (Amazon Web Services)

哈尔滨三级等保:数字时代的安全 “定海神针

等保测评

让天下没有难查的故障:2025 阿里云 AI 原生编程挑战赛正式启动

阿里巴巴云原生

阿里云 云原生 变成挑战赛

让天下没有难查的故障:2025 阿里云 AI 原生编程挑战赛正式启动

阿里云云效

阿里云 云原生 云原生编程挑战赛

【HarmonyOS】一步解决弹框集成-快速弹框QuickDialog使用详解

GeorgeGcs

面向对象设计与设计模式实战指南

qife122

设计模式 低层设计

破人才瓶颈、促生态共赢 ——2025 鸿蒙生态大会人才发展分论坛亮点纷呈

最新动态

技术文章

qife122

人工智能 openai

什么是安全密钥,它是如何工作的

运维有小邓

mfa 多因素身份验证

【顶会论文】时序数据库 Apache IoTDB 论文获 VLDB 2025 录用,集群秒级扩容性能“解密”

Apache IoTDB

【 HarmonyOS 】错误描述:The certificate has expired! 鸿蒙证书过期如何解决?

GeorgeGcs

在LXC容器中安装Bitwarden密码管理器的完整指南

qife122

Docker Bitwarden

Karma无线安全工具:探针响应与网络诱捕技术解析

qife122

网络安全 渗透测试

DMLC:最大开源分布式机器学习项目_GitHub_张天雷_InfoQ精选文章