写点什么

DMLC:最大开源分布式机器学习项目

  • 2015-06-04
  • 本文字数:852 字

    阅读完需:约 3 分钟

为了实现分布式机器学习领域中代码的共享与共同开发,分布式机器学习社区(DMLC)近日正式发布。作为一个开源项目,DMLC 的相关代码直接托管在 GitHub 中,并采用 Apache2.0 协议进行维护。DMLC 项目的发起者陈天奇怪(网名)表示,项目最初的想法是减少分布式机器学习开发的成本以及新算法被大家接受测试的时间。目前,该项目已经集成了XGBoost、CXXNET 及Minerva 等机器学习库与rabit 和参数服务器等系统组件。接下来,本文就对这些基础库及组件进行简单介绍。

XGBoost 是一个大规模、分布式的通用 Gradient Boosting(GBDT、TBRT 或者 GBM)库。它在 Gradient Boosting 的框架下实现了 GBDT 和广义线性模型等机器学习算法。通过采用分布式计算方法,XGBoost 能够明显加快算法中迭代运算的速度。而作为一个快速、精确的分布式深度学习框架, CXXNET 主要具有轻量、支持多 GPU 和分布式并行系统、非常好的可扩展性以及与其他语言之间的接口清晰等特性。它使用 mshadow 库为用户提供了良好的编程体验和高效的工作能力。与 CXXNET 不同的是, Minerva 提供了一个高效灵活的并行深度学习引擎。它提供了一个类似 Numpy 的 NDarray 编程接口,并支持 Python 和 C++ 语言。其天然的并行性保证了其能够高效地利用多 GPU 进行相关计算。

rabit 是一个提供 Allreduce 和 Broadcast 容错接口的轻量通信框架。它简化了 MPI 的设计,在 Allreduce 和 Boradcast 操作的基础上加入了容灾的支持。其最大的特点在于可移植、可扩展以及非常可靠。另外一个通信框架——参数服务器(Parameter Server),主要负责对 XGBoost 等应用提供分布式的系统支持。它支持工作机与服务器之间的异步、零拷贝键值对的通信。异步的参数服务器接口加上同步的 Rabit 接口基本能够满足各种分布式机器学习算法中的通信需求。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

2015-06-04 09:4511717
用户头像

发布了 268 篇内容, 共 138.5 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

Flutter OHOS harmony_fluwx 集成微信服务(二)

flfljh

关键帧动画

flfljh

快速记笔记软件SideNotes for mac 1.4.15激活版

小玖_苹果Mac软件

Capture One 23 Pro for Mac专业RAW照片处理利器

小玖_苹果Mac软件

Ableton Live 11 Suite for Mac 强大的音乐创作与表演工具

小玖_苹果Mac软件

优化永不止步:TinyVue v3.20.0 正式发布,更美观的官网UI,更友好的文档搜索,更强大的主题配置能力~

OpenTiny社区

组件库 OpenTiny 前端开源

Flutter OHOS flutter_dart_native

flfljh

Topaz Video AI for Mac 强大的视频增强与修复工具

小玖_苹果Mac软件

Bartender 5 for Mac智能管理菜单栏的神器

小玖_苹果Mac软件

鸿蒙Flutter性能调优之性能分析定界

flfljh

鸿蒙基础入门01

flfljh

江苏省推出人工智能通识课,和鲸Heywhale重磅上线课程+平台+资源一体化解决方案

ModelWhale

Python 人工智能 大数据 AI

Walgreens商品详情API接口的开发应用与收益

科普小能手

数据分析 爬虫 跨境电商 API 接口 API 测试

harmony_flutter_FlutterEngineGroup

flfljh

OmniPlan Pro 4 for Mac:强大的项目管理工具

小玖_苹果Mac软件

鸿蒙+next+封装轻量级缓存工具PreferencesUtil

flfljh

鸿蒙Flutter环境相关问题解决方法

flfljh

harmony_flutter_udid

flfljh

Aseprite for Mac 专业的像素艺术与动画制作工具

小玖_苹果Mac软件

Capture One Studio for Mac中文直装 专业RAW照片处理软件

小玖_苹果Mac软件

鸿蒙Flutter怎样调试dart代码

flfljh

Flex 组件的简略使用

flfljh

Flutter OHOS flutter appscheme插件

flfljh

从单一领域到系统级仿真与优化:Altair在消费电子产品设计中的应用

Altair RapidMiner

制造 仿真 altair Hypermesh jabra

2024年用户喜爱的Top5云电脑排名!没想到黑马是这家

三掌柜

测评对比

非凸科技荣获2024“创·在上海”国际创新创业大赛优胜企业奖

非凸科技

京东API接口详解:轻松获取商品详情与SKU信息(1次15个),提升业务效率

代码忍者

京东API接口

AlertDialog的简易使用

flfljh

HarmonyOS NEXT基础入门

flfljh

如何成功养成一个TikTok账号?

Ogcloud

TikTok tiktok运营 TikTok养号 tiktok起号

出海电商的关键:原生IP的重要性解析

Ogcloud

海外原生IP 海外IP 海外直播IP 原生IP 海外IP代理

DMLC:最大开源分布式机器学习项目_GitHub_张天雷_InfoQ精选文章