【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

Facebook 开源在 Torch 上进行更快速机器学习的模块

  • 2015-01-20
  • 本文字数:527 字

    阅读完需:约 2 分钟

Facebook 开源了一些用于在 Torch(一个广泛支持机器学习算法的科学计算框架)上更快速地训练神经网络的模块。

不久之前, Nvidia 发布了 cuDNN ,这是一个基于 CUDA 的库,用于深度神经网络。 Facebook 人工智能实验室(FAIR)近日发布了一些 Torch 上的模块,供公开使用。这些模块合称为 fbcunn ,而且“比默认模块快得多”。它们主要面向卷积神经网络(convolutional nets),针对 GPU 做了优化,构建在 Nvidia 的 cuFFT 库之上。其中包括:

  • 使用 FFT 加速卷积的空间卷积模块
  • 用于并行化多 GPU 上的训练数据和模型的容器
  • FFT/IFFT 的包装器
  • 一个更快速的临时卷积层(比 cuDNN 快 1.5 到 10 倍)
  • 用于神经语言模型和单词嵌入(word embedding)的查找表

Facebook 基于 Fast Training of Convolutional Networks through FFTs 这篇论文中的想法构建了这些模块,FAIR 的主任 Yann LeCun 是论文的合著者之一。根据发布说明,与cuDNN 相比,在卷积核较小的情况下(3x3),fbcunn 的速度提升可达1.84 倍;而在卷积核较大的情况下(5x5),速度提升可达23.5 倍。

Torch 和 fbcunn 最早的用途之一就是更快速的图像识别,一个例子就是分类来自ImageNet 的120 万幅图片

查看英文原文: Facebook Open Sources Modules for Faster Deep Learning on Torch

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2015-01-20 11:413171
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 129.6 次阅读, 收获喜欢 34 次。

关注

评论

发布
暂无评论
发现更多内容

我与消息队列的八年情缘

勇哥java实战分享

RocketMQ 消息队列 Activemq

官方线索|CCF CED 中国工程师文化日

穿过生命散发芬芳

1024我在现场

技术人在职场应该知道的沟通技巧

baiyutang

沟通模型 10月月更

北鲲云超算如何让仿真技术、HPC和人工智能之间的深度融合?

北鲲云

【日志技术专题】「logback入门到精通」彻彻底底带你学会logback框架的使用和原理(入门介绍篇)

洛神灬殇

Java logback 日志系统 10月月更

竞跑加速! 数字人民币场景全覆盖

CECBC

官方线索|Gitee2021程序员节特别活动

穿过生命散发芬芳

1024我在现场

Java常用容器笔记

风翱

java 10月月更

Golang网络编程

CodeWithBuff

golang 网络编程 Go 语言 web socket

应对多样管理需求,新版 EMQ X Cloud 实现多项目部署管理

EMQ映云科技

物联网 mqtt

filecoin云算力挖矿系统软件开发源码搭建

Apache APISIX 2.10.0 正式发布,带来第一个 LTS 版本!

API7.ai 技术团队

开源 API网关 APISIX Apache APISIX

基于分布式认知工业互联网的汽车零部件质量溯源平台

CECBC

网站性能优化的实战指南

devpoint

html 性能优化 10月月更

这篇博客和你唠唠 python 并发,滚雪球学python第四季,第16篇

梦想橡皮擦

10月月更

Apache APISIX 社区周报 | 2021 10.1-10.14

API7.ai 技术团队

开源社区 API网关 APISIX 社区周报 Apache APISIX

Vue进阶(幺叁玖):textarea文本框根据内容自适应改变高度

No Silver Bullet

Vue 10月月更

官方线索|RTE2021 实时互联网大会

穿过生命散发芬芳

1024我在现场

官方线索|第二届1024国际智能投研开发者大会

穿过生命散发芬芳

1024我在现场

架构:微内核架构(Microkernel Architecture)二

程序员架构进阶

架构 规则引擎 微内核架构 OSGi 10月月更

[论文分享]VulDeePecker:基于深度学习的漏洞检测技术

maijun

机器学习 静态代码分析 VulDeePecker 漏洞检测

【Flutter 专题】27 图解 ListView/GridView 混用时滑动冲突小尝试

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 10月月更

康威定律

俞凡

架构 认知

官方线索|鸿蒙1024程序员节

轻口味

1024我在现场

官方线索|2021 长沙·中国 1024 程序员节

耳东@Erdong

1024我在现场 10月月更

线程池处理批量接口请求实践

FunTester

线程池 性能测试 接口测试 测试框架 FunTester

数字货币已被世界公认,中国市场即将爆发

CECBC

linux之sed使用技巧

入门小站

Linux

在线中文繁简体转换工具

入门小站

工具

Android开发中遇到加载有相同函数的so库时的问题

轻口味

10月月更

和12岁小同志搞创客开发:如何驱动红外遥控器?

不脱发的程序猿

少儿编程 DIY 红外遥控器 创客开发

Facebook开源在Torch上进行更快速机器学习的模块_开源_Abel Avram_InfoQ精选文章