写点什么

Facebook 开源在 Torch 上进行更快速机器学习的模块

  • 2015-01-20
  • 本文字数:527 字

    阅读完需:约 2 分钟

Facebook 开源了一些用于在 Torch(一个广泛支持机器学习算法的科学计算框架)上更快速地训练神经网络的模块。

不久之前, Nvidia 发布了 cuDNN ,这是一个基于 CUDA 的库,用于深度神经网络。 Facebook 人工智能实验室(FAIR)近日发布了一些 Torch 上的模块,供公开使用。这些模块合称为 fbcunn ,而且“比默认模块快得多”。它们主要面向卷积神经网络(convolutional nets),针对 GPU 做了优化,构建在 Nvidia 的 cuFFT 库之上。其中包括:

  • 使用 FFT 加速卷积的空间卷积模块
  • 用于并行化多 GPU 上的训练数据和模型的容器
  • FFT/IFFT 的包装器
  • 一个更快速的临时卷积层(比 cuDNN 快 1.5 到 10 倍)
  • 用于神经语言模型和单词嵌入(word embedding)的查找表

Facebook 基于 Fast Training of Convolutional Networks through FFTs 这篇论文中的想法构建了这些模块,FAIR 的主任 Yann LeCun 是论文的合著者之一。根据发布说明,与cuDNN 相比,在卷积核较小的情况下(3x3),fbcunn 的速度提升可达1.84 倍;而在卷积核较大的情况下(5x5),速度提升可达23.5 倍。

Torch 和 fbcunn 最早的用途之一就是更快速的图像识别,一个例子就是分类来自ImageNet 的120 万幅图片

查看英文原文: Facebook Open Sources Modules for Faster Deep Learning on Torch

2015-01-20 11:413506
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 143.0 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

网络安全kali渗透学习 web渗透入门 Kali系统的国内源配置

学神来啦

表单数据高级搜索功能设计

全象云低代码

搜索引擎 前端 低代码 搜索 表单

前额皮质如何影响我们的工作效率?

LigaAI

工作效率 脑科学

实战 MongoDB Aggregate

PingCode研发中心

mongo pipeline Expression

腾讯自选股如何实现单位小时内完成千万级数据运算

ninetyhe

腾讯 海量数据 分布式,

恒源云(GPUSHARE)_实例关机后如何操作迁移?

恒源云

gpu 运维 实例

十大视频场景化应用工具+五大视频领域冠军/顶会算法重磅开源!

百度大脑

17 Prometheus之服务发现介绍

穿过生命散发芬芳

Prometheus 1月月更

使用Rainbond打包业务模块,实现业务积木式拼装

北京好雨科技有限公司

使用无参数函数进行命令执行

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

建木持续集成平台v2.2.0发布

Jianmu

开源 持续集成 CI/CD

【网络安全】2022年第一次靶场渗透实战学习

H

网络安全 渗透测试

【高并发】导致并发编程频繁出问题的“幕后黑手”

冰河

并发编程 多线程 高并发 协程 异步编程

redis未授权访问漏洞复现

喀拉峻

redis 黑客 网络安全 安全 信息安全

聚类算法有哪些?又是如何分类?

郑州埃文科技

数据分析 聚类算法

CPython 性能将提升 5 倍?faster-python 项目 PEP 659 源码级解读

阿里巴巴终端技术

Python 源码 源码分析 CPython

人效将是快消品企业未来发展的最大瓶颈

百度大脑

人工智能

政法委跨单位重点人员联防联控平台建设,治安防控系统开发

a13823115807

ThinkPHP6和GatewayWorker简单的示例

CRMEB

深入浅出Apache Pulsar(1):Pulsar vs Kafka

云智慧AIOps社区

kafka 云原生 消息队列 kafka运维 Apache Pulsar 消息系统

APICloud 原生模块、H5模块、多端组件使用教程

YonBuilder低代码开发平台

前端开发 APP开发 APICloud 模块 跨端开发

Android 64位架构适配

百瓶技术

andiod 客户端

如何基于知识图谱实体解析技术进行数据优化?

索信达控股

人工智能 AI 知识图谱 数据优化 索信达控股

架构实战营第 4 期 -- 模块七作业

烈火干柴烛灭田边残月

架构实战营

推动数字化人才发展|奈学科技CEO孙玄受邀出席2022年CXO领导力峰会

科技热闻

打造手淘极简包的轻量化框架

阿里巴巴终端技术

ios android 框架设计 移动开发 包大小

3DCAT荣获2021金陀螺“年度XR行业技术创新奖”“年度优秀VR行业应用奖”两项大奖

3DCAT实时渲染

云计算 教育 VR/AR 渲染 渲染器

Kafka 为什么这么快?多的是你不知道的事

码哥字节

kafka 消息队列 1月日更 1月月更

Python 为什么不设计 do-while 循环结构?

Python猫

Python

带你玩转Flink流批一体分布式实时处理引擎

华为云开发者联盟

flink 分布式 实时计算 批处理 流处理框架

Hoo虎符研究院|区块链简报 20220117期

区块链前沿News

Hoo虎符 Hoo 虎符研究院 区块链资讯

Facebook开源在Torch上进行更快速机器学习的模块_开源_Abel Avram_InfoQ精选文章