硬核干货——《中小企业 AI 实战指南》免费下载! 了解详情
写点什么

Facebook 开源在 Torch 上进行更快速机器学习的模块

  • 2015-01-20
  • 本文字数:527 字

    阅读完需:约 2 分钟

Facebook 开源了一些用于在 Torch(一个广泛支持机器学习算法的科学计算框架)上更快速地训练神经网络的模块。

不久之前, Nvidia 发布了 cuDNN ,这是一个基于 CUDA 的库,用于深度神经网络。 Facebook 人工智能实验室(FAIR)近日发布了一些 Torch 上的模块,供公开使用。这些模块合称为 fbcunn ,而且“比默认模块快得多”。它们主要面向卷积神经网络(convolutional nets),针对 GPU 做了优化,构建在 Nvidia 的 cuFFT 库之上。其中包括:

  • 使用 FFT 加速卷积的空间卷积模块
  • 用于并行化多 GPU 上的训练数据和模型的容器
  • FFT/IFFT 的包装器
  • 一个更快速的临时卷积层(比 cuDNN 快 1.5 到 10 倍)
  • 用于神经语言模型和单词嵌入(word embedding)的查找表

Facebook 基于 Fast Training of Convolutional Networks through FFTs 这篇论文中的想法构建了这些模块,FAIR 的主任 Yann LeCun 是论文的合著者之一。根据发布说明,与cuDNN 相比,在卷积核较小的情况下(3x3),fbcunn 的速度提升可达1.84 倍;而在卷积核较大的情况下(5x5),速度提升可达23.5 倍。

Torch 和 fbcunn 最早的用途之一就是更快速的图像识别,一个例子就是分类来自ImageNet 的120 万幅图片

查看英文原文: Facebook Open Sources Modules for Faster Deep Learning on Torch

2015-01-20 11:413650
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 148.1 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

如何用VSS一键自动化扫描软件包/固件,快速排查安全风险

科技怪咖

企业经营管理系统哪家好?功能十分全面的阿米巴经营管理系统

优秀

项目管理工具 企业经营管理

数字藏品是什么?NFT系统开发。

开源直播系统源码

数字藏品 数字藏品开发 数字藏品系统 数字藏品软件

性能提升1倍,成本直降50%!基于龙蜥指令加速的下一代云原生网关

OpenAnolis小助手

操作系统 网关 龙蜥技术 cpu加速

CVE-2022-22965 漏洞分析

科技怪咖

华为云VSS漏洞扫描服务为你排除Apache log4j2隐患

科技怪咖

流日志轻松应对“10亿级别IP对”复杂场景,实现超大规模混合云网络流量可视化

Baidu AICLOUD

流日志 网络问题诊断 专线网络

移动办公平台迎来定制潮,WorkPlus如何在钉钉和企微光环下 “出圈”?

BeeWorks

面向大规模数据的云端管理,百度沧海存储产品解析

Baidu AICLOUD

云存储 混合云

CWE 4.7中的新视图 -- 工业控制系统的安全漏洞类别

科技怪咖

二进制SCA指纹提取黑科技: go语言逆向技术

科技怪咖

A tour of gRPC:09 - gRPC Interceptor 拦截器

BUG侦探

gRPC RPC protocolBuffer

开源一夏 | 一文读懂Shiro登录认证全流程

六月的雨在InfoQ

开源 shiro realm 8月月更 Subject

数据湖架构及概念简介

阿里云大数据AI技术

大数据 阿里云 技术交流

图解一致性模型

Databend

分布式 协议

安卓应用及鸿蒙应用安全检测指南

科技怪咖

CVE-2021-3129 分析

科技怪咖

基于 Serverless+OSS 分分钟实现图片秒变素描

阿里巴巴云原生

阿里云 Serverless 云原生 OSS

React useReducer 终极使用教程

蒋川

JavaScript react.js 低代码 Hooks useReducer

TDesign 品牌价值观|视觉新基础

TDesign

腾讯 设计 开源项目

FIXP vs SSL/TLS,谁更安全?

LAXCUS分布式操作系统

网络安全 分布式系统

软件测试 | 测试开发 | 如何利用 xUnit 框架对测试用例进行维护?

测吧(北京)科技有限公司

软件测试

OpenSergo & CloudWeGo 共同保障微服务运行时流量稳定性

阿里巴巴云原生

阿里云 开源 微服务 云原生

LeaRun.Java工作流引擎 快速开发业务流程

力软低代码开发平台

树莓派3b+ python3.5+opencv3.4.1下载安装及配置详解

Five

树莓派 OpenCV Python. 8月月更

极狐GitLab 15.3 | issues 中建任务、许可证合规分析,超 30 项更新全面来袭!

极狐GitLab

DevOps gitlab 运维 API gitops

CVE-2022-22947 分析

科技怪咖

出海有道,融云携手生态伙伴打造「出海百宝箱」

融云 RongCloud

即时通讯 产品升级

network_factory.go源码分析

长安链

Windows下python组件hyperscan的编译与安装

科技怪咖

长安链 p2p-Liquid 架构设计学习笔记

长安链

Facebook开源在Torch上进行更快速机器学习的模块_开源_Abel Avram_InfoQ精选文章