写点什么

NVIDIA 发布新的 C++ 数值计算库:支持 GPU 加速

  • 2023-11-15
    北京
  • 本文字数:843 字

    阅读完需:约 3 分钟

大小:385.53K时长:02:11
NVIDIA发布新的C++数值计算库:支持GPU加速

 MatX 是一个 C++ 库由 Nvidia 为其自有的 GPU 开发,,旨在使用高级语法在数值计算中实现接近本地性能,不遑多让于 Python 的 scipy 或 MATLAB。它的最新版本引入了许多新功能,包括可以将变换作为运算符,以及新的运算符,如上采样、下采样、pwelch 等等。

 

现在,可以在任何运算符表达式中使用变换,以使用运算符融合来进行延迟评估。运算符融合是 MatX 中的一个特殊功能,旨在提高性能,通过减少内存访问,从而避免内存访问成本相对寄存器访问昂贵数个数量级的问题。

 

旨在通过减少内存访问来提高性能,内存访问的成本可能比寄存器访问高出几个数量级。使用运算符融合,一个表达式不会立即计算,而是转换为表示该表达式的 C++ 类型,该类型将在需要其值时进行评估。换句话说,不是立即计算表达式的结果,比如:

 

(A = B * (cos(C) / D)).run();
复制代码

 

你可以将其值存储在一个中间表达式中:

 

auto op = (B * (cos(C) / D));
复制代码

 

将其与其他表达式组合,并在需要时进行延迟评估。这一特性是通过重载 C++ 运算符实现的。MatX 的最新版本将这一功能扩展到了变换中,例如在以下表达式中:

 

(A = B * fft(C)).run();
复制代码

 

编译器能够理解乘法运算符的右侧是 FFT 变换,而左侧是另一个表达式,可以在编译时与前者的结果进行融合

 

值得注意的是,将变换用作运算符的这种新语法与以前的变换使用方式存在一些不兼容。具体而言,以前你可能会写成matmul(C, A, B, stream),而现在应该使用(C = matmul(A,B)).run(stream)

 

MatX 0.6.0 引入的另一个新功能是新的多相通道化运算符,它可以将输入信号分成一组通道。例如,它可用于将高采样率的宽带信号转换为多个低采样率的窄带信号。

 

新的运算符包括 `upsample`,用于通过插入零来上采样信号;downsample,用于通过丢弃样本来下采样信号;pwelch,用于可视化信号的频谱,而无需进行预处理。

 

MatX 的最新版本拥有更多功能,此处无法详尽列出。如果你对完整细节感兴趣,不要错过官方发布说明。

 

原文链接:

https://www.infoq.com/news/2023/10/Nvidia-matx-cpp-numerical-lib/

2023-11-15 08:005400

评论

发布
暂无评论
发现更多内容

一体化运维平台自动化模块:3 大场景解放运维双手

智象科技

自动化 智能运维 自动化运维 一体化智能运维平台

Coze教程 第1章:Coze平台概述与测试应用前景

测试人

[VLDB 2025]阿里云大数据AI平台多篇论文被收录

阿里云大数据AI技术

flink 阿里云 VLDB 多模态慢查询

从 Oracle 到 TiDB,通过ETL工具,高效实现数据拉通

谷云科技RestCloud

oracle 数据同步 ETL TiDB 数据集成平台

什么是安全密钥,它是如何工作的

运维有小邓

mfa 多因素身份验证

AI 云驱动产业智能化跃迁

Baidu AICLOUD

AI 昆仑芯 百度百舸 具身智能

TDengine IDMP 上线监控,只需几分钟:5 个场景实证

TDengine

人工智能 大数据 tdengine idmp

使用FIDO2实现LUKS磁盘加密的技术解析

qife122

LUKS 磁盘加密

通义灵码+支付 MCP:30 分钟实现创作打赏智能体

阿里云云效

阿里云 云原生 通义灵码

快速看懂财务机器人:案例+趋势,财务人该如何应对?

Techinsight

选型:五大RPA软件对比

Techinsight

澳鹏MediGo医疗大模型数据开发平台:解码智慧医疗的数据基因

澳鹏Appen

医疗AI 智慧医疗 医疗大数据

客户实测第一!智象一体化运维平台脱颖而出

智象科技

ITSM CMDB 智能运维 一体化运维

CMDB升级!多插件协同,深度发现资源

智象科技

CMDB 一体化平台 一体化智能运维 深度发现 发现资源

企业如何选择RPA?一文了解RPA工具

Techinsight

实测多家AI智能体感想,哪款能够自动执行任务?

Techinsight

AI训练必看!2025年十大最佳数据采集代理推荐

不觉心动

爬虫 数据采集 AI+数据

基于 Web 的网上物流系统:对接快递鸟开放平台的全链路解决方案

快递鸟

初识 ASH —— 打开数据库的「月光宝盒」

老纪的技术唠嗑局

运维 oceanbase

CMDB配置漂移治理方案

智象科技

自动化 CMDB IPMI SNMP协议 自动采集

如何让后端工程师愿意写文档?API管理的好处

谷云科技RestCloud

API 集成平台 API文档 API管理 ipaas

通义灵码+支付 MCP:30 分钟实现创作打赏智能体

阿里巴巴云原生

阿里云 云原生 通义灵码

特斯拉、智元、宇树、英伟达等,产业链上市公司8月速递

机器人头条

人形机器人 具身智能 宇树科技 智元机器人 特斯拉optimus

前端热更新驱动下的中国互联网开发范式重构

xuyinyin

测试了多款AI智能体,哪款“自动干活”

Techinsight

零代码改造!LoongSuite AI 采集套件观测实战

阿里巴巴云原生

阿里云 云原生 LoongSuite

智能运维新范式:自动化如何提升企业IT效率

智象科技

自动化 智能运维 告警系统 告警规则 一体化智能运维

在LXC容器中安装Bitwarden密码管理器的完整指南

qife122

Docker Bitwarden

NVIDIA发布新的C++数值计算库:支持GPU加速_编程语言_Sergio De Simone_InfoQ精选文章