写点什么

又一款英伟达 Blackwell GPU 全面上市,本地跑通复杂 AI 工作流

  • 2025-12-19
    北京
  • 本文字数:1290 字

    阅读完需:约 4 分钟

大小:710.06K时长:04:02
又一款英伟达 Blackwell GPU 全面上市,本地跑通复杂AI工作流

随着代理式 AI(Agentic AI)和生成式 AI 持续走向复杂化,桌面级算力正迎来新一轮升级。NVIDIA 日前宣布,RTX PRO 5000 72GB Blackwell GPU 已正式全面上市,为 AI 开发者、工程师和创意专业人士带来更高显存容量的专业级桌面解决方案。


RTX PRO 5000 72GB 基于 NVIDIA 最新 Blackwell 架构打造,将面向工作站用户提供更强大的本地 AI 开发、推理与原型能力。在全球对 Blackwell 级算力需求快速升温的背景下,这款新品被视为桌面 AI 硬件的重要补充。

高显存,直面代理式 AI 的核心瓶颈

随着生成式 AI 从单一模型调用演进为融合大语言模型(LLM)、工具链、检索增强生成(RAG)和多模态理解的代理式 AI 系统,显存容量正成为制约开发效率的关键因素。


在实际工作流中,代理式 AI 往往需要在 GPU 显存中同时驻留多个模型、上下文状态、数据源以及代码执行环境。模型规模扩大、上下文窗口拉长以及多模态管线复杂度提升,都会对显存提出更高要求。


RTX PRO 5000 72GB 正是针对这一趋势而来。相比现有的 RTX PRO 5000 48GB 版本,其显存容量提升了 50%,配备 72GB 高速 GDDR7 显存,使开发者能够在本地完成更大模型的训练、微调和验证,而无需将所有任务迁移至数据中心级基础设施。


在性能层面,该 GPU 可提供高达 2,142 TOPS 的 AI 计算能力。Blackwell 架构通过多工作负载调度等架构创新,实现 AI、神经渲染和仿真任务的高吞吐协同运行,进一步提升工作站在复杂 AI 场景下的整体效率。

桌面部署,兼顾隐私、成本与响应速度

对许多 AI 团队而言,在本地工作站完成模型开发和部署,意味着更好的数据隐私控制、更低的推理延迟以及更可控的整体成本。RTX PRO 5000 72GB 的推出,使这一模式在更复杂的 AI 工作负载下成为现实。

同时,NVIDIA 也为开发者提供了更灵活的选择空间。用户可根据预算与项目需求,在 RTX PRO 5000 72GB 与 48GB 两种版本之间进行配置,构建差异化的 AI 工作站方案。


生成式 AI 设计软件厂商 InfinitForm 是 RTX PRO 5000 72GB Blackwell GPU 的早期采用者之一。该公司专注于将生成式 AI 引入工程设计与制造流程,同时也是 NVIDIA 初创加速计划的成员。


InfinitForm 正在利用 RTX PRO 5000 72GB 提升其生成式 AI 设计优化软件的性能与运行速度,通过先进仿真技术,简化计算机辅助设计(CAD)与制造流程。


InfinitForm 创始人兼首席执行官 Michael Bogomolny 表示,公司正在 NVIDIA RTX PRO 5000 72GB 平台上评估 CUDA 加速的生成式 AI 设计优化能力,以帮助 Yamaha Motor、NASA 等客户加速产品创新,并在性能与可制造性之间实现更优平衡。

已全面上市,生态系统同步跟进


据 NVIDIA 介绍,RTX PRO 5000 72GB Blackwell GPU 已通过英迈、丽台科技、紫光晓通、超聚变等合作伙伴全面上市,为制造商和系统集成商构建 AI 就绪型工作站提供了新的硬件选项。


更广泛的全球系统厂商渠道预计将于明年初陆续推出基于该 GPU 的完整工作站产品。具体的供应地区、系统配置和上市时间,将以各合作伙伴公布的信息为准。


在各行业加速将 AI 融入生成式设计、工程仿真和编码 Copilot 等核心环节的当下,RTX PRO 5000 72GB Blackwell GPU 被视为一款为“桌面级代理式 AI”量身打造的关键硬件。

2025-12-19 20:596
用户头像
李冬梅 加V:busulishang4668

发布了 1239 篇内容, 共 853.9 次阅读, 收获喜欢 1325 次。

关注

评论

发布
暂无评论

快手DHPS:国内首个实现基于RDMA 通信的可负载均衡高性能服务架构!

快手技术

高性能 服务架构 快手 RDMA技术

客户为纲,万目皆张——中烟创新致烟草客户的一封信

中烟创新

事件响应中的开源情报技术(第二部分)

qife122

网络安全 OSINT

a16z Crypto 领投 1500 万美元种子轮投资,押注去中心化 AI 数据层

PowerVerse

拯救重复劳动:无代码实现 Markdown 图&表抽取

数由科技

人工智能 markdown 数据科学 ETL 无代码

观安信息新一代政务数据共享交换平台

极客天地

BOE(京东方)携多领域商显解决方案亮相InfoComm Asia 2025 “科技+绿色”引领万物互联新时代

爱极客侠

Golang基础笔记十四之文件操作

Hunter熊

golang 后端 文件写入 文件读取

90%企业误解的低代码真相,已经不单纯了

秃头小帅oi

李沐团队开源音频模型 Higgs Audio V2,基于千万小时数据训练;生数科技发布长时文生音频系统 FreeAudio丨日报

RTE开发者社区

零踩坑!Figma组件库无损迁移全流程图解(2025版)

职场工具箱

效率工具 产品经理 产品设计 figma ui设计

黑龙江等保测评周期调整:2025年新规对二级系统的影响

等保测评

开源鸿蒙走进地方开源生态建设交流会:政企办公应用落地牵引开源创新

最新动态

2025年4月补丁星期二安全更新全景

qife122

网络安全 漏洞修复

从部署到告警,全流程运维只需 taosExplorer 一个界面

TDengine

tdengine 时序数据库 国产时序数据库

NineData新增SQL Server到MySQL复制链路,高效助力异构数据库迁移

NineData

MySQL 数据库迁移 数据复制 NineData SQL Server

BOE(京东方)携手生态伙伴推出公益微电影 见证“照亮成长路”十年科技赋能教育之路

爱极客侠

bsfgo 一个轻量级的go web框架

车江毅

焱融科技携手信通院、青云科技启动“AI推理高性能存储技术推进计划”

焱融科技

人工智能 大模型推理 焱融存储 KVCache

6 款支持角色权限控制(RBAC)的开发工具对比与应用场景解析

NocoBase

开源 权限管理 rbac 身份管理 角色管理

唯一中资厂商!腾讯云连续三年入选 Gartner® CPaaS 魔力象限“挑战者”,AI 实践与国际化布局成效显著

极客天地

2025年6月补丁星期二:微软修复67个漏洞,包含2个零日漏洞

qife122

漏洞管理 Windows安全

2025中国楼宇对讲十大品牌权威排名与分析

新消费日报

JNPF组织权限,让企业权限体系更清晰高效​

引迈信息

错误但快速的云基础设施配置方式 - 安全风险警示

qife122

云计算 AI风险

发布即颠覆?实测smardaten 2.0 :当 AI 遇上无代码软件开发,真的能重新定义 “对话即开发”

程序员洲洲

多语种AI舆情监测的关键技术与挑战

沃观Wovision

NLP 大模型 海外舆情 AI 大模型 沃观Wovision 舆情监测系统

亚太企业AI应用现状---- 理想丰满、现实骨感

财见

Promtail 对接日志最佳实践

观测云

日志分析

《开源鸿蒙共建地图4.0》发布 加速构建面向万物互联的操作系统能力

最新动态

又一款英伟达 Blackwell GPU 全面上市,本地跑通复杂AI工作流_芯片&算力_李冬梅_InfoQ精选文章