写点什么

920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄 CES 亮相全球最小超算 GPU

  • 2025-01-07
    北京
  • 本文字数:2139 字

    阅读完需:约 7 分钟

大小:888.20K时长:05:03
920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄CES亮相全球最小超算GPU

自英伟达发布其上一款旗舰桌面 GPU 以来,已经过去了两年多的时间,外界对英伟达的新动作期待已久。

 

北京时间 1 月 7 日(周二)上午 10:30,老黄不负众望,在 CES 2025 上发表了 90 分钟的主题演讲,拉开了英伟达一系列发布的序幕,所涉及的领域包括自动驾驶汽车、机器人和 AI Agent。

 

黄仁勋表示:“人工智能始于感知人工智能,即理解图像、文字和声音。然后是生成人工智能,即创造文本、图像和声音。”现在,我们正在进入“物理人工智能,即可以进行、推理、计划和行动的人工智能”的时代。他解释道,NVIDIA GPU 和平台是这一转变的核心,推动了游戏、机器人和自动驾驶汽车(AV)等各个行业的突破。

 

黄仁勋在演讲中回顾了 NVIDIA 三十年的历程。1999 年,英伟达发明了可编程 GPU。他说,从那时起,现代人工智能从根本上改变了计算的工作原理。“在短短 12 年的时间里,技术堆栈的每一层都发生了翻天覆地的变化,这是一个令人难以置信的转变。”

GeForce RTX 50 系列正在改变图形技术

 

“GeForce 让 AI 走进大众,现在 AI 正在回归 GeForce,”黄仁勋表示。

 

他同时推出了 NVIDIA GeForce RTX 5090 GPU,这是迄今为止最强大的 GeForce RTX GPU,拥有 920 亿个晶体管,每秒可进行 3352 万亿次 AI 运算 (TOPS)。

 

“这就是我们全新的 GeForce RTX 50 系列,Blackwell 架构,”黄仁勋高举着黑色的 GPU 说道,并指出它如何能够利用先进的 AI 来实现突破性的图形处理。“GPU 简直就是一头猛兽。”

 

 

黄仁勋表示:“即使是机械设计也是一个奇迹”,并指出该显卡有两个冷却风扇。

 

GPU 系列的更多系列即将推出。GeForce RTX 5090 和 GeForce RTX 5080 台式机 GPU 计划于 1 月 30 日上市。GeForce RTX 5070 Ti 和 GeForce RTX 5070 台式机计划于 2 月开始上市。笔记本电脑 GPU 预计将于 3 月上市。

 

得益于 Blackwell 架构的创新和 DLSS 4,GeForce RTX 5090 的性能比 GeForce RTX 4090 提高了 2 倍。

 

GeForce RTX 5090 拥有 32GB GDDR7 内存、1792 GB/秒的总内存带宽、21760 个 CUDA 核心、680 个第五代 Tensor 核心和 170 个第四代光线追踪核心,是终极 GeForce GPU,拥有比英伟达之前制造的任何产品都要多的硬件和更强大的功能。 

 

DLSS 4 多帧生成技术首次亮相,借助 AI 可为每个渲染帧生成多达三帧以进一步提高帧率。多帧生成技术可与全套 DLSS 技术协同运行,与传统渲染技术相比,性能提升至高可达 8 倍,同时通过 NVIDIA Reflex 技术保证响应速度。

 

DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。基于 Transformer 架构的 DLSS 超分辨率和光线重建模型具备 2 倍的参数量和 4 倍的计算量,可提高画面稳定性,减少伪影,增加细节并增强抗锯齿效果。GeForce RTX 50 系列 GPU 支持 DLSS 4,发布之日即有超过 75 款游戏和应用支持该技术。

 

在游戏中,具有多帧生成的 DLSS 4 有助于在《赛博朋克 2077》、《心灵杀手 2》和《黑神话:悟空》中成倍提高性能,使 GeForce RTX 5090 用户能够以 4K 240Hz/FPS 的速度玩游戏,并启用完整的光线追踪功能并将其他所有设置都调至最高,以获得终极体验。

 

 

英伟达还推出了 NVIDIA Reflex 2。

 

黄仁勋解释道,最新一代 DLSS 可以为我们计算的每一帧生成三帧。“因此,我们能够以极高的性能进行渲染,因为 AI 的计算量要少得多。”

 

RTX 神经着色器使用小型神经网络来改善实时游戏中的纹理、材质和光照。RTX 神经人脸和 RTX 头发可提高实时面部和头发渲染,使用生成式 AI 来制作有史以来最逼真的数字角色动画。RTX Mega Geometry 将光线追踪三角形的数量增加了 100 倍,从而提供更多细节。

 

NVIDIA Reflex 2 支持 Frame Warp,这项创新技术可在将渲染帧发送至显示器前,根据最新的鼠标输入信号对其进行更新,从而降低游戏延迟。与原生渲染相比,Reflex 2 最高可降低 75% 延迟,为多人竞技类游戏玩家带来制胜优势,也能提高单人游戏操作时的响应速度。 

利用 Cosmos 推进物理 AI

除了图形方面的进步外,黄仁勋还介绍了 NVIDIA Cosmos 世界基础模型平台,称其为机器人和工业 AI 领域的游戏规则改变者。

 

黄仁勋解释道,人工智能的下一个前沿是物理人工智能。他将这一时刻比作大型语言模型对生成式人工智能的变革性影响。

 

他解释道:“通用机器人技术的 ChatGPT 时刻即将到来。”

 

黄仁勋表示,与大型语言模型一样,世界基础模型对于推动机器人和 AV 开发至关重要,但并非所有开发人员都具备训练自己模型的专业知识和资源。

 

Cosmos 集成了生成模型、标记器和视频处理管道,为 AV 和机器人等物理 AI 系统提供支持。Cosmos 旨在将远见和多元宇宙模拟的能力引入人工智能模型,使其能够模拟每一种可能的未来并选择最佳行动。

 

老黄解释说,Cosmos 模型会提取文本、图像或视频提示,并以视频形式生成虚拟世界状态。“Cosmos 生成优先考虑 AV 和机器人用例的独特需求,例如真实世界环境、照明和物体持久性。”

 

首批采用 Cosmos 的公司包括领先的机器人和汽车公司,包括 1X、Agile Robots、Agility、Figure AI、Foretellix、Fourier、Galbot、Hillbot、IntBot、Neura Robotics、Skild AI、Virtual Incision、Waabi 和 XPENG,以及共享乘车巨头 Uber。

 

此外,现代汽车集团正在采用 NVIDIA AI 和 Omniverse 来打造更安全、更智能的汽车,增强制造能力并部署尖端机器人技术。

2025-01-07 16:4311374
用户头像
李冬梅 加V:busulishang4668

发布了 1208 篇内容, 共 832.3 次阅读, 收获喜欢 1313 次。

关注

评论

发布
暂无评论

鸿蒙原生应用三方库《日历转换器》

坚果

HarmonyOS 坚果派 HarmonyOS框架

事业-最佳实践-编码-类大小衡量方式

南山

最佳实践 代码质量 单一职责 类大小 编码最佳实践

事业-最佳实践-编码-命名规范

南山

最佳实践 代码质量 命名规范 类命名 方法命名

鸿蒙HarmonyOS实战-ArkTS语言(基本语法)

蜀道山

typescript 鸿蒙 HarmonyOS 鸿蒙系统 ArkTS

一个“敏捷”项目复盘的思考

Bruce Talk

敏捷开发 Agile 回顾会 Retrospective

一款基于AB32VG1的桌面智能坞

芯动大师

程序设计 开发板 12864 OLED液晶显示屏

大公司的Java面试题集

程序员李木子

Java Java 面试题

手把手带你申请Sora内测资格,附申请提示词

蓉蓉

openai ChatGPT4 sora

探索社交App商机:视频直播App、语聊陪玩、1v1约会App必不可少

山东布谷科技胡月

短视频直播系统 1v1交友app开发 语聊平台 海外社交APP 短剧app开发

支付系统概述(六):收银台

agnostic

支付系统设计与实现

一座计算“立交桥”,让新质生产力从湘江水畔到中国大地

脑极体

算力

个人介绍-第一篇博文

Geek_e575df

最新软件测试技术-2024

Geek_e575df

2024-04-13:用go语言,给定一个整数数组 `nums`, 请编写一个函数,返回一个新的数组 `counts`。 满足以下条件:对于每个 `nums[i]`, `counts[i]` 表示在

福大大架构师每日一题

福大大架构师每日一题

对某个通用字段进行加解密或者是脱敏处理

想要飞的猪

数据脱敏 字段加密

事业-最佳实践-编码-单元测试-提升代码可测试性

南山

最佳实践 测试 单元测试 代码质量 可测试性

鸿蒙HarmonyOS实战-ArkTS语言(状态管理)

蜀道山

鸿蒙 HarmonyOS 鸿蒙系统 ArkTS

《自动机理论、语言和计算导论》阅读笔记:p139-p171

codists

编译原理

Spring高手之路17——动态代理的艺术与实践

砖业洋__

spring aop JDK动态代理 CGLIB动态代理

鸿蒙原生应用《隐私协议静态共享库》

坚果

HarmonyOS HarmonyOS框架

事业-最佳实践-编码-日志输出规范

南山

最佳实践 日志 代码质量 日志规范 编码基础

十个小白问题,帮你快速了解Sora

蓉蓉

openai ChatGPT4 sora

920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄CES亮相全球最小超算GPU_英伟达_李冬梅_InfoQ精选文章