50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄 CES 亮相全球最小超算 GPU

  • 2025-01-07
    北京
  • 本文字数:2139 字

    阅读完需:约 7 分钟

大小:888.20K时长:05:03
920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄CES亮相全球最小超算GPU

自英伟达发布其上一款旗舰桌面 GPU 以来,已经过去了两年多的时间,外界对英伟达的新动作期待已久。

 

北京时间 1 月 7 日(周二)上午 10:30,老黄不负众望,在 CES 2025 上发表了 90 分钟的主题演讲,拉开了英伟达一系列发布的序幕,所涉及的领域包括自动驾驶汽车、机器人和 AI Agent。

 

黄仁勋表示:“人工智能始于感知人工智能,即理解图像、文字和声音。然后是生成人工智能,即创造文本、图像和声音。”现在,我们正在进入“物理人工智能,即可以进行、推理、计划和行动的人工智能”的时代。他解释道,NVIDIA GPU 和平台是这一转变的核心,推动了游戏、机器人和自动驾驶汽车(AV)等各个行业的突破。

 

黄仁勋在演讲中回顾了 NVIDIA 三十年的历程。1999 年,英伟达发明了可编程 GPU。他说,从那时起,现代人工智能从根本上改变了计算的工作原理。“在短短 12 年的时间里,技术堆栈的每一层都发生了翻天覆地的变化,这是一个令人难以置信的转变。”

GeForce RTX 50 系列正在改变图形技术

 

“GeForce 让 AI 走进大众,现在 AI 正在回归 GeForce,”黄仁勋表示。

 

他同时推出了 NVIDIA GeForce RTX 5090 GPU,这是迄今为止最强大的 GeForce RTX GPU,拥有 920 亿个晶体管,每秒可进行 3352 万亿次 AI 运算 (TOPS)。

 

“这就是我们全新的 GeForce RTX 50 系列,Blackwell 架构,”黄仁勋高举着黑色的 GPU 说道,并指出它如何能够利用先进的 AI 来实现突破性的图形处理。“GPU 简直就是一头猛兽。”

 

 

黄仁勋表示:“即使是机械设计也是一个奇迹”,并指出该显卡有两个冷却风扇。

 

GPU 系列的更多系列即将推出。GeForce RTX 5090 和 GeForce RTX 5080 台式机 GPU 计划于 1 月 30 日上市。GeForce RTX 5070 Ti 和 GeForce RTX 5070 台式机计划于 2 月开始上市。笔记本电脑 GPU 预计将于 3 月上市。

 

得益于 Blackwell 架构的创新和 DLSS 4,GeForce RTX 5090 的性能比 GeForce RTX 4090 提高了 2 倍。

 

GeForce RTX 5090 拥有 32GB GDDR7 内存、1792 GB/秒的总内存带宽、21760 个 CUDA 核心、680 个第五代 Tensor 核心和 170 个第四代光线追踪核心,是终极 GeForce GPU,拥有比英伟达之前制造的任何产品都要多的硬件和更强大的功能。 

 

DLSS 4 多帧生成技术首次亮相,借助 AI 可为每个渲染帧生成多达三帧以进一步提高帧率。多帧生成技术可与全套 DLSS 技术协同运行,与传统渲染技术相比,性能提升至高可达 8 倍,同时通过 NVIDIA Reflex 技术保证响应速度。

 

DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。基于 Transformer 架构的 DLSS 超分辨率和光线重建模型具备 2 倍的参数量和 4 倍的计算量,可提高画面稳定性,减少伪影,增加细节并增强抗锯齿效果。GeForce RTX 50 系列 GPU 支持 DLSS 4,发布之日即有超过 75 款游戏和应用支持该技术。

 

在游戏中,具有多帧生成的 DLSS 4 有助于在《赛博朋克 2077》、《心灵杀手 2》和《黑神话:悟空》中成倍提高性能,使 GeForce RTX 5090 用户能够以 4K 240Hz/FPS 的速度玩游戏,并启用完整的光线追踪功能并将其他所有设置都调至最高,以获得终极体验。

 

 

英伟达还推出了 NVIDIA Reflex 2。

 

黄仁勋解释道,最新一代 DLSS 可以为我们计算的每一帧生成三帧。“因此,我们能够以极高的性能进行渲染,因为 AI 的计算量要少得多。”

 

RTX 神经着色器使用小型神经网络来改善实时游戏中的纹理、材质和光照。RTX 神经人脸和 RTX 头发可提高实时面部和头发渲染,使用生成式 AI 来制作有史以来最逼真的数字角色动画。RTX Mega Geometry 将光线追踪三角形的数量增加了 100 倍,从而提供更多细节。

 

NVIDIA Reflex 2 支持 Frame Warp,这项创新技术可在将渲染帧发送至显示器前,根据最新的鼠标输入信号对其进行更新,从而降低游戏延迟。与原生渲染相比,Reflex 2 最高可降低 75% 延迟,为多人竞技类游戏玩家带来制胜优势,也能提高单人游戏操作时的响应速度。 

利用 Cosmos 推进物理 AI

除了图形方面的进步外,黄仁勋还介绍了 NVIDIA Cosmos 世界基础模型平台,称其为机器人和工业 AI 领域的游戏规则改变者。

 

黄仁勋解释道,人工智能的下一个前沿是物理人工智能。他将这一时刻比作大型语言模型对生成式人工智能的变革性影响。

 

他解释道:“通用机器人技术的 ChatGPT 时刻即将到来。”

 

黄仁勋表示,与大型语言模型一样,世界基础模型对于推动机器人和 AV 开发至关重要,但并非所有开发人员都具备训练自己模型的专业知识和资源。

 

Cosmos 集成了生成模型、标记器和视频处理管道,为 AV 和机器人等物理 AI 系统提供支持。Cosmos 旨在将远见和多元宇宙模拟的能力引入人工智能模型,使其能够模拟每一种可能的未来并选择最佳行动。

 

老黄解释说,Cosmos 模型会提取文本、图像或视频提示,并以视频形式生成虚拟世界状态。“Cosmos 生成优先考虑 AV 和机器人用例的独特需求,例如真实世界环境、照明和物体持久性。”

 

首批采用 Cosmos 的公司包括领先的机器人和汽车公司,包括 1X、Agile Robots、Agility、Figure AI、Foretellix、Fourier、Galbot、Hillbot、IntBot、Neura Robotics、Skild AI、Virtual Incision、Waabi 和 XPENG,以及共享乘车巨头 Uber。

 

此外,现代汽车集团正在采用 NVIDIA AI 和 Omniverse 来打造更安全、更智能的汽车,增强制造能力并部署尖端机器人技术。

2025-01-07 16:4311337
用户头像
李冬梅 加V:busulishang4668

发布了 1196 篇内容, 共 820.5 次阅读, 收获喜欢 1307 次。

关注

评论

发布
暂无评论

微信聊天记录里的文件又失效了?试试这个文件同步开源项目吧

HelloGitHub

开源 文件传输 Go 语言

数据库周刊62丨央企2021年数据库成交公告,国产占90%;流数据库HStreamDB开源;MySQL主从双写导致数据丢失;Oracle 19c升级最佳实践;PG日常工作分享;MySQL MGR运维指南;SQL语法手册……

墨天轮

MySQL 数据库 sql postgre

墨天轮精选:数据库问答集萃第一期-2021

墨天轮

MySQL 数据库 sql dba

【遇见Doris】基于Apache Doris的小米增长分析平台实践

ApacheDoris

vivo 应用商店推荐系统探索与实践

vivo互联网技术

架构 推荐系统 服务器

ThreadLocal 慌不慌?

叫练

JVM ThreadLocal 引用 软引用

【Doris Weekly】2020.03.08~2021.03.21

ApacheDoris

【Doris Weekly】

LiteOS:剖析时间管理模块源代码

华为云开发者联盟

时间管理 时间 LiteOS huawei 任务

【LeetCode】位1的个数Java题解

Albert

算法 LeetCode 3月日更

Flink SQL 在网易云音乐的产品化实践

Apache Flink

flink

精选2021互联网大厂Java核心面试题库(金三银四面试必备)

比伯

Java 编程 架构 面试 程序人生

Cobar SQL审计的设计与实现

捉虫大师

Disruptor Skywalking cobar 数据库中间件

力扣(LeetCode)刷题,简单题(第16期)

不脱发的程序猿

面试 LeetCode 28天写作 算法面经 3月日更

揭秘盒马鲜生,如何打破收益增长天花板!

博文视点Broadview

跟随报文,开启一段奇妙之旅

华为云开发者联盟

报文 Windows主机 路由器 Linux主机 路由表

技术实践丨Prometheus+Grafana搭建HBase监控仪表盘

华为云开发者联盟

开源 Grafana Prometheus HBase 开源数据库

字节跳动单点恢复功能及 Regional CheckPoint 优化实践

Apache Flink

flink

【IstioCon 2021】最佳实践:从Spring Cloud 到 Istio

华为云原生团队

开源 Kubernetes 云原生 istio 服务网格

基于感染原理判断图的连通性算法

大奎

图算法 子图 连通性

终于有阿里高工把SpringBoot+SpringCloud+Docker+MQ整合在一起了

Java架构追梦

Java 架构 微服务 springboot SpringCloud

分布式任务 + 消息队列框架 go-queue

万俊峰Kevin

微服务 分布式任务 消息队列 Go 语言

彩色图像的二值化,取经之旅第 6 天

梦想橡皮擦

28天写作 3月日更

一文了解数据库资源管理技术

华为云开发者联盟

数据库 存储 GaussDB(DWS) 资源管理

书单|互联网企业面试案头书之架构师篇

博文视点Broadview

架构

对于移动开发,人工智能的到来意味着什么?

故胤道长

人工智能 机器学习 ios开发 Android开发

java好还是嵌入式好?做IT开发该如何选择

cdhqyj

Java 编程 发展 开发 嵌入式

基于NA公链(Nirvana)的应用和NAC公链社区共识探究公链的发展未来

区块链第一资讯

uni-app跨端开发H5、小程序、IOS、Android(六):uni-app事件绑定

程序员潘Sir

微信小程序 uni-app 大前端 iOS Developer 3月日更

EGG公链强势来袭!去中心化社交革命先驱EFTalk

币圈那点事

力扣(LeetCode)刷题,简单题(第15期)

不脱发的程序猿

LeetCode 编程之路 28天写作 算法面经 3月日更

开发也要防“沉迷”?IDEA插件教程详解

京东科技开发者

Java 开发 IntelliJ IDEA

920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄CES亮相全球最小超算GPU_英伟达_李冬梅_InfoQ精选文章