QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄 CES 亮相全球最小超算 GPU

  • 2025-01-07
    北京
  • 本文字数:2139 字

    阅读完需:约 7 分钟

大小:888.20K时长:05:03
920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄CES亮相全球最小超算GPU

自英伟达发布其上一款旗舰桌面 GPU 以来,已经过去了两年多的时间,外界对英伟达的新动作期待已久。

 

北京时间 1 月 7 日(周二)上午 10:30,老黄不负众望,在 CES 2025 上发表了 90 分钟的主题演讲,拉开了英伟达一系列发布的序幕,所涉及的领域包括自动驾驶汽车、机器人和 AI Agent。

 

黄仁勋表示:“人工智能始于感知人工智能,即理解图像、文字和声音。然后是生成人工智能,即创造文本、图像和声音。”现在,我们正在进入“物理人工智能,即可以进行、推理、计划和行动的人工智能”的时代。他解释道,NVIDIA GPU 和平台是这一转变的核心,推动了游戏、机器人和自动驾驶汽车(AV)等各个行业的突破。

 

黄仁勋在演讲中回顾了 NVIDIA 三十年的历程。1999 年,英伟达发明了可编程 GPU。他说,从那时起,现代人工智能从根本上改变了计算的工作原理。“在短短 12 年的时间里,技术堆栈的每一层都发生了翻天覆地的变化,这是一个令人难以置信的转变。”

GeForce RTX 50 系列正在改变图形技术

 

“GeForce 让 AI 走进大众,现在 AI 正在回归 GeForce,”黄仁勋表示。

 

他同时推出了 NVIDIA GeForce RTX 5090 GPU,这是迄今为止最强大的 GeForce RTX GPU,拥有 920 亿个晶体管,每秒可进行 3352 万亿次 AI 运算 (TOPS)。

 

“这就是我们全新的 GeForce RTX 50 系列,Blackwell 架构,”黄仁勋高举着黑色的 GPU 说道,并指出它如何能够利用先进的 AI 来实现突破性的图形处理。“GPU 简直就是一头猛兽。”

 

 

黄仁勋表示:“即使是机械设计也是一个奇迹”,并指出该显卡有两个冷却风扇。

 

GPU 系列的更多系列即将推出。GeForce RTX 5090 和 GeForce RTX 5080 台式机 GPU 计划于 1 月 30 日上市。GeForce RTX 5070 Ti 和 GeForce RTX 5070 台式机计划于 2 月开始上市。笔记本电脑 GPU 预计将于 3 月上市。

 

得益于 Blackwell 架构的创新和 DLSS 4,GeForce RTX 5090 的性能比 GeForce RTX 4090 提高了 2 倍。

 

GeForce RTX 5090 拥有 32GB GDDR7 内存、1792 GB/秒的总内存带宽、21760 个 CUDA 核心、680 个第五代 Tensor 核心和 170 个第四代光线追踪核心,是终极 GeForce GPU,拥有比英伟达之前制造的任何产品都要多的硬件和更强大的功能。 

 

DLSS 4 多帧生成技术首次亮相,借助 AI 可为每个渲染帧生成多达三帧以进一步提高帧率。多帧生成技术可与全套 DLSS 技术协同运行,与传统渲染技术相比,性能提升至高可达 8 倍,同时通过 NVIDIA Reflex 技术保证响应速度。

 

DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。基于 Transformer 架构的 DLSS 超分辨率和光线重建模型具备 2 倍的参数量和 4 倍的计算量,可提高画面稳定性,减少伪影,增加细节并增强抗锯齿效果。GeForce RTX 50 系列 GPU 支持 DLSS 4,发布之日即有超过 75 款游戏和应用支持该技术。

 

在游戏中,具有多帧生成的 DLSS 4 有助于在《赛博朋克 2077》、《心灵杀手 2》和《黑神话:悟空》中成倍提高性能,使 GeForce RTX 5090 用户能够以 4K 240Hz/FPS 的速度玩游戏,并启用完整的光线追踪功能并将其他所有设置都调至最高,以获得终极体验。

 

 

英伟达还推出了 NVIDIA Reflex 2。

 

黄仁勋解释道,最新一代 DLSS 可以为我们计算的每一帧生成三帧。“因此,我们能够以极高的性能进行渲染,因为 AI 的计算量要少得多。”

 

RTX 神经着色器使用小型神经网络来改善实时游戏中的纹理、材质和光照。RTX 神经人脸和 RTX 头发可提高实时面部和头发渲染,使用生成式 AI 来制作有史以来最逼真的数字角色动画。RTX Mega Geometry 将光线追踪三角形的数量增加了 100 倍,从而提供更多细节。

 

NVIDIA Reflex 2 支持 Frame Warp,这项创新技术可在将渲染帧发送至显示器前,根据最新的鼠标输入信号对其进行更新,从而降低游戏延迟。与原生渲染相比,Reflex 2 最高可降低 75% 延迟,为多人竞技类游戏玩家带来制胜优势,也能提高单人游戏操作时的响应速度。 

利用 Cosmos 推进物理 AI

除了图形方面的进步外,黄仁勋还介绍了 NVIDIA Cosmos 世界基础模型平台,称其为机器人和工业 AI 领域的游戏规则改变者。

 

黄仁勋解释道,人工智能的下一个前沿是物理人工智能。他将这一时刻比作大型语言模型对生成式人工智能的变革性影响。

 

他解释道:“通用机器人技术的 ChatGPT 时刻即将到来。”

 

黄仁勋表示,与大型语言模型一样,世界基础模型对于推动机器人和 AV 开发至关重要,但并非所有开发人员都具备训练自己模型的专业知识和资源。

 

Cosmos 集成了生成模型、标记器和视频处理管道,为 AV 和机器人等物理 AI 系统提供支持。Cosmos 旨在将远见和多元宇宙模拟的能力引入人工智能模型,使其能够模拟每一种可能的未来并选择最佳行动。

 

老黄解释说,Cosmos 模型会提取文本、图像或视频提示,并以视频形式生成虚拟世界状态。“Cosmos 生成优先考虑 AV 和机器人用例的独特需求,例如真实世界环境、照明和物体持久性。”

 

首批采用 Cosmos 的公司包括领先的机器人和汽车公司,包括 1X、Agile Robots、Agility、Figure AI、Foretellix、Fourier、Galbot、Hillbot、IntBot、Neura Robotics、Skild AI、Virtual Incision、Waabi 和 XPENG,以及共享乘车巨头 Uber。

 

此外,现代汽车集团正在采用 NVIDIA AI 和 Omniverse 来打造更安全、更智能的汽车,增强制造能力并部署尖端机器人技术。

2025-01-07 16:4310261
用户头像
李冬梅 加V:busulishang4668

发布了 981 篇内容, 共 585.8 次阅读, 收获喜欢 1139 次。

关注

评论

发布
暂无评论

05-高性能复杂度

Lane

【前端 · 面试 】HTTP 总结(七)—— HTTP 缓存概述

编程三昧

面试 HTTP 8月日更 HTTP缓存

06-高可用复杂度

Lane

微信朋友圈的高性能复杂度分析

Saber

架构实战营

【架构实战营】毕业总结

swordman

架构实战营

Tensorflow随笔(一)

毛显新

人工智能 深度学习 tensorflow keras

初学字典-python

加里都好

设计千万级学生管理系统的考试试卷存储方案-模块四

小牧ah

架构实战营

深度解析区块链数字票据及其优势

CECBC

分享三个可改进的体验

石云升

用户体验 体验设计 8月日更

Tensorflow API(一)

毛显新

人工智能 深度学习 tensorflow keras

毕业设计作业

薛定谔的指南针

架构实战营

架构实战营模块四作业

王晓宇

架构实战营

数字新基建助推能源互联网“一体两翼”区块链中台应用建设思考

CECBC

Kafka 和 Kinesis 之间的对比和选择

HoneyMoose

JIT-动态编译与AOT-静态编译:java/ java/ JavaScript/Dart乱谈

zhoulujun

Java dart JIT

网络攻防学习笔记 Day98

穿过生命散发芬芳

态势感知 网络攻防 8月日更

PNG文件解读(1):PNG/APNG格式的前世今生

zhoulujun

png

【架构实战营】毕业设计

swordman

架构实战营

架构实战营-毕业设计项目

阿体

单向数据流-从共享状态管理:flux/redux/vuex漫谈异步数据处理

zhoulujun

React Redux vuex vue2 状态机

模块四作业

秀聪

架构训练营

当农产品拥有“身份证”区块链技术如何助力农产品溯源监管?

CECBC

ipfs挖矿怎么选择公司?ipfs挖矿收益怎么计算?

IPFS挖矿收益怎么计算 ipfs挖矿怎么选择公司

三维旋转笔记:欧拉角/四元数/旋转矩阵/轴角-记忆点整理

zhoulujun

矩阵旋转 欧拉角 三维旋转 四元数

从java注解漫谈到typescript装饰器——注解与装饰器

zhoulujun

Java 注解 装饰器 ts 元数据

毕业感想

薛定谔的指南针

架构实战营

安全世界观 | 常见WEB安全问题及防御策略汇总

架构精进之路

安全 8月日更

JavaScript 开发人员应该理解的 this

devpoint

JavaScript js变量声明 this 8月日更

PNG文件解读(2):PNG格式文件结构与数据结构解读—解码PNG数据

zhoulujun

png jpg

MongoDB 客户端怎么做负载均衡

海明菌

mongodb 负载均衡 客户端

920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄CES亮相全球最小超算GPU_英伟达_李冬梅_InfoQ精选文章