50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄 CES 亮相全球最小超算 GPU

  • 2025-01-07
    北京
  • 本文字数:2139 字

    阅读完需:约 7 分钟

大小:888.20K时长:05:03
920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄CES亮相全球最小超算GPU

自英伟达发布其上一款旗舰桌面 GPU 以来,已经过去了两年多的时间,外界对英伟达的新动作期待已久。

 

北京时间 1 月 7 日(周二)上午 10:30,老黄不负众望,在 CES 2025 上发表了 90 分钟的主题演讲,拉开了英伟达一系列发布的序幕,所涉及的领域包括自动驾驶汽车、机器人和 AI Agent。

 

黄仁勋表示:“人工智能始于感知人工智能,即理解图像、文字和声音。然后是生成人工智能,即创造文本、图像和声音。”现在,我们正在进入“物理人工智能,即可以进行、推理、计划和行动的人工智能”的时代。他解释道,NVIDIA GPU 和平台是这一转变的核心,推动了游戏、机器人和自动驾驶汽车(AV)等各个行业的突破。

 

黄仁勋在演讲中回顾了 NVIDIA 三十年的历程。1999 年,英伟达发明了可编程 GPU。他说,从那时起,现代人工智能从根本上改变了计算的工作原理。“在短短 12 年的时间里,技术堆栈的每一层都发生了翻天覆地的变化,这是一个令人难以置信的转变。”

GeForce RTX 50 系列正在改变图形技术

 

“GeForce 让 AI 走进大众,现在 AI 正在回归 GeForce,”黄仁勋表示。

 

他同时推出了 NVIDIA GeForce RTX 5090 GPU,这是迄今为止最强大的 GeForce RTX GPU,拥有 920 亿个晶体管,每秒可进行 3352 万亿次 AI 运算 (TOPS)。

 

“这就是我们全新的 GeForce RTX 50 系列,Blackwell 架构,”黄仁勋高举着黑色的 GPU 说道,并指出它如何能够利用先进的 AI 来实现突破性的图形处理。“GPU 简直就是一头猛兽。”

 

 

黄仁勋表示:“即使是机械设计也是一个奇迹”,并指出该显卡有两个冷却风扇。

 

GPU 系列的更多系列即将推出。GeForce RTX 5090 和 GeForce RTX 5080 台式机 GPU 计划于 1 月 30 日上市。GeForce RTX 5070 Ti 和 GeForce RTX 5070 台式机计划于 2 月开始上市。笔记本电脑 GPU 预计将于 3 月上市。

 

得益于 Blackwell 架构的创新和 DLSS 4,GeForce RTX 5090 的性能比 GeForce RTX 4090 提高了 2 倍。

 

GeForce RTX 5090 拥有 32GB GDDR7 内存、1792 GB/秒的总内存带宽、21760 个 CUDA 核心、680 个第五代 Tensor 核心和 170 个第四代光线追踪核心,是终极 GeForce GPU,拥有比英伟达之前制造的任何产品都要多的硬件和更强大的功能。 

 

DLSS 4 多帧生成技术首次亮相,借助 AI 可为每个渲染帧生成多达三帧以进一步提高帧率。多帧生成技术可与全套 DLSS 技术协同运行,与传统渲染技术相比,性能提升至高可达 8 倍,同时通过 NVIDIA Reflex 技术保证响应速度。

 

DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。基于 Transformer 架构的 DLSS 超分辨率和光线重建模型具备 2 倍的参数量和 4 倍的计算量,可提高画面稳定性,减少伪影,增加细节并增强抗锯齿效果。GeForce RTX 50 系列 GPU 支持 DLSS 4,发布之日即有超过 75 款游戏和应用支持该技术。

 

在游戏中,具有多帧生成的 DLSS 4 有助于在《赛博朋克 2077》、《心灵杀手 2》和《黑神话:悟空》中成倍提高性能,使 GeForce RTX 5090 用户能够以 4K 240Hz/FPS 的速度玩游戏,并启用完整的光线追踪功能并将其他所有设置都调至最高,以获得终极体验。

 

 

英伟达还推出了 NVIDIA Reflex 2。

 

黄仁勋解释道,最新一代 DLSS 可以为我们计算的每一帧生成三帧。“因此,我们能够以极高的性能进行渲染,因为 AI 的计算量要少得多。”

 

RTX 神经着色器使用小型神经网络来改善实时游戏中的纹理、材质和光照。RTX 神经人脸和 RTX 头发可提高实时面部和头发渲染,使用生成式 AI 来制作有史以来最逼真的数字角色动画。RTX Mega Geometry 将光线追踪三角形的数量增加了 100 倍,从而提供更多细节。

 

NVIDIA Reflex 2 支持 Frame Warp,这项创新技术可在将渲染帧发送至显示器前,根据最新的鼠标输入信号对其进行更新,从而降低游戏延迟。与原生渲染相比,Reflex 2 最高可降低 75% 延迟,为多人竞技类游戏玩家带来制胜优势,也能提高单人游戏操作时的响应速度。 

利用 Cosmos 推进物理 AI

除了图形方面的进步外,黄仁勋还介绍了 NVIDIA Cosmos 世界基础模型平台,称其为机器人和工业 AI 领域的游戏规则改变者。

 

黄仁勋解释道,人工智能的下一个前沿是物理人工智能。他将这一时刻比作大型语言模型对生成式人工智能的变革性影响。

 

他解释道:“通用机器人技术的 ChatGPT 时刻即将到来。”

 

黄仁勋表示,与大型语言模型一样,世界基础模型对于推动机器人和 AV 开发至关重要,但并非所有开发人员都具备训练自己模型的专业知识和资源。

 

Cosmos 集成了生成模型、标记器和视频处理管道,为 AV 和机器人等物理 AI 系统提供支持。Cosmos 旨在将远见和多元宇宙模拟的能力引入人工智能模型,使其能够模拟每一种可能的未来并选择最佳行动。

 

老黄解释说,Cosmos 模型会提取文本、图像或视频提示,并以视频形式生成虚拟世界状态。“Cosmos 生成优先考虑 AV 和机器人用例的独特需求,例如真实世界环境、照明和物体持久性。”

 

首批采用 Cosmos 的公司包括领先的机器人和汽车公司,包括 1X、Agile Robots、Agility、Figure AI、Foretellix、Fourier、Galbot、Hillbot、IntBot、Neura Robotics、Skild AI、Virtual Incision、Waabi 和 XPENG,以及共享乘车巨头 Uber。

 

此外,现代汽车集团正在采用 NVIDIA AI 和 Omniverse 来打造更安全、更智能的汽车,增强制造能力并部署尖端机器人技术。

2025-01-07 16:4311294
用户头像
李冬梅 加V:busulishang4668

发布了 1185 篇内容, 共 809.1 次阅读, 收获喜欢 1302 次。

关注

评论

发布
暂无评论

数据治理的难题:如何化解?

郑州埃文科技

Redis开源社区持续壮大,华为云为Valkey项目注入新的活力

平平无奇爱好科技

有了淘宝商品详情实时数据接口,用户体验up up up!

tbapi

淘宝商品详情数据接口 淘宝API接口 淘宝商品详情接口 淘宝数据采集

业内首家!火山引擎通过中国信通院超低延时直播性能卓越级评估

信通院IOMM数字化转型团队

IOMM

CloudXR带来高质量XR效果呈现

3DCAT实时渲染

CLOUDXR 云化XR

“大模型驱动的软件研发”助推企业研发智能化升级

平平无奇爱好科技

MES管理系统的生产模块与ERP有何差异

万界星空科技

ERP mes 万界星空科技 制造业工厂

素材管理工具有哪些?这款图片整理软件好用到爆!

彭宏豪95

设计 在线白板 办公软件 素材中转站 图片素材管理软件

iPaaS中API自动化测试的作用

谷云科技RestCloud

自动化测试 API ipaas

IDC:中国边缘计算市场快速增长,浪潮信息份额近半稳居第一

财见

活动回顾 |观测云 AI Agent 探索实践

观测云

LLM

时序数据库 IoTDB 赋能上海电气国轩智慧储能运营云平台建设

Apache IoTDB

成本降低 90%,出海社交平台 Typing 基于 Databend 的大数据探索与实践

Databend

解读丨海购新趋势下的跨境淘宝代购集运系统

tbapi

跨境电商 跨境进口 淘宝代购系统 反向海淘 跨境淘宝代购系统

时序数据库 IoTDB 赋能上海电气国轩智慧储能运营云平台建设

Apache IoTDB

920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄CES亮相全球最小超算GPU_英伟达_李冬梅_InfoQ精选文章