免费注册!6月19-20日,「亚马逊云科技中国峰会」重磅来袭! 了解详情
写点什么

英伟达 Nemotron 模型旨在加速 AI 智能体代理的开发

作者:Sergio De Simone

  • 2025-02-01
    北京
  • 本文字数:1014 字

    阅读完需:约 3 分钟

英伟达 Nemotron 模型旨在加速 AI 智能体代理的开发

英伟达(Nvidia)推出了 Llama Nemotron 大语言模型(LLM)和 Cosmos Nemotron 视觉语言模型(VLM),特别强调由 AI 智能体代理驱动的工作流程,例如客户支持、欺诈检测、产品供应链优化等。Nemotron 系列中的模型有 Nano、Super 和 Ultra 等尺寸,以更好地满足不同系统的要求。


英伟达表示,人工智能智能体代理是生成式人工智能进化的一个新前沿,旨在创建能够自主执行复杂任务的系统。这需要将 LLM 所展现的语言技能与感知和与环境互动的能力相结合。


为了提高效率,许多人工智能智能体代理既需要语言技能,也需要感知世界并做出适当行动的能力。


这就解释了为什么 Nemotron 模型系列包括了源自 Meta 的 LLaMA 模型的衍生模型,以及能够分析和响应在用户环境中所捕获的图像和视频的新 Cosmos Nemotron VLM。


英伟达表示,具备视觉功能的智能体代理可以实时分析 来自多种环境中的工业摄像头的视频,从而帮助检测事故、减少缺陷,或指导人类采取某些行动。按照该公司的说法,目前只有不到 1% 的工业摄像头的视频是由人类实时观看的。


根据英伟达的说法,他们训练 Llama Nemotron 模型,使其能够高效地执行许多常见的代理任务,因此你只需使用这一个模型即可,而无需用多个专用模型。


对模型进行修剪以减少延迟并提高计算效率,然后使用具有蒸馏和对齐方法的高质量数据集进行再训练,以提高跨任务的准确性。这样可以使模型更小,精度和吞吐量更高。


Nemotron 模型针对不同的计算需求进行了优化,包括面向 PC 应用程序开发人员的 Nano、在单个 GPU 上提供高性能的 Super,以及专为数据中心规模应用程序设计的 Ultra。


英伟达 Nemotron 生态系统还包括 Nvidia NeMo,用于使用专有数据的定制模型,以及 NeMo Aligner,用于更好地对齐模型以遵循指令并生成人类偏好的响应。此外,英伟达还提供了 Nvidia AI Blueprints,作为一种工具,通过使用 NIM 微服务作为构建块来为 Nemotron 模型提供服务,从而快速创建 AI 智能体代理。


与此相关的是,英伟达还宣布了其 Cosmos world foundation 模型,该模型专门用于为机器人和自动驾驶汽车生成物理感知视频。


作者介绍


Sergio De Simone 作为一名软件工程师,已拥有超过 25 年的经验。他在不同的项目和公司工作过,包括西门子、惠普和小型初创公司等不同的工作环境。在过去的十多年里,他一直专注于移动平台和相关技术的开发。他目前就职于 BigML, Inc.,负责 iOS 和 macOS 的开发。


原文链接:


https://www.infoq.com/news/2025/01/nvidia-nemotron-agents/

2025-02-01 14:0011523

评论

发布
暂无评论

最高法两会报告聚焦区块链惩治抄袭,区块链在保护网络著作权方面如何作为?

CECBC

法律

图片社区类APP增加评论表情包功能

🙈🙈🙈

极客大学产品经理训练营

有感于最近的一些事件

ES_her0

28天写作 3月日更

作业5-待完成

YING꯭YING

融云 CallLib 集成遇到的问题

融云 RongCloud

融云发送语音消息

融云 RongCloud

融云 IM 那些事儿

融云 RongCloud

集成融云小程序 SDK 遇到的问题

融云 RongCloud

融云 Web SDK 如何实现只有一个设备登入

融云 RongCloud

(28DW-S8-Day25) 用流程重新定义职位

mtfelix

28天写作

集成融云 Web 音视频通话踩坑之旅

融云 RongCloud

融云 IM SDK 发送语音消息

融云 RongCloud

《MySQL》系列 - 小胖要的 MySQL 索引详解(附 20 张图解)

一个优秀的废人

Java MySQL 数据库 索引 B+树

集成融云 IM 问题总结

融云 RongCloud

结合融云 WebSDK 了解 WebSocket 基本原理

融云 RongCloud

融云 AMR(Aduio) 播放 AMR 格式 Base64 码音频

融云 RongCloud

融云 Web 播放声音 — Flash 篇 (播放 AMR、WAV)

融云 RongCloud

融云 Web 播放声音(AMR 、WAVE)

融云 RongCloud

区块链如何走向云端?

CECBC

云技术

中关村软件园与百度飞桨启动AI人才培养计划:AI发展,人才先行

百度大脑

人工智能 百度 人才培养

区块链版权保护平台--催生版权保护新格局

13530558032

提醒小程序的产品文档——大作业心得总结

小匚

产品经理 随笔杂谈 产品经理训练营 极客大学产品经理训练营

加快数字化发展 建设数字中国

CECBC

大数据

产品经理训练营——大作业

产品经理训练营

平安智慧社区解决方案,平安社区综合管理平台

13530558032

使用融云 Web SDK 撤回消息

融云 RongCloud

什么是 Git? - 探索分布式版本控制工具

码语者

git DevOps

通过融云 WebSDK 简单了解 WebSocket

融云 RongCloud

SDK 兼容 JSON

融云 RongCloud

重来:更为简单有效的商业逻辑

张老蔫

28天写作

融云 Web SDK 删除历史消息

融云 RongCloud

英伟达 Nemotron 模型旨在加速 AI 智能体代理的开发_生成式 AI_InfoQ精选文章