写点什么

英伟达 Nemotron 模型旨在加速 AI 智能体代理的开发

作者:Sergio De Simone

  • 2025-02-01
    北京
  • 本文字数:1014 字

    阅读完需:约 3 分钟

英伟达 Nemotron 模型旨在加速 AI 智能体代理的开发

英伟达(Nvidia)推出了 Llama Nemotron 大语言模型(LLM)和 Cosmos Nemotron 视觉语言模型(VLM),特别强调由 AI 智能体代理驱动的工作流程,例如客户支持、欺诈检测、产品供应链优化等。Nemotron 系列中的模型有 Nano、Super 和 Ultra 等尺寸,以更好地满足不同系统的要求。


英伟达表示,人工智能智能体代理是生成式人工智能进化的一个新前沿,旨在创建能够自主执行复杂任务的系统。这需要将 LLM 所展现的语言技能与感知和与环境互动的能力相结合。


为了提高效率,许多人工智能智能体代理既需要语言技能,也需要感知世界并做出适当行动的能力。


这就解释了为什么 Nemotron 模型系列包括了源自 Meta 的 LLaMA 模型的衍生模型,以及能够分析和响应在用户环境中所捕获的图像和视频的新 Cosmos Nemotron VLM。


英伟达表示,具备视觉功能的智能体代理可以实时分析 来自多种环境中的工业摄像头的视频,从而帮助检测事故、减少缺陷,或指导人类采取某些行动。按照该公司的说法,目前只有不到 1% 的工业摄像头的视频是由人类实时观看的。


根据英伟达的说法,他们训练 Llama Nemotron 模型,使其能够高效地执行许多常见的代理任务,因此你只需使用这一个模型即可,而无需用多个专用模型。


对模型进行修剪以减少延迟并提高计算效率,然后使用具有蒸馏和对齐方法的高质量数据集进行再训练,以提高跨任务的准确性。这样可以使模型更小,精度和吞吐量更高。


Nemotron 模型针对不同的计算需求进行了优化,包括面向 PC 应用程序开发人员的 Nano、在单个 GPU 上提供高性能的 Super,以及专为数据中心规模应用程序设计的 Ultra。


英伟达 Nemotron 生态系统还包括 Nvidia NeMo,用于使用专有数据的定制模型,以及 NeMo Aligner,用于更好地对齐模型以遵循指令并生成人类偏好的响应。此外,英伟达还提供了 Nvidia AI Blueprints,作为一种工具,通过使用 NIM 微服务作为构建块来为 Nemotron 模型提供服务,从而快速创建 AI 智能体代理。


与此相关的是,英伟达还宣布了其 Cosmos world foundation 模型,该模型专门用于为机器人和自动驾驶汽车生成物理感知视频。


作者介绍


Sergio De Simone 作为一名软件工程师,已拥有超过 25 年的经验。他在不同的项目和公司工作过,包括西门子、惠普和小型初创公司等不同的工作环境。在过去的十多年里,他一直专注于移动平台和相关技术的开发。他目前就职于 BigML, Inc.,负责 iOS 和 macOS 的开发。


原文链接:


https://www.infoq.com/news/2025/01/nvidia-nemotron-agents/

2025-02-01 14:0011577

评论

发布
暂无评论

美团五面+滴滴四面,复盘总结117道面试题,大厂套路展露无遗

Java架构之路

Java 程序员 架构 面试 编程语言

真香~~看完看阿里P8大牛手写的450页文档总结,我精通Java并发编程了

Java架构之路

Java 程序员 架构 面试 编程语言

【Java入门】Array

Albert

Java 七日更

GitHub标星78.9K的算法宝典,让你分分钟刷爆LeetCode,更有“左神”精讲视频加持,金三银四offer手到擒来

程序员 面试 算法 架构师

python3参考秘籍-附PDF下载

程序那些事

Python 程序那些事 Python秘籍 Python数据分析

刨根问底,kafka到底会不会丢消息

爱笑的架构师

kafka 消息队列 Kafka知识点 消息中间件 七日更

“关灯”看这出戏,依旧是百年至美

脑极体

刘华:戏说Docker和K8s,一文让你成为懂王

刘华Kenneth

Docker 云计算 Kubernetes DevOps k8s

华为全栈AI技术干货深度解析,解锁企业AI开发“秘籍”

华为云开发者联盟

AI 全栈 开发

够屌!看完“大牛程序员必修16课”足足让你超越80%Java面试者!赶紧冲!

比伯

Java 编程 程序员 架构 面试

微服务:服务本身的设计、维护以及治理

积极&丧

别找了,这份PDF是目前Java程序员最全面的学习文档,没有之一

Java架构之路

Java 程序员 架构 面试 编程语言

四面美团大众点评归来,分享一下我总结的面试题及解析:并发+spring+分布式+jvm+缓存+数据库

Java架构之路

Java 程序员 架构 面试 编程语言

skynet源码分析之网络层—Lua层

赖猫

c++ lua skynet

一周信创舆情观察(12.14~12.20)

统小信uos

架构师训练营大作业1

邓昀垚

关于自己的一个梦(控制)

Yuchen

情绪控制 心理 个人 控制感 自我思考

架构师系列11 微服务架构的思考

桃花原记

领域驱动落地实现

星际行者

DDD 领域驱动

Hystrix-技术专题-基础运作原理

码界西柚

Rust太难?那是你没看到这套Rust语言学习万字指南!

华为云开发者联盟

rust 语言 开发语言

Java异常处理的9个最佳实践,看看自己是不是都用过?

geekymv

Java 异常处理

游戏自动化测试——局内战斗

行者AI

测试

架构师训练营第五周作业

Geek_xq

普本开发三年,每天两小时面试备战,2个月后五面阿里定级P7

Java架构之路

Java 程序员 架构 面试 编程语言

花火交易所系统APP软件开发

系统开发

架构师训练营第五周总结

Geek_xq

乘百度AI之风,媒体从业者们这样登上智能云端

脑极体

多线程之信号量(By C++)

赖猫

c++ 多线程

今天,我们为什么应该读懂华为人工智能?

脑极体

TypeScript | 第五章:高级类型

梁龙先森

typescript 大前端 七日更

英伟达 Nemotron 模型旨在加速 AI 智能体代理的开发_生成式 AI_InfoQ精选文章