AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

微软推出 Magentic-One,一个通用的多智能体代理系统

作者:Daniel Dominguez

  • 2024-12-24
    北京
  • 本文字数:1286 字

    阅读完需:约 4 分钟

微软推出 Magentic-One,一个通用的多智能体代理系统

微软宣布推出 Magentic-One,这是一个新的通用多智能体代理系统,旨在处理涉及 Web 和基于文件环境的开放式任务。该系统旨在协助处理跨不同领域的复杂、多步骤任务,以提高软件开发、数据分析和网页导航等活动的效率。


Magentic-One 采用由协调器(Orchestrator)智能体代理领导的多智能体代理架构,协调四个专门的智能体代理:WebSurfer,处理基于浏览器的任务,如导航网站和与在线内容交互;FileSurfer,管理与文件相关的操作,包括读取文档和导航目录;Coder,编写和分析代码以创建解决方案;以及 ComputerTerminal,运行代码并执行系统级操作。


该系统采用模块化设计原则,使智能体代理能够独立运行并适应新任务,而无需对系统进行重大的更改。Magentic-One 基于 Microsoft AutoGen(一个用于开发多智能体代理系统的开源框架)构建,与模型无关,并且与包括 GPT-4o 在内的不同大语言模型(LLM)兼容。


Magentic-One 使用 AutoGenBench(一种用于智能体代理系统评估的工具)在 GAIA、AssistantBench 和 WebArena 等基准上进行了测试。结果显示,与其他最先进的解决方案相比,该系统的准确性具有相当的竞争力,证明了该系统管理复杂工作流程方面的能力。


微软强调了与智能体代理系统相关的潜在风险,例如意外操作和系统滥用。在开发过程中,发现了诸如重复登录失败和尝试寻求外部人工协助等情况。为了降低此类风险,该系统包括了安全部署指南、红队演习和人工监督建议。


Magentic-One 的发布引发了人工智能社区的兴趣。大语言模型(LLM)专家 Elvis Saravia 在 X 上评论道:


虽然现在还为时尚早,但这种建立通用智能体代理系统的新趋势值得关注。此外,其他当前基于 LLM 的应用程序,如 RAG,也将受益于这种建立在多个专用智能体代理之上的系统。


而用户 Alexian_Theory 在 reddit 上分享道:


网页浏览的方法很有趣。它会对正在运行的无头浏览器进行快照,将图像传递给支持视觉的 LLM,然后决定下一步应该如何进行以完成任务。


Magentic-One 及其评估工具 AutoGenBench 的代码现已作为开源资源提供。微软鼓励与研究人员和开发人员合作,改进智能体代理人工智能系统,重点关注安全性、操作的可逆性,并最大限度地降低实际应用中的风险。相关的技术细节和实现资源,请参阅官方文档和 GitHub 存储库。


多智能体代理编排系统的开发正成为整个人工智能行业的核心焦点。几家大型的公司都在通过自己的方法来编排专业的智能体代理,为这一趋势做出贡献。AWS 推出了 Multi-Agent Orchestrator,IBM 正在开发 Bee Agent,OpenAI 开发了 Swarm。这些系统中的每一个都旨在编排多个智能体代理,以有效地解决复杂的多步骤任务,这表明人们越来越重视模块化和协作式人工智能架构。

作者介绍


Daniel Dominguez 是 AWS 合作伙伴网络公司 SamXLabs 的执行合伙人。他在初创公司和财富 500 强公司的软件产品开发方面拥有超过 12 年的经验。Daniel 拥有华盛顿大学的机器学习专业学位。他热衷于利用人工智能和云计算来创建创新的解决方案。作为机器学习领域的 AWS 社区建设者,Daniel 致力于分享知识并推动软件产品的创新。


查看原文链接:

https://www.infoq.com/news/2024/11/microsoft-magentic-one/

2024-12-24 09:175993

评论 1 条评论

发布
用户头像
这是infoq.com上11月份的一篇文章
2024-12-24 09:43 · 北京
回复
没有更多了

技术实操丨HBase 2.X版本的元数据修复及一种数据迁移方式

华为云开发者联盟

数据 数据迁移 原数据

BIGDATA+AI Meetup 2020第二季·上海站开启报名!

Apache Flink

大数据 AI

在网上被MG坑审过却一直延迟无法取出到账怎么解决 (LGF微7998)

Geek_db0f9e

让核显大展拳脚:Intel Iris Xe显卡

E科讯

MySQL-技术专题-MySQL的主从同步

码界西柚

Java程序员想要进阶,想了解Java服务器的深层高阶知识,Netty绝对是一个必须要过的门槛。

Java架构之路

Java 程序员 架构 编程语言 随笔杂谈

美腻了!Java资深架构师带你深度学习字节跳动的亿级流量+高并发

Java架构追梦

Java 学习 架构 面试 微服务

基于注解的参数校验器Hibernate Validator

HelloLittleRain

Java springboot 参数校验 Hibernate-Validator

华为云瑶光:打通云边端界限,为企业云上业务带来最优解

华为云开发者联盟

华为 云服务

spring-boot-route(二十一)quartz实现动态定时任务

Java旅途

Java Spring Boot quartz

杂谈:一文了解工业4.0

soolaugust

工业互联网 工业4.0

视频面试跟传统面试的区别及优点

anyRTC开发者

ios 音视频 WebRTC RTC 安卓

最火的HTAP数据库 京东智联云新一代分布式数据库TiDB架构揭秘

京东科技开发者

数据库 #TiDB

身为程序员你们经历过大厂面试吗?本文为大家解决大厂必问的MySQL调优问题

Java架构师迁哥

1分钟带你入门Redux、React-Redux

Leo

大前端 React Redux React-Redux

一套完整的后台管理系统(附源码),非常实用!

程序员生活志

管理系统

Java程序员还在为没有项目经验感到苦恼?快来看看GitHub上最火的SpringCloud微服务商城系统开源项目,附全套教程!

Java架构之路

Java 程序员 架构 面试 编程语言

【活动预告】2020中国系统架构师大会:即构受邀分享实时音视频服务架构实践

ZEGO即构

架构师 高并发系统设计 技术分享

1分钟带你入门 Redux 中间件

Leo

大前端 中间件 Redux Redux中间件

【运维思考】运维对象快速扩展,监控如何精准实时的覆盖?

嘉为蓝鲸

PaaS 运维自动化 监控管理平台 监控系统 监控告警

原来AI也可以如此简单!教你从0到1开发开源知识问答机器人

华为云开发者联盟

开源 AI 机器人

LeetCode题解:98. 验证二叉搜索树,递归中序遍历完成后再判断,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

连续一个月每天加班到凌晨三点,终于把Java程序员必知必会的计算机底层操作系统知识和网络知识整理出来了,已整理成文档!

Java架构之路

Java 程序员 架构 编程语言 操作系统

解锁华为云AI如何助力无人车飞驰“新姿势”,大赛冠军有话说

华为云开发者联盟

AI 无人驾驶

透视HTTPS建造固若金汤的堡垒

码哥字节

https 加密解密 HTTP

iOS 性能优化实践:头条抖音如何实现 OOM 崩溃率下降50%+

iOSer

性能优化 OOM ios开发 头条抖音 OOM崩溃

WebSocket硬核入门:200行代码,教你徒手撸一个WebSocket服务器

JackJiang

html5 网络编程 websocket 即时通讯

独家!阿里技术人限产的MySQL高级笔记及面试宝典,学完简直开挂

Java架构追梦

Java MySQL 数据库 架构 面试

膜拜!阿里技术总监纯手打的《MySQL笔记》内部资料限时分享

Java架构师迁哥

云原生在京东丨云原生时代下的监控:如何基于云原生进行指标采集?

京东科技开发者

云原生

独家!阿里技术人限产的MySQL高级笔记及面试宝典,简直开挂

996小迁

Java MySQL 架构 面试 技术宅

微软推出 Magentic-One,一个通用的多智能体代理系统_微软_InfoQ精选文章