50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

OpenAI 发布通用型 ChatGPT 代理,以应对 Excel、PowerPoint 和 Chrome 浏览器的挑战

作者:Andrew Hoblitzell

  • 2025-07-24
    北京
  • 本文字数:1422 字

    阅读完需:约 5 分钟

大小:708.58K时长:04:01
OpenAI发布通用型ChatGPT代理,以应对Excel、PowerPoint和Chrome浏览器的挑战

最近,OpenAI发布ChatGPT代理,它将Operator的浏览技能和Deep Research的总结能力整合到单一的“ChatGPT 代理”中。现在,开发者不再需要将代码或公式片段粘贴到 ChatGPT 中,然后再将答案复制到生产力应用中,而是可以提示一个工具来收集数据、对其进行推理,并一次性返回一个可编辑的电子表格或幻灯片。

 

该代理通过在后台发出 Python 代码来编写有效的.xlsx 和.pptx 文件,其输出可以在 Excel、LibreOffice、PowerPoint、Keynote 或任何理解开放格式的库中打开。企业家早期的实践笔记指出,即使是简单的一行提示也能生成连贯的幻灯片。在聊天窗口背后,代理可以在 GUI 浏览器、文本浏览器、类 POSIX 终端和直接 API 调用之间进行选择。它可以通过“连接器”登录到 SaaS 工具,使用文本浏览器抓取表格,运行终端中的代码进行数据整形,并将结果放入 LibreOffice,然后提供下载链接。



SpreadsheetBench上,ChatGPT 代理的准确率达到了 45.5%,而 Copilot-in-Excel 仅为 20%。OpenAI 还声称,ChatGPT 代理在DSBenchBrowseComp上取得了一流的成绩,在Humanity's Last Exam上一次通过率达到了 41.6%,但这些基准测试都假设代理被允许运行代码和浏览。

 

我会向我自己的家人解释说……在有机会在实际应用中研究和改进它之前,我不会把它用于高风险的用途或处理大量个人信息。—— Sam Altman

 

从开发者的角度来看,代理只是又一个 ChatGPT 工具选项,你基于Assistants API构建的任何东西都会自动继承它。通过连接器可以将代理指向私有 GitHub 存储库或 Grafana 面板,而 Generative-Excel-Data-Assistant 等 GitHub 项目和 Azure 的“assistant-agent”笔记本则展示了如何将工作流嵌入内部应用程序。像awesome-ai-agents这样的社区列表收录了数十个类似的开源项目,你现在就可以开始创建分支。



该功能是在 OpenAI 经历了一个 “坎坷的夏天”之后推出的,但仍然成了一项引人注目的胜利。TechRadar在实测中让它规划了一个到东京旅游的行程,并生成了一个格式化的表格。另一方面,基准测试显示了不同的结果。早期的ZDNet基准测试发现,在多步骤任务中,只有八分之一可以在不产生幻觉的情况下完成,而The Information引用了一位测试者遇到的情况,一个人类在 15 分钟内就能完成的任务,他等了 30 分钟。OpenAI 也做了说明,当代理同时处理多个工具时风险更高、运行时间更长。该公司最近与 Gemini 和其他深度推理模型共享了 IMO Gold,而 Alexander Wei评论说该公司“很快将发布 GPT5”。

 

你可能不会看到软件的完全压缩,其中只有一个代理和一个数据库,因为工作流和公司特有的业务流程中有很多逻辑需要构建到数据库中或围绕数据库构建……代理会在 1%的时间里犯错误,它会与某人分享错误的东西或向错误的人开放访问权限。—— Box CEO Aaron Levie

 

高质量的标记数据仍然是每个代理工作流所赖以生存的氧气。这也解释了为什么 Meta 刚刚开出了一张价值 140 亿美元的支票,用于购买Scale AI近一半的人工合成图像、代码跟踪和 RLHF 示例,供未来发布的 Llama 使用。。像亚马逊Mechanical Turk这样的众包主力仍然在填充边缘案例提示的长尾,而像Turing这样的其他初创公司现在拥有超过 400 万专家标记员,并且收入增长了三倍,达到 3 亿美元,为那些对 Meta 的新窗口保持警惕的实验室提供了一个中立选项。

 

希望实施代理的开发者应该将输出视为草稿资料,执行沙盒凭证并捕获日志——这是生态系统成熟过程中的奠基性实践。如果你想了解更多信息,请参考系统卡片

 

原文链接:

https://www.infoq.com/news/2025/07/openai-chatgpt-agents/

2025-07-24 10:056764

评论

发布
暂无评论

与前端训练营的日子 --Week08

SamGo

学习

Cache Design Patterns

邵俊达

九、性能三

Geek_28b526

第 4 周作业提交

Binary

极客大学架构师训练营

架构师训练营第十三周作业

Shunyi

极客大学架构师训练营

架构一期第十三周作业

Airs

盘点2020|从写程序到写文章,一个宅男程序猿到平台写手的心路历程

罗小龙

程序猿 盘点2020 心路历程 宅男 平台写手

IoT数据模型设计

soolaugust

物联网 IoT 数据模型 工业物联网 七日更

Week_13 总结

golangboy

极客大学架构师训练营

架构师训练营第九周总结

xiaomao

Week_13 作业

golangboy

极客大学架构师训练营

Week9 作业:描述秒杀系统

evildracula

架构师训练营 - week13 - 作业

lucian

极客大学架构师训练营

JVM 垃圾回收原理

皮蛋

JVM JVM原理

盘点2020 | 21 张图总结我的 2020 年

Geek_z9ygea

盘点2020

盘点2020 | 愿美好如期而至

小天同学

总结 日常思考 盘点2020

第九周作业总结

hunk

极客大学架构师训练营

训练营第十三周作业 2

仲夏

《面试官不讲武德》对Java初级程序猿死命摩擦Http协议

Silently9527

面试 https HTTP 图解https

架构师训练营第十三周学习笔记

一马行千里

学习 极客大学架构师训练营

生产环境全链路压测建设历程 15:达成了99.99%,建设了哪些稳定性产品、工具?

数列科技杨德华

全链路压测 七日更

训练营第十三周作业 1

仲夏

极客大学架构师训练营

一文搞懂 CountDownLatch 用法和源码!

苹果看辽宁体育

Java 源码 并发

架构师训练营第十三周命题作业

一马行千里

极客大学架构师训练营 命题作业

【架构师训练营 1 期】第十三周学习总结

诺乐

第13周作业

paul

架构师训练营第十三周课程笔记及心得

Airs

架构师第十三周总结

Geek_Gu

极客大学架构师训练营

架构师训练营第九周作业

xiaomao

week9-作业二: 根据当周学习情况,完成一篇学习总结

未来已来

Week 9 性能优化Java & 秒杀

evildracula

学习 架构

OpenAI发布通用型ChatGPT代理,以应对Excel、PowerPoint和Chrome浏览器的挑战_AI&大模型_InfoQ精选文章