写点什么

OpenAI 发布通用型 ChatGPT 代理,以应对 Excel、PowerPoint 和 Chrome 浏览器的挑战

作者:Andrew Hoblitzell

  • 2025-07-24
    北京
  • 本文字数:1422 字

    阅读完需:约 5 分钟

大小:708.58K时长:04:01
OpenAI发布通用型ChatGPT代理,以应对Excel、PowerPoint和Chrome浏览器的挑战

最近,OpenAI发布ChatGPT代理,它将Operator的浏览技能和Deep Research的总结能力整合到单一的“ChatGPT 代理”中。现在,开发者不再需要将代码或公式片段粘贴到 ChatGPT 中,然后再将答案复制到生产力应用中,而是可以提示一个工具来收集数据、对其进行推理,并一次性返回一个可编辑的电子表格或幻灯片。

 

该代理通过在后台发出 Python 代码来编写有效的.xlsx 和.pptx 文件,其输出可以在 Excel、LibreOffice、PowerPoint、Keynote 或任何理解开放格式的库中打开。企业家早期的实践笔记指出,即使是简单的一行提示也能生成连贯的幻灯片。在聊天窗口背后,代理可以在 GUI 浏览器、文本浏览器、类 POSIX 终端和直接 API 调用之间进行选择。它可以通过“连接器”登录到 SaaS 工具,使用文本浏览器抓取表格,运行终端中的代码进行数据整形,并将结果放入 LibreOffice,然后提供下载链接。



SpreadsheetBench上,ChatGPT 代理的准确率达到了 45.5%,而 Copilot-in-Excel 仅为 20%。OpenAI 还声称,ChatGPT 代理在DSBenchBrowseComp上取得了一流的成绩,在Humanity's Last Exam上一次通过率达到了 41.6%,但这些基准测试都假设代理被允许运行代码和浏览。

 

我会向我自己的家人解释说……在有机会在实际应用中研究和改进它之前,我不会把它用于高风险的用途或处理大量个人信息。—— Sam Altman

 

从开发者的角度来看,代理只是又一个 ChatGPT 工具选项,你基于Assistants API构建的任何东西都会自动继承它。通过连接器可以将代理指向私有 GitHub 存储库或 Grafana 面板,而 Generative-Excel-Data-Assistant 等 GitHub 项目和 Azure 的“assistant-agent”笔记本则展示了如何将工作流嵌入内部应用程序。像awesome-ai-agents这样的社区列表收录了数十个类似的开源项目,你现在就可以开始创建分支。



该功能是在 OpenAI 经历了一个 “坎坷的夏天”之后推出的,但仍然成了一项引人注目的胜利。TechRadar在实测中让它规划了一个到东京旅游的行程,并生成了一个格式化的表格。另一方面,基准测试显示了不同的结果。早期的ZDNet基准测试发现,在多步骤任务中,只有八分之一可以在不产生幻觉的情况下完成,而The Information引用了一位测试者遇到的情况,一个人类在 15 分钟内就能完成的任务,他等了 30 分钟。OpenAI 也做了说明,当代理同时处理多个工具时风险更高、运行时间更长。该公司最近与 Gemini 和其他深度推理模型共享了 IMO Gold,而 Alexander Wei评论说该公司“很快将发布 GPT5”。

 

你可能不会看到软件的完全压缩,其中只有一个代理和一个数据库,因为工作流和公司特有的业务流程中有很多逻辑需要构建到数据库中或围绕数据库构建……代理会在 1%的时间里犯错误,它会与某人分享错误的东西或向错误的人开放访问权限。—— Box CEO Aaron Levie

 

高质量的标记数据仍然是每个代理工作流所赖以生存的氧气。这也解释了为什么 Meta 刚刚开出了一张价值 140 亿美元的支票,用于购买Scale AI近一半的人工合成图像、代码跟踪和 RLHF 示例,供未来发布的 Llama 使用。。像亚马逊Mechanical Turk这样的众包主力仍然在填充边缘案例提示的长尾,而像Turing这样的其他初创公司现在拥有超过 400 万专家标记员,并且收入增长了三倍,达到 3 亿美元,为那些对 Meta 的新窗口保持警惕的实验室提供了一个中立选项。

 

希望实施代理的开发者应该将输出视为草稿资料,执行沙盒凭证并捕获日志——这是生态系统成熟过程中的奠基性实践。如果你想了解更多信息,请参考系统卡片

 

原文链接:

https://www.infoq.com/news/2025/07/openai-chatgpt-agents/

2025-07-24 10:056632

评论

发布
暂无评论

华为与开发者的“情谊”,在HDC.Cloud 2021上书写智能时代新篇

脑极体

双非渣硕的我是如何拿到字节跳动研发岗SP

阿霜

c++ 字节跳动 互联网 计算机 校园招聘

一份百投百中的计算机校招简历是如何迭代足足26版的?

阿霜

c++ 字节跳动 计算机 简历 校招

图论--网络流最大流问题

风骨散人

如何提高Flutter应用程序的性能

老孟Flutter

flutter

[老孟Flutter] Stateful 组件的生命周期

老孟Flutter

flutter

C++后台开发必看,这个学习路线必须收藏

赖猫

c++ Linux 后台开发 服务器开发

数据分析(第八章作业)

Deborah

再推荐一款小众且好用的 Python 爬虫库 - MechanicalSoup

星安果

Python 自动化 爬虫 MechanicalSoup 小众

产品经理面试常见问题总结 3

lenka

3月日更

『C++』我想学C++,C++太难了,那我想入门,给我10分钟我带你入门

风骨散人

JavaEE知识体系梳理

空城机

Java Java介绍 Java EE 大学作业

产品经理训练营 - 第八章作业

joelhy

产品经理训练营

Flutter 中与平台相关的生命周期

老孟Flutter

flutter

互联网HR黑话指南

这就是编程

【Axure9百例NO.46】中继器多条件判断的优雅处理

zhuchuanming

原型设计 Axure 交互原型

文档是给未来自己的珍贵礼物

steve_lee

文档

产品 0 期 - 第九周作业

vipyinzhiwei

操作系统--死锁避免(银行家算法)

风骨散人

银行家算法

能进BAT、TMD的C++学习过程大分享

阿霜

c++ 字节跳动 计算机 BATJMD

『计算机组成原理』 计算机系统概述(考研、面试必备)

风骨散人

如何判断自己是否适合当前公司?

石云升

离职 28天写作 职场经验 3月日更

第八章作业

流浪猫

作业 - 第九周

eva

ARTS-Week-0

绝影

ARTS 打卡计划 ARTS活动

推荐几本 Go 相关书籍

roseduan

书籍推荐 Go Concurrency Patterns Go web 书籍 Go 语言

Python救救我!如何连接串口实现一个报警灯报警器

ucsheep

Python websocket 串口 报警器 报警灯

墨迹天气成长中心页用户路径分析(模拟)

🙈🙈🙈

极客大学产品经理训练营

软件工程是否可以指导小团队的建设

风翱

软件工程 3月日更

第八章作业 - 用户路径

Au revoir

计算机组成原理--主存储器

风骨散人

OpenAI发布通用型ChatGPT代理,以应对Excel、PowerPoint和Chrome浏览器的挑战_AI&大模型_InfoQ精选文章