10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

OpenAI 发布通用型 ChatGPT 代理,以应对 Excel、PowerPoint 和 Chrome 浏览器的挑战

作者:Andrew Hoblitzell

  • 2025-07-24
    北京
  • 本文字数:1422 字

    阅读完需:约 5 分钟

大小:708.58K时长:04:01
OpenAI发布通用型ChatGPT代理,以应对Excel、PowerPoint和Chrome浏览器的挑战

最近,OpenAI发布ChatGPT代理,它将Operator的浏览技能和Deep Research的总结能力整合到单一的“ChatGPT 代理”中。现在,开发者不再需要将代码或公式片段粘贴到 ChatGPT 中,然后再将答案复制到生产力应用中,而是可以提示一个工具来收集数据、对其进行推理,并一次性返回一个可编辑的电子表格或幻灯片。

 

该代理通过在后台发出 Python 代码来编写有效的.xlsx 和.pptx 文件,其输出可以在 Excel、LibreOffice、PowerPoint、Keynote 或任何理解开放格式的库中打开。企业家早期的实践笔记指出,即使是简单的一行提示也能生成连贯的幻灯片。在聊天窗口背后,代理可以在 GUI 浏览器、文本浏览器、类 POSIX 终端和直接 API 调用之间进行选择。它可以通过“连接器”登录到 SaaS 工具,使用文本浏览器抓取表格,运行终端中的代码进行数据整形,并将结果放入 LibreOffice,然后提供下载链接。



SpreadsheetBench上,ChatGPT 代理的准确率达到了 45.5%,而 Copilot-in-Excel 仅为 20%。OpenAI 还声称,ChatGPT 代理在DSBenchBrowseComp上取得了一流的成绩,在Humanity's Last Exam上一次通过率达到了 41.6%,但这些基准测试都假设代理被允许运行代码和浏览。

 

我会向我自己的家人解释说……在有机会在实际应用中研究和改进它之前,我不会把它用于高风险的用途或处理大量个人信息。—— Sam Altman

 

从开发者的角度来看,代理只是又一个 ChatGPT 工具选项,你基于Assistants API构建的任何东西都会自动继承它。通过连接器可以将代理指向私有 GitHub 存储库或 Grafana 面板,而 Generative-Excel-Data-Assistant 等 GitHub 项目和 Azure 的“assistant-agent”笔记本则展示了如何将工作流嵌入内部应用程序。像awesome-ai-agents这样的社区列表收录了数十个类似的开源项目,你现在就可以开始创建分支。



该功能是在 OpenAI 经历了一个 “坎坷的夏天”之后推出的,但仍然成了一项引人注目的胜利。TechRadar在实测中让它规划了一个到东京旅游的行程,并生成了一个格式化的表格。另一方面,基准测试显示了不同的结果。早期的ZDNet基准测试发现,在多步骤任务中,只有八分之一可以在不产生幻觉的情况下完成,而The Information引用了一位测试者遇到的情况,一个人类在 15 分钟内就能完成的任务,他等了 30 分钟。OpenAI 也做了说明,当代理同时处理多个工具时风险更高、运行时间更长。该公司最近与 Gemini 和其他深度推理模型共享了 IMO Gold,而 Alexander Wei评论说该公司“很快将发布 GPT5”。

 

你可能不会看到软件的完全压缩,其中只有一个代理和一个数据库,因为工作流和公司特有的业务流程中有很多逻辑需要构建到数据库中或围绕数据库构建……代理会在 1%的时间里犯错误,它会与某人分享错误的东西或向错误的人开放访问权限。—— Box CEO Aaron Levie

 

高质量的标记数据仍然是每个代理工作流所赖以生存的氧气。这也解释了为什么 Meta 刚刚开出了一张价值 140 亿美元的支票,用于购买Scale AI近一半的人工合成图像、代码跟踪和 RLHF 示例,供未来发布的 Llama 使用。。像亚马逊Mechanical Turk这样的众包主力仍然在填充边缘案例提示的长尾,而像Turing这样的其他初创公司现在拥有超过 400 万专家标记员,并且收入增长了三倍,达到 3 亿美元,为那些对 Meta 的新窗口保持警惕的实验室提供了一个中立选项。

 

希望实施代理的开发者应该将输出视为草稿资料,执行沙盒凭证并捕获日志——这是生态系统成熟过程中的奠基性实践。如果你想了解更多信息,请参考系统卡片

 

原文链接:

https://www.infoq.com/news/2025/07/openai-chatgpt-agents/

2025-07-24 10:056678

评论

发布
暂无评论

架构师实战营 模块一作业(微信业务架构和学生管理系统架构备选方案)

代廉洁

架构实战营

区块链走红 江苏多行业应用迈入"可信时代"

CECBC

农产品

架构实战营-模块1-作业

笑春风

架构实战营

第一课作业

杰语

架构实战营 - 模块一作业

凯迪

架构实战营

配置中的动态代码

顿晓

配置化开发 Function 4月日更 动态函数

架构实战营 模块一:课后作业

👈

架构实战营

架构实战营 模块一:学习总结

👈

架构实战营

「架构师训练营 4 期」 第十三周 - 001&2

凯迪

架构师训练营 4 期

3.4 Go语言从入门到精通:包管理工具之Go module

xcbeyond

go modules Go 语言 4月日更

华仔训练营第一次作业

方堃

8x Flow 业务建模法(二):再看什么是业务逻辑

胡皓

领域驱动设计 DDD 业务建模 8xFlow 业务逻辑

算法训练营 - 学习笔记 - 第一周

心在飞

没有lrzsz,怎么传文件到服务器?

运维研习社

运维 工具

架构实战营-模块一作业

俞立夫

架构实战营

模块一,学习总结

俞立夫

架构实战营

零基础学Tableau系列 | 04—标靶图、甘特图、瀑布图

不温卜火

数据可视化 数据清洗 4月日更

博客主题用腻了?来试试赛博朋克 2077 主题吧!

清秋

CMS Hexo 博客 4月日更

JavaScript 图片转文字,文字转语音

空城机

JavaScript 大前端 4月日更 tesseract 图片转文字

架构实战营 模块 1 课后作业

eoeoeo

架构实战营

华仔架构实战营 - 作业 - 模块1

曲元洪

架构实战营

区块链:颠覆其外,守旧其中

CECBC

互联网

第13周课后练习-数据应用(二)

潘涛

架构师训练营 4 期

sql执行顺序优化

大数据技术指南

sql 4月日更

回归本我还是追逐名利,技术人在中年危机下的抉择?

刘华Kenneth

管理 职场 中年危机

如何做决策?

石云升

决策 28天写作 职场经验 管理经验 4月日更

外网访问Ubuntu下的Tomcat

U2647

tomcat ubuntu 4月日更

强化学习—DQN:不讲前世,就论今生

打工人!

深度学习 强化学习 深度强化学习 图解源码分析 DQN

区块链开发主流语言和核心优势

CECBC

区块链

【极客大学】模块一作业

冬天的树

Hadoop 3.x 版本相对于 Hadoop 2.x的新特性

五分钟学大数据

hadoop 4月日更

OpenAI发布通用型ChatGPT代理,以应对Excel、PowerPoint和Chrome浏览器的挑战_AI&大模型_InfoQ精选文章