写点什么

OpenAI 发布通用型 ChatGPT 代理,以应对 Excel、PowerPoint 和 Chrome 浏览器的挑战

作者:Andrew Hoblitzell

  • 2025-07-24
    北京
  • 本文字数:1422 字

    阅读完需:约 5 分钟

大小:708.58K时长:04:01
OpenAI发布通用型ChatGPT代理,以应对Excel、PowerPoint和Chrome浏览器的挑战

最近,OpenAI发布ChatGPT代理,它将Operator的浏览技能和Deep Research的总结能力整合到单一的“ChatGPT 代理”中。现在,开发者不再需要将代码或公式片段粘贴到 ChatGPT 中,然后再将答案复制到生产力应用中,而是可以提示一个工具来收集数据、对其进行推理,并一次性返回一个可编辑的电子表格或幻灯片。

 

该代理通过在后台发出 Python 代码来编写有效的.xlsx 和.pptx 文件,其输出可以在 Excel、LibreOffice、PowerPoint、Keynote 或任何理解开放格式的库中打开。企业家早期的实践笔记指出,即使是简单的一行提示也能生成连贯的幻灯片。在聊天窗口背后,代理可以在 GUI 浏览器、文本浏览器、类 POSIX 终端和直接 API 调用之间进行选择。它可以通过“连接器”登录到 SaaS 工具,使用文本浏览器抓取表格,运行终端中的代码进行数据整形,并将结果放入 LibreOffice,然后提供下载链接。



SpreadsheetBench上,ChatGPT 代理的准确率达到了 45.5%,而 Copilot-in-Excel 仅为 20%。OpenAI 还声称,ChatGPT 代理在DSBenchBrowseComp上取得了一流的成绩,在Humanity's Last Exam上一次通过率达到了 41.6%,但这些基准测试都假设代理被允许运行代码和浏览。

 

我会向我自己的家人解释说……在有机会在实际应用中研究和改进它之前,我不会把它用于高风险的用途或处理大量个人信息。—— Sam Altman

 

从开发者的角度来看,代理只是又一个 ChatGPT 工具选项,你基于Assistants API构建的任何东西都会自动继承它。通过连接器可以将代理指向私有 GitHub 存储库或 Grafana 面板,而 Generative-Excel-Data-Assistant 等 GitHub 项目和 Azure 的“assistant-agent”笔记本则展示了如何将工作流嵌入内部应用程序。像awesome-ai-agents这样的社区列表收录了数十个类似的开源项目,你现在就可以开始创建分支。



该功能是在 OpenAI 经历了一个 “坎坷的夏天”之后推出的,但仍然成了一项引人注目的胜利。TechRadar在实测中让它规划了一个到东京旅游的行程,并生成了一个格式化的表格。另一方面,基准测试显示了不同的结果。早期的ZDNet基准测试发现,在多步骤任务中,只有八分之一可以在不产生幻觉的情况下完成,而The Information引用了一位测试者遇到的情况,一个人类在 15 分钟内就能完成的任务,他等了 30 分钟。OpenAI 也做了说明,当代理同时处理多个工具时风险更高、运行时间更长。该公司最近与 Gemini 和其他深度推理模型共享了 IMO Gold,而 Alexander Wei评论说该公司“很快将发布 GPT5”。

 

你可能不会看到软件的完全压缩,其中只有一个代理和一个数据库,因为工作流和公司特有的业务流程中有很多逻辑需要构建到数据库中或围绕数据库构建……代理会在 1%的时间里犯错误,它会与某人分享错误的东西或向错误的人开放访问权限。—— Box CEO Aaron Levie

 

高质量的标记数据仍然是每个代理工作流所赖以生存的氧气。这也解释了为什么 Meta 刚刚开出了一张价值 140 亿美元的支票,用于购买Scale AI近一半的人工合成图像、代码跟踪和 RLHF 示例,供未来发布的 Llama 使用。。像亚马逊Mechanical Turk这样的众包主力仍然在填充边缘案例提示的长尾,而像Turing这样的其他初创公司现在拥有超过 400 万专家标记员,并且收入增长了三倍,达到 3 亿美元,为那些对 Meta 的新窗口保持警惕的实验室提供了一个中立选项。

 

希望实施代理的开发者应该将输出视为草稿资料,执行沙盒凭证并捕获日志——这是生态系统成熟过程中的奠基性实践。如果你想了解更多信息,请参考系统卡片

 

原文链接:

https://www.infoq.com/news/2025/07/openai-chatgpt-agents/

2025-07-24 10:056788

评论

发布
暂无评论

HashMap源码分析(七)

知识浅谈

hashmap 10月月更

长安链源码分析之交易过程分析(1)

“程”风破浪的开发者|python GUI开发记录

衝鋒壹号

学习方法 个人成长 “程”风破浪的开发者

JNI中实现类似C++回调方法-结构体操作

中国好公民st

c++ jni 10月月更

从零到一搭建一个属于自己的博客系统(弎)

木偶

MySQL django 前端 10月月更

数据湖(十):Hive与Iceberg整合

Lansonli

数据湖 10月月更

Opencv 图像处理:图像基础操作与灰度转化

timerring

OpenCV 计算机视觉 10月月更

JDK中自带的JVM分析工具

Java 架构

CLIP-as-service 0.8.0 版本发布:新增支持大型 ONNX 模型文件

Jina AI

开源 工程师 开发工具 开源软件

Redis数据结构(一)-Redis的数据存储及String类型的实现

京东科技开发者

二进制 哈希算法 数据存储 结构化 Redis 数据结构

力扣刷题训练(二)

lovevivi

数据结构 C语言 10月月更

一行命令安装docker和docker-compose(CentOS7)

程序员欣宸

Docker Docker-compose 10月月更

CLIP-as-service 0.8.0 版本发布:新增支持大型 ONNX 模型文件

Jina AI

开源 工程师 开发工具

在线问题反馈模块实战(二十一):完结篇

bug菌

springboot 项目实战 10月月更

【一Go到底】第二十五天---内置函数和Go错误机制

指剑

Go golang 10月月更

fastposter v2.9.3 简单易用的海报生成器

物有本末

海报生成器 海报编辑器 海报生成

Jenkins pipeline 如何到子文件中去执行命令

HoneyMoose

迷宫最短路径问题

lovevivi

数据结构 C语言 10月月更

1024 分享|如何打造围绕开源理念的团队工程师文化

Jina AI

人工智能 开源 1024 1024我在现场

长安链源码分析之交易过程分析(2)

长安链源码分析之交易过程分析(3)

在线问题反馈模块实战(十九):实现数据批量导出到excel文件中功能

bug菌

springboot 项目实战 10月月更

探索证券行业智能化升级核心引擎:成就客户价值

易观分析

证券

Jenkins pipeline Git 检出的 Step

HoneyMoose

用户故事地图——让迭代计划灵动起来

Bruce Talk

Scrum User Story Product Owner User Story Mapping

在线问题反馈模块实战(二十):实现文件批量导出到zip压缩包中功能

bug菌

springboot 项目实战 10月月更

长安链源码分析之交易过程分析(4)

【译】深究 Go CPU profiler

非晓为骁

Go 翻译 pprof

房产|1-9月份全国房地产开发投资下降8.0%

前嗅大数据

数据 房地产业 房地产

房产|9月全国70城房价出炉!快来看看你的城市房价变化

前嗅大数据

数据 房地产 房产

Opencv 图像处理:图像通道、直方图与色彩空间

timerring

OpenCV 图像处理 10月月更

OpenAI发布通用型ChatGPT代理,以应对Excel、PowerPoint和Chrome浏览器的挑战_AI&大模型_InfoQ精选文章