写点什么

OpenAI 扩展 Responses API,为自主智能体提供基础设施

  • 2026-03-30
    北京
  • 本文字数:1106 字

    阅读完需:约 4 分钟

OpenAI 宣布扩展Responses API,进一步降低开发者构建智能体工作流的门槛,新增的支持包括 Shell 工具、内置智能体执行循环、托管的容器工作空间、上下文压缩以及可复用的智能体 skill。

 

OpenAI 表示,借助这些全新的能力,使用 Responses API 的开发者无需自行搭建执行环境,即可安全、可靠地完成各类实际任务。开发者可以直接依赖官方内置的基础设施,解决所有智能体开发都会遇到的共性难题,比如管理中间文件、优化提示词占用、保障网络访问安全性,以及处理超时与重试逻辑。

 

这套新设计的核心是智能体执行循环。模型不会直接输出最终答案,而是先“提议”下一步的动作,例如,运行命令、查询数据或联网拉取内容。动作会在受控环境中执行,执行结果会再回传给模型。该循环会不断迭代,直到任务全部完成为止。

 

执行循环可以调用全新的 Shell 工具,通过命令行与计算机交互,可直接使用 grep、curl、awk 等常用 Unix 工具及其他程序完成各类操作。

对比原来仅支持 Python 运行的代码解释器,Shell 工具覆盖的场景更广,它可以运行 Go、Java 程序,也能启动 Node.js 服务。这种灵活性让模型能够胜任更复杂的智能体任务。

 

需要注意的是,模型仅能提议调用工具,无法自行执行工具。

 

除 Shell 工具外,OpenAI 还内置了容器化的执行环境,该环境可以存放文件与数据库,网络访问通过策略管控实现了安全隔离。这套能力可以大幅减少开发者需要把全部内容塞进提示上下文的做法。模型可通过 Shell 读取解析文件、仅向数据库查询所需数据行、直接联网拉取所需的内容。

 

为了让网络更加安全,所有外网流量都统一经过中心化的策略层,执行白名单与访问控制,并确保全程可观测。凭证不会存放在容器内,模型只能看到占位符,真实密钥在外层完成替换,对模型完全不可见。

 

新版 Responses API 还引入了 skills 的概念,用来以更简单的方式定义复杂、可复用的任务,只需按照预设的模式批量执行 Shell 命令即可。

智能体skills将固定流程打包为可复用、可组合的基础组件。具体来说,skill 是一个文件夹包的结构,其中包括 SKILL.md(包含了元数据与指南)以及配套的资源,例如,API 规范、UI 资源文件等。

 

同时,新版 API 解决了长任务上下文超限的难题。系统内置了上下文压缩的能力,也就是将历史步骤精简压缩、保留关键信息,它的机制与Codex类似。这样,能够让智能体可以长期多轮执行,而不会触发 Token 上限。

 

按照 OpenAI 的说法,通过整合 Responses API 的编排能力、Shell 工具、容器运行环境、技能体系与上下文压缩,开发者仅需一条提示词,即可构建能够执行长周期复杂任务的智能体。关于它的完整细节,可查阅官方的原始公告。

 

查看英文原文: OpenAI Extends the Responses API to Serve as a Foundation for Autonomous Agents