xAI发布Grok Skills并更新用于工具调用的Responses API

xAI 发布了Grok Skills，并增强了面向 Grok 4.3 的 Responses API，让模型能够在 Web 平台、iOS 应用和 Android 应用中的所有对话里持续保留自定义的能力。用户可通过自然语言描述或文件上传一次性创建这些 Skills，之后 Grok 会在后续会话中自动应用已定义的工作流、偏好和文档处理流程，无需重复下达指令。

内置能力覆盖完整的文档与内容处理场景，包括可保留标题、表格和样式的 Word 文档的生成与编辑，视觉层级和演讲者备注的 PowerPoint 风格演示文稿的创建，支持公式、数据分析、图表和条件格式的 Excel 电子表格处理，以及 PDF 创建、合并、拆分、文本提取和内容重组操作。这些 Skills 在账号级别生效，通过斜杠命令调用时会优先于默认行为，并支持用户间共享以便协作使用。

在开发者方面，Responses API通过工具调用集成了上述概念：一方面遵循与 OpenAI 兼容的格式，另一方面为内置工具提供了原生服务端执行的能力。开发者可在 API 请求中通过类型声明要引入工具，例如，web_search、x_search或code_interpreter，由 xAI 基础设施自动处理；也可基于描述名称、说明和参数的 JSON Schema 创建自定义函数。当 Grok 4.3 判断需要调用工具时，会返回结构化的tool_call对象，其中包含调用标识和参数。客户端应用随后在本地执行逻辑，把结果作为工具输出附加到下一次请求，并继续对话循环。该模型默认支持并行工具调用，单次请求最多支持 128 个工具，具备 100 万 token 的上下文窗口，并可输出适用于多步骤 Agentic 任务的结果。在聊天界面创建的自定义 Skills 也可用来补充 API 流程，开发人员可以将这些指令合并到他们的系统提示或状态管理中。。

在X上的社区讨论呈现出兴奋与早期试用并存的态势，用户普遍强调其在工作流中的实际价值。

软件开发者Tiago Rama发文称：

在其他 AI 工具中，自定义 Skills/工作流自动化正在成为默认能力，所以 Grok 确实需要在这方面跟上节奏。

与此同时，开发者William Wallace分享了一个连接 GitHub 的 Grok Skill 示例，并表示：

我已经启用 Grok 连接我的 Github 账号进行读取和提交。我添加了这个 context.md 文件，用来在多轮开发对话中维护上下文。

与OpenAI Skills、Claude Skills以及 Vercel Agent Skills等类似方案相比，Grok Skills更像是可复用的工作流与能力层，而非可完整部署的自治智能体系统。Vercel Skills 侧重以可组合能力扩展开发者和 Web 应用的工作流，OpenAI 与 Anthropic 当前则更聚焦于更广义的 Agent 生态、工具调用以及长上下文协作模型。Grok Skills 的差异化在于与 X 平台的紧密集成，将可复用指令、搜索、多模态能力和社交上下文结合为轻量级的平台原生工作流。

查看英文原文：xAI Releases Grok Skills and Updates Tool Calling Responses API

创作场景

xAI 发布 Grok Skills 并更新用于工具调用的 Responses API