xAI 发布了Grok Skills,并增强了面向 Grok 4.3 的 Responses API,让模型能够在 Web 平台、iOS 应用和 Android 应用中的所有对话里持续保留自定义的能力。用户可通过自然语言描述或文件上传一次性创建这些 Skills,之后 Grok 会在后续会话中自动应用已定义的工作流、偏好和文档处理流程,无需重复下达指令。
内置能力覆盖完整的文档与内容处理场景,包括可保留标题、表格和样式的 Word 文档的生成与编辑,视觉层级和演讲者备注的 PowerPoint 风格演示文稿的创建,支持公式、数据分析、图表和条件格式的 Excel 电子表格处理,以及 PDF 创建、合并、拆分、文本提取和内容重组操作。这些 Skills 在账号级别生效,通过斜杠命令调用时会优先于默认行为,并支持用户间共享以便协作使用。
在开发者方面,Responses API通过工具调用集成了上述概念:一方面遵循与 OpenAI 兼容的格式,另一方面为内置工具提供了原生服务端执行的能力。开发者可在 API 请求中通过类型声明要引入工具,例如,web_search、x_search或code_interpreter,由 xAI 基础设施自动处理;也可基于描述名称、说明和参数的 JSON Schema 创建自定义函数。当 Grok 4.3 判断需要调用工具时,会返回结构化的tool_call对象,其中包含调用标识和参数。客户端应用随后在本地执行逻辑,把结果作为工具输出附加到下一次请求,并继续对话循环。该模型默认支持并行工具调用,单次请求最多支持 128 个工具,具备 100 万 token 的上下文窗口,并可输出适用于多步骤 Agentic 任务的结果。在聊天界面创建的自定义 Skills 也可用来补充 API 流程,开发人员可以将这些指令合并到他们的系统提示或状态管理中。。
在X上的社区讨论呈现出兴奋与早期试用并存的态势,用户普遍强调其在工作流中的实际价值。
软件开发者Tiago Rama发文称:
在其他 AI 工具中,自定义 Skills/工作流自动化正在成为默认能力,所以 Grok 确实需要在这方面跟上节奏。
与此同时,开发者William Wallace分享了一个连接 GitHub 的 Grok Skill 示例,并表示:
我已经启用 Grok 连接我的 Github 账号进行读取和提交。我添加了这个 context.md 文件,用来在多轮开发对话中维护上下文。
与OpenAI Skills、Claude Skills以及 Vercel Agent Skills等类似方案相比,Grok Skills更像是可复用的工作流与能力层,而非可完整部署的自治智能体系统。Vercel Skills 侧重以可组合能力扩展开发者和 Web 应用的工作流,OpenAI 与 Anthropic 当前则更聚焦于更广义的 Agent 生态、工具调用以及长上下文协作模型。Grok Skills 的差异化在于与 X 平台的紧密集成,将可复用指令、搜索、多模态能力和社交上下文结合为轻量级的平台原生工作流。
查看英文原文:xAI Releases Grok Skills and Updates Tool Calling Responses API





