xAI 新模型 Grok 4 Fast 卷疯了！少用 40% token还能追平 Grok 4，限定范围可直接免费用

整理 | 华卫

近日，埃隆・马斯克（Elon Musk）旗下的 xAI 公司推出了一款新的 AI 模型 ——Grok 4 Fast。该模型旨在通过将非推理能力与推理能力整合到单一系统中，实现低成本与高竞争力准确性的兼顾，从而不再需要单独的框架。

据 xAI 介绍，Grok 4 Fast 思考所用的 token 数量约为 Grok 4 的 40%。尽管在性能测试中使用的 token 数量更少，但其结果却与 Grok 4 十分接近。根据 Artificial Analysis 所做的客观研究，Grok 4 Fast 在保持同等性能的前提下，运行成本可降低 98%，性价比大幅提升。

在 2025 年 AIME（美国数学邀请赛）、2025 年 HMMT（哈佛 - 麻省理工数学竞赛）以及 GPQA 钻石测试中，该模型的得分分别为 85.7%、92% 和 93.3%。此外，它在 SimpleQA 测试中得分 95%，在 X Bench Deepsearch 测试中得分 74%。这意味着 Grok 4 Fast 可应用于多种任务，包括代码执行和复杂搜索。

同时，Grok 4 Fast 拥有 200 万 token 的上下文窗口，能够处理更大规模的输入数据。其训练采用了在效率和延迟方面均达到最优的强化学习方法，且作为单一模型，可同时运行推理与非推理任务，从而降低了企业级应用与消费级应用的成本。

此前版本的 Grok 需通过不同模型来完成各类任务，而此次 Grok 4 Fast 的发布对这一问题进行了优化。借助上述技术特性，Grok 4 Fast 的部署更为便捷、易用，对企业和开发者也更友好。

xAI 证实，Grok 4 Fast 可在多个平台上使用：用户可通过 grok.com 官网应用、iOS 与 Android 客户端访问，也可连接至 OpenRouter、Vercel AI 网关及 xAI API。在 OpenRouter 和 Vercel 平台上，用户可在限定范围内免费使用该模型。

目前，Grok 4 Fast 提供两种版本：Grok-4-fast-reasoning（推理版）与 Grok-4-fast-non-reasoning（非推理版），两者均支持 200 万 token 的完整上下文窗口。定价方面，基础计费标准基于小额工作量设定，为每百万输入 token 0.20 美元，实际成本会根据 token 消耗量按比例计算。

此次 Grok 4 Fast 的推出，使其成为此前版本模型的高性价比替代方案，也为有意寻求高效 AI 解决方案的开发者与企业提供了可扩展的选择。

参考链接：

https://www.analyticsinsight.net/news/elon-musks-xai-launches-grok-4-fast-with-2m-token-limit-and-40-lower-costs

创作场景

xAI 新模型 Grok 4 Fast 卷疯了！少用 40% token 还能追平 Grok 4，限定范围可直接免费用