
xAI 推出 Grok 4 Fast,一款旨在提高效率和降低成本的新推理模型。与 Grok 4 相比,该模型将平均思考词元减少 40%,在同等基准性能下,成本预计降低 98%。它保持了 200 万词元的上下文窗口,并采用了统一架构,支持推理和非推理用例。此外,该模型还集成了工具使用功能,例如网络浏览和 X 搜索。
在基准测试中,Grok 4 Fast 在 GPQA、AIME 和 HMMT 等测试项目上的表现接近 Grok 4,同时优于 Grok 3 Mini。在 LMArena 搜索竞技场中,其搜索变体以 1163 的 Elo 排名第一,文本变体在类别中名列前茅。

与同类模型相比,Grok 4 Fast 在成本效益方面表现出色。在每基准点成本评估中,它比 OpenAI 的 GPT-4 Turbo 和 Anthropic 的 Claude 3 Opus 更高效,尽管在一些高端推理任务上原始准确度略低。来自 Artificial Analysis 的独立分析指出,Grok 4 Fast 的成本与智能比率在同级别模型中更具优势。在智能体浏览任务中,Grok 4 Fast 的表现也超过了 Claude 3 Haiku 和 Mistral Large。
社区的反馈主要聚焦于成本与性能之间的平衡。AI 科学家 Rudi Ranck 评论道:
我想不起来上次对一个模型如此印象深刻是什么时候了。Grok 4 Fast 以大约 25 倍更低的成本,实现了与 Gemini 2.5 Pro 相当的智能水平。
与此同时,开发者 Axel Pond 指出:
将这款产品命名为 Grok 4 Fast 而非 Grok 4 Mini,堪称神来之笔。它巧妙地将产品与自身的优势紧密相连,而非聚焦于可能的短板。
Grok 4 Fast 现在可在 grok.com 的快速和自动模式下使用,并且可以通过 xAI API 选择 grok-4-fast-reasoning 和 grok-4-fast-non-reasoning 进行调用。它目前可在 OpenRouter 和 Vercel AI Gateway 上免费试用。xAI 表示,未来更新将致力于扩展多模态和智能体功能。
原文链接:
评论