
整理 | 华卫
近日,埃隆・马斯克(Elon Musk)旗下的 xAI 公司推出了一款新的 AI 模型 ——Grok 4 Fast。该模型旨在通过将非推理能力与推理能力整合到单一系统中,实现低成本与高竞争力准确性的兼顾,从而不再需要单独的框架。
据 xAI 介绍,Grok 4 Fast 思考所用的 token 数量约为 Grok 4 的 40%。尽管在性能测试中使用的 token 数量更少,但其结果却与 Grok 4 十分接近。根据 Artificial Analysis 所做的客观研究,Grok 4 Fast 在保持同等性能的前提下,运行成本可降低 98%,性价比大幅提升。
在 2025 年 AIME(美国数学邀请赛)、2025 年 HMMT(哈佛 - 麻省理工数学竞赛)以及 GPQA 钻石测试中,该模型的得分分别为 85.7%、92% 和 93.3%。此外,它在 SimpleQA 测试中得分 95%,在 X Bench Deepsearch 测试中得分 74%。这意味着 Grok 4 Fast 可应用于多种任务,包括代码执行和复杂搜索。
同时,Grok 4 Fast 拥有 200 万 token 的上下文窗口,能够处理更大规模的输入数据。其训练采用了在效率和延迟方面均达到最优的强化学习方法,且作为单一模型,可同时运行推理与非推理任务,从而降低了企业级应用与消费级应用的成本。
此前版本的 Grok 需通过不同模型来完成各类任务,而此次 Grok 4 Fast 的发布对这一问题进行了优化。借助上述技术特性,Grok 4 Fast 的部署更为便捷、易用,对企业和开发者也更友好。
xAI 证实,Grok 4 Fast 可在多个平台上使用:用户可通过 grok.com 官网应用、iOS 与 Android 客户端访问,也可连接至 OpenRouter、Vercel AI 网关及 xAI API。在 OpenRouter 和 Vercel 平台上,用户可在限定范围内免费使用该模型。
目前,Grok 4 Fast 提供两种版本:Grok-4-fast-reasoning(推理版)与 Grok-4-fast-non-reasoning(非推理版),两者均支持 200 万 token 的完整上下文窗口。定价方面,基础计费标准基于小额工作量设定,为每百万输入 token 0.20 美元,实际成本会根据 token 消耗量按比例计算。
此次 Grok 4 Fast 的推出,使其成为此前版本模型的高性价比替代方案,也为有意寻求高效 AI 解决方案的开发者与企业提供了可扩展的选择。
参考链接:
评论