2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

xAI 推出低成本推理模型 Grok 4 Fast

作者:Daniel Dominguez

  • 2025-10-03
    北京
  • 本文字数:734 字

    阅读完需:约 2 分钟

大小:359.90K时长:02:02
xAI 推出低成本推理模型 Grok 4 Fast

xAI 推出 Grok 4 Fast,一款旨在提高效率和降低成本的新推理模型。与 Grok 4 相比,该模型将平均思考词元减少 40%,在同等基准性能下,成本预计降低 98%。它保持了 200 万词元的上下文窗口,并采用了统一架构,支持推理和非推理用例。此外,该模型还集成了工具使用功能,例如网络浏览和 X 搜索。


基准测试中,Grok 4 Fast 在 GPQA、AIME 和 HMMT 等测试项目上的表现接近 Grok 4,同时优于 Grok 3 Mini。在 LMArena 搜索竞技场中,其搜索变体以 1163 的 Elo 排名第一,文本变体在类别中名列前茅。



与同类模型相比,Grok 4 Fast 在成本效益方面表现出色。在每基准点成本评估中,它比 OpenAI 的 GPT-4 Turbo 和 Anthropic 的 Claude 3 Opus 更高效,尽管在一些高端推理任务上原始准确度略低。来自 Artificial Analysis 的独立分析指出,Grok 4 Fast 的成本与智能比率在同级别模型中更具优势。在智能体浏览任务中,Grok 4 Fast 的表现也超过了 Claude 3 HaikuMistral Large


社区的反馈主要聚焦于成本与性能之间的平衡。AI 科学家 Rudi Ranck 评论道:

我想不起来上次对一个模型如此印象深刻是什么时候了。Grok 4 Fast 以大约 25 倍更低的成本,实现了与 Gemini 2.5 Pro 相当的智能水平。


与此同时,开发者 Axel Pond 指出:

将这款产品命名为 Grok 4 Fast 而非 Grok 4 Mini,堪称神来之笔。它巧妙地将产品与自身的优势紧密相连,而非聚焦于可能的短板。


Grok 4 Fast 现在可在 grok.com 的快速和自动模式下使用,并且可以通过 xAI API 选择 grok-4-fast-reasoning 和 grok-4-fast-non-reasoning 进行调用。它目前可在 OpenRouterVercel AI Gateway 上免费试用。xAI 表示,未来更新将致力于扩展多模态和智能体功能。


原文链接

https://www.infoq.com/news/2025/09/xai-grok4-fast/

2025-10-03 22:0410015

评论

发布
暂无评论

Milvus 编译环境演进

Zilliz

c++ Python Milvus cmake 编译环境

一文彻底搞懂前端缓存机制

hellocoder2029

JavaScript

安全规范建设指北

I

安全架构 策略 安全规范

跟着卷卷龙一起学Camera--噪声与去噪02

卷卷龙

ISP camera 11月月更

5 步!用阿里云 Serverless 搭建高质量的图片压缩工具

阿里巴巴云原生

阿里云 Serverless 云原生

极客时间运维进阶训练营第四周作业

好吃不贵

Java Web(十二)Vue&Element

浅辄

Vue javaWeb 11月月更

架构实战训练营模块 5 作业

Geek_b35d92

微博评论 微博

深入剖析nodejs中间件

coder2028

node.js

融云全球社交泛娱乐洞察,「视频社交」为什么好赚钱,难出圈?

融云 RongCloud

视频社交

安全左移移了么

I

安全架构 安全左移

架构--模块5

李某人

架构训练营 #架构训练营

用javascript分类刷leetcode3.动态规划(图文视频讲解)

Geek_07a724

JavaScript LeetCode

复杂组合逻辑电路

芯动大师

Verilog 11月月更 74LS138 译码器

移动应用的手动测试策略

FunTester

自助客户服务页面|从To B产品流量获取到客户服务体验上升

Baklib

深入nodejs的event-loop

coder2028

node.js

一比一手写迷你版vue,彻底搞懂vue运行机制

hellocoder2029

现代化安全产品

I

安全产品设计 安全架构

OpenI启智社区2022年度优秀项目及开发者申报通知

OpenI启智社区

开源社区 优秀项目 优秀开发者 OpenI启智社区

豆瓣评分9.8!阿里内部的分布式架构手册让多少人突破了瓶颈?

程序知音

Java 分布式 java架构 java架构师 后端技术

一文读懂Js中的this指向

hellocoder2029

JavaScript

5 分钟教你搭建「视频动作分类」系统

Zilliz

人工智能 计算机视觉 Towhee 视频动作分类

pytorch实现空洞卷积+残差网络实验(torch实现

Studying_swz

深度学习 11月月更

跟着卷卷龙一起学Camera--噪声与去噪04

卷卷龙

ISP camera 11月月更

JavaScript刷LeetCode拿offer-位运算

Geek_07a724

JavaScript LeetCode

前端leetcde算法面试套路之双指针

js2030code

JavaScript LeetCode

跟着卷卷龙一起学Camera--噪声与去噪03

卷卷龙

ISP camera 11月月更

「推荐收藏」提高组件库Level必做好这六件事

GFE

前端 组件库

深入理解Node.js的进程与子进程

coder2028

node.js

xAI 推出低成本推理模型 Grok 4 Fast_AI&大模型_InfoQ精选文章