Agentic AI、具身智能、强化学习框架、端侧大模型……来QCon上海站,感受AI的未来! 了解详情
写点什么

xAI 推出低成本推理模型 Grok 4 Fast

作者:Daniel Dominguez

  • 2025-10-03
    北京
  • 本文字数:734 字

    阅读完需:约 2 分钟

大小:359.90K时长:02:02
xAI 推出低成本推理模型 Grok 4 Fast

xAI 推出 Grok 4 Fast,一款旨在提高效率和降低成本的新推理模型。与 Grok 4 相比,该模型将平均思考词元减少 40%,在同等基准性能下,成本预计降低 98%。它保持了 200 万词元的上下文窗口,并采用了统一架构,支持推理和非推理用例。此外,该模型还集成了工具使用功能,例如网络浏览和 X 搜索。


基准测试中,Grok 4 Fast 在 GPQA、AIME 和 HMMT 等测试项目上的表现接近 Grok 4,同时优于 Grok 3 Mini。在 LMArena 搜索竞技场中,其搜索变体以 1163 的 Elo 排名第一,文本变体在类别中名列前茅。



与同类模型相比,Grok 4 Fast 在成本效益方面表现出色。在每基准点成本评估中,它比 OpenAI 的 GPT-4 Turbo 和 Anthropic 的 Claude 3 Opus 更高效,尽管在一些高端推理任务上原始准确度略低。来自 Artificial Analysis 的独立分析指出,Grok 4 Fast 的成本与智能比率在同级别模型中更具优势。在智能体浏览任务中,Grok 4 Fast 的表现也超过了 Claude 3 HaikuMistral Large


社区的反馈主要聚焦于成本与性能之间的平衡。AI 科学家 Rudi Ranck 评论道:

我想不起来上次对一个模型如此印象深刻是什么时候了。Grok 4 Fast 以大约 25 倍更低的成本,实现了与 Gemini 2.5 Pro 相当的智能水平。


与此同时,开发者 Axel Pond 指出:

将这款产品命名为 Grok 4 Fast 而非 Grok 4 Mini,堪称神来之笔。它巧妙地将产品与自身的优势紧密相连,而非聚焦于可能的短板。


Grok 4 Fast 现在可在 grok.com 的快速和自动模式下使用,并且可以通过 xAI API 选择 grok-4-fast-reasoning 和 grok-4-fast-non-reasoning 进行调用。它目前可在 OpenRouterVercel AI Gateway 上免费试用。xAI 表示,未来更新将致力于扩展多模态和智能体功能。


原文链接

https://www.infoq.com/news/2025/09/xai-grok4-fast/

2025-10-03 22:043

评论

发布
暂无评论

2021 年 6 个GitHub推荐前端项目

devpoint

vite nextjs tauri 1月月更 Tailwind

高效时代,是时候过渡到自动化测试了

飞算JavaAI开发助手

DevOps 软件开发 自动测试

深入分析JUC之Lock接口

编程江湖

lock锁

深入解析Apache Pulsar系列: Broker消息确认的管理

博文视点Broadview

netty系列之:不用怀疑,netty中的ByteBuf就是比JAVA中的好用

程序那些事

Netty nio 程序那些事 1月日更

MySQL性能优化:SQL慢查询优化,索引优化,表优化

Ayue、

MySQL 1月月更

Flink,Spark,Storm,Hadoop框架比较

@零度

flink hadoop spark Storm 大数据开发

复盘和反思一个被全公司邮件通报的漏测

LynnYang

测试 Postman Mock

云效产品篇:开启敏捷需求管理 |云效快速入门

阿里云云效

阿里云 DevOps 云原生 需求管理 云效

利用物联网技术加速数字化转型

龙智—DevSecOps解决方案

60岁代码匠的几篇小作文,解决了大多数程序的迷茫(上)

图灵社区

java 编程

编程进阶之路,虽无捷径但有长短

程序人生

2022年,你还要做开源软件么?

亚马逊云科技 (Amazon Web Services)

计算

龙智搬迁公告

龙智—DevSecOps解决方案

搬迁

云图说|图解DGC:基于华为智能数据湖解决方案的一体化数据治理平台

华为云开发者联盟

大数据 数据湖 数据治理 数据服务 数据湖治理中心

AJAX工作原理及其优缺点

编程江湖

1月月更|推荐学java——Spring第一课

逆锋起笔

spring SSM框架 Spring MVC Spring Java Spring项目

打造智能全场景,《HarmonyOS Connect系列课》7大BUFF为您助力!

HarmonyOS开发者

Bruce Eckel教你如何爬出 Gradle 的“坑”?

图灵社区

java 编程

当类的泛型相关时,如何在两个泛型类之间创建类似子类型的关系

阿Q说代码

Java泛型 1月月更 子类型

hi 龙蜥小二来了 ,一键@为你答疑解惑

OpenAnolis小助手

Linux 服务

crontab介绍安装及每秒运行

Owen Zhang

Linux crontab

用户文章转载:Windows用户都来看看,这个锅P4不背

龙智—DevSecOps解决方案

perforce P4

几行代码,把zip文件直接破解

你?

全面提升体系化数据管理能力 | OceanBase 发布全新3.X工具家族

OceanBase 数据库

数据库 开源 开发者 OceanBase 社区版 产品发布

Apache Kylin PMC 马洪宾:开源,就是一场“螺旋上升”的旅程

腾源会

vivo 推送平台架构演进

vivo互联网技术

分布式 架构设计 消息推送 平台搭建、

热烈庆祝龙智高级咨询顾问叶燕秀获得“Atlassian认证专家”称号

龙智—DevSecOps解决方案

Atlassian认证专家 Atlassian认证

都2022年了,你的前端工具集应该有vueuse

华为云开发者联盟

Vue 前端 API 工具集 vueuse

Flink是如何支持批流一体的

编程江湖

flink

java开发之Redis数据结构

@零度

redis JAVA开发

xAI 推出低成本推理模型 Grok 4 Fast_AI&大模型_InfoQ精选文章