写点什么

xAI 新模型 Grok 4 Fast 卷疯了!少用 40% token 还能追平 Grok 4,限定范围可直接免费用  

  • 2025-09-23
    北京
  • 本文字数:926 字

    阅读完需:约 3 分钟

大小:446.39K时长:02:32
xAI 新模型 Grok 4 Fast 卷疯了!少用 40% token还能追平 Grok 4,限定范围可直接免费用   

整理 | 华卫

 

近日,埃隆・马斯克(Elon Musk)旗下的 xAI 公司推出了一款新的 AI 模型 ——Grok 4 Fast。该模型旨在通过将非推理能力与推理能力整合到单一系统中,实现低成本与高竞争力准确性的兼顾,从而不再需要单独的框架。

 

据 xAI 介绍,Grok 4 Fast 思考所用的 token 数量约为 Grok 4 的 40%。尽管在性能测试中使用的 token 数量更少,但其结果却与 Grok 4 十分接近。根据 Artificial Analysis 所做的客观研究,Grok 4 Fast 在保持同等性能的前提下,运行成本可降低 98%,性价比大幅提升。

 

在 2025 年 AIME(美国数学邀请赛)、2025 年 HMMT(哈佛 - 麻省理工数学竞赛)以及 GPQA 钻石测试中,该模型的得分分别为 85.7%、92% 和 93.3%。此外,它在 SimpleQA 测试中得分 95%,在 X Bench Deepsearch 测试中得分 74%。这意味着 Grok 4 Fast 可应用于多种任务,包括代码执行和复杂搜索。

 

同时,Grok 4 Fast 拥有 200 万 token 的上下文窗口,能够处理更大规模的输入数据。其训练采用了在效率和延迟方面均达到最优的强化学习方法,且作为单一模型,可同时运行推理与非推理任务,从而降低了企业级应用与消费级应用的成本。

 

此前版本的 Grok 需通过不同模型来完成各类任务,而此次 Grok 4 Fast 的发布对这一问题进行了优化。借助上述技术特性,Grok 4 Fast 的部署更为便捷、易用,对企业和开发者也更友好。

 

xAI 证实,Grok 4 Fast 可在多个平台上使用:用户可通过 grok.com 官网应用、iOS 与 Android 客户端访问,也可连接至 OpenRouter、Vercel AI 网关及 xAI API。在 OpenRouter 和 Vercel 平台上,用户可在限定范围内免费使用该模型。

 

目前,Grok 4 Fast 提供两种版本:Grok-4-fast-reasoning(推理版)与 Grok-4-fast-non-reasoning(非推理版),两者均支持 200 万 token 的完整上下文窗口。定价方面,基础计费标准基于小额工作量设定,为每百万输入 token 0.20 美元,实际成本会根据 token 消耗量按比例计算。

 

此次 Grok 4 Fast 的推出,使其成为此前版本模型的高性价比替代方案,也为有意寻求高效 AI 解决方案的开发者与企业提供了可扩展的选择。

 

参考链接:

https://www.analyticsinsight.net/news/elon-musks-xai-launches-grok-4-fast-with-2m-token-limit-and-40-lower-costs

2025-09-23 11:014136

评论

发布
暂无评论

捆绑销售商业环境中,SaaS初创企业面临采购行为习惯转变

B Impact

阿里云智能集团不再推进分拆,并加大投入

B Impact

WordPress 基于亚马逊云的部署实践(四)- 负载均衡+弹性伸缩

wangkx

AWS 亚马逊云 弹性伸缩 负载均衡器

探索容灾架构演进之路-从单点到异地多活

柠檬汁Code(binbin0325)

容灾 异地多活 备份 & 恢复 部署架构 同城双活

WordPress 基于亚马逊云的部署实践(三)- 服务部署

wangkx

AWS WordPress Amazon EC2 亚马逊云

OpenAI 治理结构为什么可以罢免CEO Sam Altman面临怎样管理问题

B Impact

INFINI Labs 产品更新 | 发布 Easysearch Java 客户端,Console 支持 SQL 查询等功能

极限实验室

console Gateway 客户端 easysearch 极限科技

低代码平台技术分享官 | 漫话iGIX前端设计模式

inBuilder低代码平台

前端

CnosDB有主复制演进历程

CnosDB

开源 时序数据库 CnosDB

第六期 |《实时洞察 智能运营一用友企业绩效管理白皮书》解读

用友BIP

企业绩效

Kubernetes Gateway API 攻略:解锁集群流量服务新维度!

SEAL安全

Gateway 运维‘ kubernetes 运维 企业号11月PK榜

纯CSS动态渐变文本特效

南城FE

CSS 前端 动画 css3渐变 渐变

基于 DAG 任务编排实现

Bingo

Java DAG 任务编排 规则表达式

2.5A、3MHz开关充电器解决方案

芯动大师

向量数据库—加速大模型训练推理

不叫猫先生

大模型 向量数据库

MacBook触控板窗口管理推荐 Swish免激活最新

胖墩儿不胖y

Mac软件 触控板管理工具

WordPress 基于亚马逊云的部署实践(二)- 资源申请

wangkx

Amazon EC2 亚马逊云 EFS

边缘计算平台如何助力元宇宙实现?

3DCAT实时渲染

边缘计算平台

物联专栏丨云边协同技术加速AloT能力向边缘侧快速演进

inBuilder低代码平台

物联网

xAI 新模型 Grok 4 Fast 卷疯了!少用 40% token还能追平 Grok 4,限定范围可直接免费用   _AI&大模型_华卫_InfoQ精选文章