马斯克 xAI 再出手，对标 OpenAI 和 Anthropic！Grok Code Fast 1 押注速度与工具集成_AI&大模型_InfoQ精选文章



 写点什么

登录/注册



大小：499.97K时长：02:50

马斯克 xAI 再出手，对标 OpenAI 和 Anthropic！Grok Code Fast 1 押注速度与工具集成

xAI 正式发布 grok-code-fast-1，这是一款专为代理式编程（agentic coding）工作流打造的新模型。其架构自底层重新设计，预训练数据集以编程相关资料为主，后训练集则来自真实的 pull requests 与实际开发任务。

该模型针对开发工具的使用进行了优化，涵盖 grep 命令、终端操作、文件编辑等，能够与开发环境和 IDE 顺畅集成。同时，它引入了高效的推理与提示缓存技术，据称在合作伙伴的工作流中，缓存命中率超过 90%。

在编程语言支持方面，Grok Code Fast 1 可覆盖 TypeScript、Python、Java、Rust、C++、Go 等，能够应对开发者的日常任务——从项目搭建、代码库查询，到精准修复 bug，几乎无需过多人工干预。

性能评测显示，在 SWE-Bench-Verified 基准测试中，该模型在 xAI 内部评估体系下取得 70.8% 的成绩。除了基准测试，xAI 还通过人工评估与自动化测试不断迭代开发，重点关注模型在真实场景中的可用性。

为了支持快速交互，模型配备了 256k Tokens 的上下文窗口，能够处理更大规模的代码库。其内部采用混合专家架构（MOE，mixture-of-experts），参数量约 3140 亿，在保证速度的同时强化编程能力。在实际使用中，生成速率约为每秒 92 Tokens，足以满足开发过程中的互动节奏。

与其他面向编程的大语言模型相比，grok-code-fast-1 的核心优势并非极致的基准精度，而是速度与工具集成。例如，OpenAI 的 o1-mini 与 Anthropic 的 Claude Sonnet 3.5 在部分任务上展现出更高的推理或代码准确率，但在提示缓存优化或吞吐效率上并未达到同样水平。其混合专家设计在架构上更接近 Google DeepMind 的 Gemini 1.5 Pro，但更专注于软件开发场景的适配。

在社区反响方面，开发者普遍关注 Grok Code Fast 1 的执行速度。软件工程师 Eric Jiang 表示：

“过去几周我每天都在使用这个模型，它的速度让我的工作效率提升巨大，真是太好用了！”

也有评论聚焦在具体使用场景和易用性上，讨论该模型在日常开发中的角色，以及与编辑器、命令行工具的集成问题。开发者 Jonathan Parra 提到：

“很不错，我早就期待这样的工具了，不过要有个 CLI 才能和 Claude Code 竞争。”

目前，grok-code-fast-1 可通过部分合作伙伴免费体验一段时间，其中包括 GitHub Copilot、Cursor、Cline、Roo Code、Kilo Code、opencode和 Windsurf。xAI 表示将以高频率迭代更新模型，并透露正在训练的新版本将支持多模态输入、并行工具调用和更长的上下文窗口。

原文链接：

https://www.infoq.com/news/2025/09/xai-grok-fast1/

评论

发布

暂无评论

面试官：4年经验没碰过Nginx? Nginx入门，图文超详细

一文读懂Plato Farm的ePLATO，以及其高溢价缘由

一篇文章带你走进pycharm的世界----别再问我pycharm的安装和环境配置了！！！

Python 后端 pycharm 编译器环境

Java之路必读与知识点分析

leetcode 452. Minimum Number of Arrows to Burst Balloons 用最少数量的箭引爆气球(中等)

LeetCode 数据结构与算法贪心算法

如何让个性化推荐即刻触达？云原生数据库GaussDB(for Redis)来助力

华为云开发者联盟

数据库云原生后端

深度 | 自动驾驶数据服务进入2.0时代

人工智能自动驾驶计算机视觉智能驾驶激光雷达

java零基础入门-如何统计字符串中每个字符的出现次数？

Java 7月月更

mysql 最大建议行数2000w,靠谱吗？

京东科技开发者

MySQL 数据库

一篇搞定Redis中的BigKey问题

redis 底层原理 7月月更签约计划第三季

你的列表很卡？这4个优化能让你的列表丝般顺滑

flutter ios 前端安卓签约计划第三季

怎样实现文档协同？

知识管理系统推动企业信息化发展

小程序容器技术超有料，可以让移动研发效率大幅提升

跨端开发降本增效研发效率小程序容器

数据管理的重点

奔向架构师

数据管理 7月月更

AIRIOT答疑第6期|如何使用二次开发引擎？

二次开发物联网低代码平台

8000字讲透OBSA原理与应用实践

华为云开发者联盟

后端 OBS 运价计算 OBSA

【图解】三次握手，四次挥手 —— 用心看这一篇就够了

攻城狮杰森

计算机网络 TCP/IP 数据传输 7月月更

如何实现一个好的知识管理系统？

Starfish Os X MetaBell战略合作，元宇宙商业生态更进一步

一文读懂Plato Farm的ePLATO，以及其高溢价缘由

BlockChain先知

HarmonyOS 3纯净模式可限制华为应用市场检出的风险应用获取个人数据

融云 IM & RTC 能力上新盘点

融云 RongCloud

【Meetup预告】OpenMLDB＋OneFlow：链接特征工程到模型训练，加速机器学习模型开发

第四范式开发者社区

人工智能机器学习数据库 AI 特征平台

小程序助力智能家居生态平台

一篇文章读懂人工神经网络

人工智能神经网络算法 ann

Starfish Os X MetaBell战略合作，元宇宙商业生态更进一步

如何查看蓝牙耳机的蓝牙版本

建筑云渲染的应用正在扩大，越来越多的行业急需可视化服务

云渲染 GPU渲染

一种比读写锁更快的锁，还不赶紧认识一下

华为云开发者联盟

高并发开发 ReadWriteLock StampedLock

React Context

程序员海军