写点什么

马斯克 xAI 再出手,对标 OpenAI 和 Anthropic!Grok Code Fast 1 押注速度与工具集成

作者:Daniel Dominguez

  • 2025-09-08
    北京
  • 本文字数:1022 字

    阅读完需:约 3 分钟

大小:499.97K时长:02:50
马斯克 xAI 再出手,对标 OpenAI 和 Anthropic!Grok Code Fast 1 押注速度与工具集成

xAI 正式发布 grok-code-fast-1,这是一款专为代理式编程(agentic coding)工作流打造的新模型。其架构自底层重新设计,预训练数据集以编程相关资料为主,后训练集则来自真实的 pull requests 与实际开发任务。


该模型针对开发工具的使用进行了优化,涵盖 grep 命令、终端操作、文件编辑等,能够与开发环境和 IDE 顺畅集成。同时,它引入了高效的推理与提示缓存技术,据称在合作伙伴的工作流中,缓存命中率超过 90%。


在编程语言支持方面,Grok Code Fast 1 可覆盖 TypeScript、Python、Java、Rust、C++、Go 等,能够应对开发者的日常任务——从项目搭建、代码库查询,到精准修复 bug,几乎无需过多人工干预。


性能评测显示,在 SWE-Bench-Verified 基准测试中,该模型在 xAI 内部评估体系下取得 70.8% 的成绩。除了基准测试,xAI 还通过人工评估与自动化测试不断迭代开发,重点关注模型在真实场景中的可用性。


为了支持快速交互,模型配备了 256k Tokens 的上下文窗口,能够处理更大规模的代码库。其内部采用 混合专家架构(MOE,mixture-of-experts),参数量约 3140 亿,在保证速度的同时强化编程能力。在实际使用中,生成速率约为每秒 92 Tokens,足以满足开发过程中的互动节奏。


与其他面向编程的大语言模型相比,grok-code-fast-1 的核心优势并非极致的基准精度,而是速度与工具集成。例如,OpenAI 的 o1-mini 与 Anthropic 的 Claude Sonnet 3.5 在部分任务上展现出更高的推理或代码准确率,但在提示缓存优化或吞吐效率上并未达到同样水平。其混合专家设计在架构上更接近 Google DeepMind 的 Gemini 1.5 Pro,但更专注于软件开发场景的适配。



在社区反响方面,开发者普遍关注 Grok Code Fast 1 的执行速度。软件工程师 Eric Jiang 表示:

“过去几周我每天都在使用这个模型,它的速度让我的工作效率提升巨大,真是太好用了!”


也有评论聚焦在具体使用场景和易用性上,讨论该模型在日常开发中的角色,以及与编辑器、命令行工具的集成问题。开发者 Jonathan Parra 提到:

“很不错,我早就期待这样的工具了,不过要有个 CLI 才能和 Claude Code 竞争。”


目前,grok-code-fast-1 可通过部分合作伙伴免费体验一段时间,其中包括 GitHub CopilotCursorClineRoo CodeKilo Codeopencode和 Windsurf。xAI 表示将以高频率迭代更新模型,并透露正在训练的新版本将支持多模态输入、并行工具调用和更长的上下文窗口。


原文链接:

https://www.infoq.com/news/2025/09/xai-grok-fast1/

2025-09-08 17:004336

评论

发布
暂无评论

面试官:4年经验没碰过Nginx? Nginx入门,图文超详细

LoneWalker、

nginx

一文读懂Plato Farm的ePLATO,以及其高溢价缘由

西柚子

一篇文章带你走进pycharm的世界----别再问我pycharm的安装和环境配置了!!!

是Dream呀

Python 后端 pycharm 编译器 环境

Java之路必读与知识点分析

魏铁锤

leetcode 452. Minimum Number of Arrows to Burst Balloons 用最少数量的箭引爆气球(中等)

okokabcd

LeetCode 数据结构与算法 贪心算法

如何让个性化推荐即刻触达?云原生数据库GaussDB(for Redis)来助力

华为云开发者联盟

数据库 云原生 后端

深度 | 自动驾驶数据服务进入2.0时代

澳鹏Appen

人工智能 自动驾驶 计算机视觉 智能驾驶 激光雷达

java零基础入门-如何统计字符串中每个字符的出现次数?

喵手

Java 7月月更

mysql 最大建议行数2000w,靠谱吗?

京东科技开发者

MySQL 数据库

一篇搞定Redis中的BigKey问题

知识浅谈

redis 底层原理 7月月更 签约计划第三季

你的列表很卡?这4个优化能让你的列表丝般顺滑

岛上码农

flutter ios 前端 安卓 签约计划第三季

怎样实现文档协同?

Baklib

知识管理系统推动企业信息化发展

Baklib

小程序容器技术超有料,可以让移动研发效率大幅提升

Speedoooo

跨端开发 降本增效 研发效率 小程序容器

数据管理的重点

奔向架构师

数据管理 7月月更

AIRIOT答疑第6期|如何使用二次开发引擎?

AIRIOT

二次开发 物联网低代码平台

8000字讲透OBSA原理与应用实践

华为云开发者联盟

后端 OBS 运价计算 OBSA

【图解】三次握手,四次挥手 —— 用心看这一篇就够了

攻城狮杰森

计算机网络 TCP/IP 数据传输 7月月更

如何实现一个好的知识管理系统?

Geek_da0866

Starfish Os X MetaBell战略合作,元宇宙商业生态更进一步

小哈区块

一文读懂Plato Farm的ePLATO,以及其高溢价缘由

BlockChain先知

HarmonyOS 3纯净模式可限制华为应用市场检出的风险应用获取个人数据

科技汇

融云 IM & RTC 能力上新盘点

融云 RongCloud

【Meetup预告】OpenMLDB+OneFlow:链接特征工程到模型训练,加速机器学习模型开发

第四范式开发者社区

人工智能 机器学习 数据库 AI 特征平台

小程序助力智能家居生态平台

Geek_99967b

物联网,

一篇文章读懂人工神经网络

天狼

人工智能 神经网络 算法 ann

Starfish Os X MetaBell战略合作,元宇宙商业生态更进一步

西柚子

如何查看蓝牙耳机的蓝牙版本

贾献华

7月月更

建筑云渲染的应用正在扩大,越来越多的行业急需可视化服务

Finovy Cloud

云渲染 GPU渲染

一种比读写锁更快的锁,还不赶紧认识一下

华为云开发者联盟

高并发 开发 ReadWriteLock StampedLock

React Context

程序员海军

7月月更

马斯克 xAI 再出手,对标 OpenAI 和 Anthropic!Grok Code Fast 1 押注速度与工具集成_AI&大模型_InfoQ精选文章