时隔16年Jeff Barr重返10.23-25 QCon上海站,带你看透AI如何重塑软件开发! 了解详情
写点什么

开源即爆红,代码能力碾压 Claude:Gemini CLI 背后这套方法,谷歌憋了一年

  • 2025-07-01
    北京
  • 本文字数:3475 字

    阅读完需:约 11 分钟

大小:1.60M时长:09:20
开源即爆红,代码能力碾压 Claude:Gemini CLI 背后这套方法,谷歌憋了一年

今天,谷歌正式发布了 Gemini CLI ,这是其 AI 助手在终端环境下的一个版本。这款工具的亮点在于其非常慷慨的免费使用配额:它支持每分钟 60 次、每天 1,000 次的模型调用。

 

免费配额“开挂”,逼疯 Claude?

 

继 2 月的 Claude Code 和 4 月的 OpenAI Codex CLI 之后,谷歌也在 6 月推出了 Gemini CLI。至此,三大 AI 实验室都已发布了各自的“终端智能体”工具——这类 CLI 工具可以读取、修改文件,并在终端中代表用户执行命令。

 

估计不少人原本以为这类终端工具会一直是一个小众方向,但现在看来这是低估了它的潜力——不少开发者每月在 Claude Code 上的花费高达数百美元甚至是数千美元,说明这个“小众市场”其实比预想中大得多、也重要得多。

 

相对 Claude Code,谷歌在价格方面可谓“豪横”:

使用个人 Google 账号登录,即可免费获得 Gemini Code Assist 许可。这将解锁 Gemini 2.5 Pro 模型和百万 token 上下文窗口。在此次预览期间,谷歌提供业界最宽松的调用配额:每分钟最多 60 次、每天最多 1000 次请求,全部免费。

 


目前来看,社区对 Gemini CLI 的关注重点集中在其超大免费配额上。评论者直言:“太夸张了,这会给 Anthropic 带来巨大压力。”“确实如此——如果这些调用限制是真的而且免费,那终于有真正的竞争了。”

 


与 Claude Code 不同,Gemini CLI 和 OpenAI Codex CLI 一样是开源的(使用 Apache 2.0 许可)。并且 Gemini CLI 在不到一天的时间里,获得了 15.1k 星。

 


Gemini CLI 提供的功能包括代码编写、问题调试、项目管理、文档查询以及代码解释。它还连接了 MCP(模型上下文协议)服务器,具备 Agentic AI 能力。

 

CLI 工具的优势在于,它可以与任何编辑器或 IDE 搭配使用,而不局限于特定插件支持的工具;同时还支持多实例并发运行。部分开发者也认为,命令行交互效率更高。


Gemini CLI 支持 Mac、Linux(包括 ChromeOS)和 Windows 平台。与 Claude Code 或 Codex 不同的是,Windows 上为原生实现,无需依赖 Windows 子系统(WSL)。开发者可以通过在项目根目录添加一个名为 gemini.md 的文本文件来自定义上下文和参数。谷歌高级工程师 Tayor Mullen 表示,当 CLI 检测到“值得长期保存的细节”时,也会自动将其写入该文件。

 

因为整体开源,所以我们还可以看到它的 system prompt。

 


一如既往,这份系统提示词不仅定义了工具行为,也是一份非常精炼准确的使用文档。比如它对代码注释的原则是:

注释: 请谨慎添加注释,重点说明“为什么”要这么做,尤其是处理复杂逻辑时,而不是解释“做了什么”。只有在确实能提升可读性或用户明确要求时,才添加高价值注释。请勿修改与你更改无关的注释,也绝不要通过注释与用户交流或说明你的更改。

 

系统默认使用的技术栈也颇有参考价值。

 

如果用户没有指定技术偏好,默认建议如下:

  • Web 前端: React(JavaScript/TypeScript)+ Bootstrap CSS,结合 Material Design 设计规范;

  • 后端 API: Node.js + Express.js 或 Python + FastAPI;

  • 全栈应用: Next.js(React/Node.js)+ Bootstrap + Material Design,或 Python(Django/Flask)+ React/Vue.js 前端;

  • 命令行工具(CLI): Python 或 Go;

  • 移动 App: Compose Multiplatform(Kotlin)或 Flutter(Dart),用于跨平台开发;也支持 Jetpack Compose(Android)或 SwiftUI(iOS)原生开发;

  • 3D 游戏: HTML/CSS/JavaScript + Three.js;

  • 2D 游戏: HTML/CSS/JavaScript。

 

胜过专用,Gemini CLI 靠什么?

 

Gemini CLI 接入的是谷歌最先进的编码与推理模型 Gemini 2.5 Pro,具备代码理解、文件操作、命令执行和动态故障排查等能力,全面提升命令行的使用体验。用户可以通过自然语言编写代码、调试问题,并优化工作流程。

 

不仅如此,Gemini CLI 还能基于 MCP 调用其他谷歌服务,在终端中生成图像或视频,实现从编码到创作的一体化体验。

 

在发布会上展示的一体化演示和背后的技术理念,其实揭示了 Gemini CLI 的关键定位——它不仅是一个写代码的工具,而是一个连接多模态智能、打通编码与创作的“终端智能体”。这一理念也体现在背后所依赖的 Gemini 2.5 Pro 模型选择上。

 

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    值得注意的是,Gemini 2.5 Pro 本身并不是为代码任务特别训练的“代码专用模型”,而是一个覆盖更广泛能力边界的通用模型。那么,为何谷歌没有像某些竞争对手那样,专门为 Gemini CLI 打造一个定制化的代码模型?在一场深度访谈中,产品负责人 Connie Fan 和研究负责人 Danny Tarlow 分享了他们的思考。

     

    Connie Fan 表示,虽然特定任务确实可以从专用模型中受益,例如 Cursor 训练的代码补全模型“在非常窄的用例里做得非常好”,但她强调,对于大多数现实世界中的开发任务而言,编码需求往往不局限于代码本身。

     

    例如她提到的一个经典“vibe check”请求:“帮我做一个泰勒·斯威夫特歌曲排行榜 app”——这就需要模型不仅懂代码,还要理解上下文、具备常识,甚至有些 UI/UX 审美。“这些常识背后其实是用户真实的编程需求”,她总结说,“大多数通用任务,并不能从一个纯代码模型中受益。”

     

    Danny Tarlow 则进一步指出:“代码专用模型到底意味着什么?‘代码’已经不仅仅是代码本身,它涵盖了软件开发过程中的各种环节,涉及多种信息源,有些专属于代码,有些则不是。如果只强化代码能力而削弱其他能力,反而会限制模型的表现。我们更倾向于通用模型上的协同发展,寻求不同能力之间的融合和平衡,打造一个‘通才型’模型,这才是更优的发展路径。”

     

    实际上,现在已经有越来越多开发者开始注意到 Gemini 2.5 Pro 在代码生成和理解方面的显著提升。在 Claude 长期占据主导的讨论氛围中,不少人也开始发出“Gemini 要逆袭了吗?”、“Google 要翻盘了吗?”的声音。

     

    社交媒体上,有用户分享了一些开发体验:在一个约 50 万行代码规模的项目中,使用 Claude Code 生成的代码质量“远远不如 cline + Gemini 2.5 Pro”,要达到同等效果,Claude 需要开发者全程盯着。

     

    还有开发者表示,在 Trae 上使用 Gemini 2.5 Pro 编程的完成率已经大幅超过 Claude 3.7。也有开发者表示 Gemini 修复 bug 的速度明显快于 Claude Code。

     




    一个 3D 渲染的处理问题,让 Claude Code 修了两个小时的 bug 还没解决,结果问 Gemini 2.5 Pro,只用了 5 分钟就搞定了。

    感觉对于那些看起来难度比较高的问题,可以先让 Gemini 写好详细的说明书,然后再让 Claude Code 按照它来实现,这种组合用法可能会挺不错的。

     

    这些反馈表明,过去一年,谷歌在代码能力上的提升已经进入“质变期”。 Gemini 编码产品负责人 Connie Fan 表示,Gemini 2.5 Pro 之所以能获得良好口碑,关键在于两个方面的系统性演进:“数据”和“方法论”。

     

    从数据的角度看,“代码仓库上下文”变得非常关键。现在模型的目标不再只是做简单的代码补全,而是要理解并修改分布在多个文件、涉及多个模块的大型代码库:“模型要能完成那些你如果花一小时坐下来,在熟悉的代码库上下文中亲自去做的复杂改动。”

     

    为了让模型真正理解这些上下文,谷歌也开始系统性地挖掘内部工程师资源。

     

    其中还包括 Jeff Dean 这样的一些人,“他们代表了一种‘能力新等级’的标准,”Connie 直言,“我们拥有世界上最聪明、最出色、有时也最有主见的十几万工程师。”借助他们在不同语言、技术栈、经验水平上的反馈,谷歌能够覆盖更广泛的使用场景,提升模型在“专业开发者细腻口味”上的匹配能力。“我们过去其实并没有很好地利用这一点,但现在我们开始真正这样做了,而且效果非常惊人。”

     

    从研究角度看,Gemini 团队并未将全部筹码押在“单一大上下文窗口”的方案上,而是探索双路线:一方面持续扩展上下文长度,另一方面发展具有自主搜索、推理能力的 agentic 编程模型,模型以代理的形式与用户交互,甚至具备一定程度的自主性。

     

    正如研究负责人 Danny Tarlow 所描述:

    “如果我们把你(人类开发者)丢进一个大代码库里,你会怎么做?你会用代码搜索、看文件结构、点来点去,读点代码再搜索其他信息。agentic 模型就模仿了这种方式。”

     

    更有趣的是,当模型成功处理一个百万行代码库时,用户会感受到一种“魔法般”的惊喜。而这正是 Gemini 2.5 Pro 所在意的方向:不仅是模拟人类的工作方式,更是突破人类经验限制,发展出“非人类”的全新解法。

     

    正因如此,不少开发者开始转而重视起谷歌在这场 AI 编程竞赛中的回归。Gemini 是否“翻盘”尚未可知,但“赶超”的信号,正在越来越清晰。

     

    参考链接:

    https://blog.google/technology/developers/introducing-gemini-cli-open-source-ai-agent/

    https://www.youtube.com/watch?v=jwbG_m-X-gE

     

    2025-07-01 15:586125

    评论

    发布
    暂无评论

    软件测试 | 使用冒烟测试检验版本

    测吧(北京)科技有限公司

    测试

    ChatGPT 仅仅是一款工具而已 | 社区征文

    小鑫同学

    ChatGPT

    跨端技术或许是提升软件运维效率的利器

    FinFish

    小程序化 小程序技术 高效运维 软件运维

    软件测试 | 质量控制

    测吧(北京)科技有限公司

    测试

    软件测试 | 不要把手工测试与自动化测试等同起来

    测吧(北京)科技有限公司

    测试

    量化合约对冲交易app系统开发源代码

    开发微hkkf5566

    Flink Table Store 0.3 构建流式数仓最佳实践

    Apache Flink

    大数据 flink 实时计算

    车企数据分类分级的实践指南出炉!“数据安全推进计划”发布,奇点云参编

    奇点云

    数据安全 奇点云 数据分类分级 车企

    ins视频保姆级图文教程,快学起来!

    frank

    探索 Pixelmator Pro 3新功能——AI智能模板

    Rose

    Pixelmator Pro Mac修图软件

    M1电脑运行Windows10弹出“内部版本已过期”的解决方法

    Rose

    pd虚拟机 M1电脑 Windows内部版本已经过期

    软件测试 | Elasticsearch+Kibana

    测吧(北京)科技有限公司

    测试

    Nydus 在约苗平台的容器镜像加速实践

    SOFAStack

    开源 互联网 开发

    Wasm 原生时代已经来到

    SOFAStack

    开源 互联网 Wasm

    取得成功的 13 个方法

    宇宙之一粟

    个人成长 翻译 成功

    告别数据开发中的人工审核!火山引擎DataLeap落地“自动校验开发规范”能力

    字节跳动数据平台

    大数据 数据治理 数据研发 企业号 3 月 PK 榜

    Sovit3D平台快速构建智慧渔业三维可视化养殖管理系统

    2D3D前端可视化开发

    智慧渔业 智慧渔场 智慧水产养殖 数字渔业 渔业数字孪生

    详解神经网络中反向传播和梯度下降

    华为云开发者联盟

    人工智能 神经网络 华为云 华为云开发者联盟 企业号 3 月 PK 榜

    文档资料多?官方文档怎么找?openEuler文档地图帮你搞定

    openEuler

    Linux 操作系统 文档 openEuler

    软件测试 | 针对看起来很小的代码错误执行后续测试

    测吧(北京)科技有限公司

    测试

    软件测试 | 测试方法的基于活动的测试手段

    测吧(北京)科技有限公司

    测试

    干货演讲!龙蜥自动化运维平台SysOM 2.0调度、内存相关诊断功能介绍 | 第 70-71 期

    OpenAnolis小助手

    内存 系统运维 sig 龙蜥大讲堂 SysOM

    R-Drop论文复现与理论讲解

    华为云开发者联盟

    人工智能 华为云 深度神经网络 华为云开发者联盟 企业号 3 月 PK 榜

    openEuler用户软件仓(EUR)介绍

    openEuler

    Linux 操作系统 虚拟机 openEuler 软件包

    软件测试 | 什么是Logstach

    测吧(北京)科技有限公司

    测试

    从原生迈向混合,小而美团队如何搞定APP高效定制

    华为云开发者联盟

    App 华为云 定制开发 华为云开发者联盟 企业号 3 月 PK 榜

    全景剖析阿里云容器网络数据链路(六):ASM Istio

    阿里巴巴中间件

    阿里云 容器 云原生

    Nacos+ThreadPoolExecutor构建动态线程池

    小小怪下士

    Java 程序员 线程池

    FDF循环互助游戏系统开发智能合约搭建

    薇電13242772558

    智能合约

    开源即爆红,代码能力碾压 Claude:Gemini CLI 背后这套方法,谷歌憋了一年_生成式 AI_Tina_InfoQ精选文章