
Gemini 在数据上第一次“反超”了 ChatGPT。
根据《金融时报》披露的最新统计,截至 2025 年底,用户在桌面端和移动网页端单次使用 Gemini 的平均停留时长已经达到约 7.2 分钟,首次超过 ChatGPT 的约 6 分钟,也略高于 Anthropic Claude 大约 6 分钟的水平。
更长的停留时间,意味着这已经不是“下个 App 玩两下”的新鲜感,而是用户真的愿意在 Gemini 里待更久、反复用它解决问题。
与此同时,在 App 下载量 上,虽然 ChatGPT 依然以约 8700 万的月度下载量领先,但 Gemini 的追赶速度非常惊人——从 2025 年年中每月约 1500 万下载,一路飙升到年底的约 6600 万。
这说明,谷歌把 Gemini 深度嵌入自家生态——从 Android 设备到 Google Workspace——的策略,正在用户获取上逐步见效。
停留时长尤其值得关注,因为它反映的是真实使用,而不是“下载即走”。用户主动选择待得更久,说明 Gemini 的回答、功能或整体体验确实发生了可感知的提升。
对谷歌来说,这次“逆袭”格外解气:Gemini 的前身 Bard 曾因错误频出、体验不稳而被视为“ChatGPT 的失败竞品”。如今的使用数据显示,谷歌不仅补上了当年的短板,也开始重新找回技术与产品节奏。
更有意思的是,Gemini 的这次反超,并不是一个孤立事件——它的节点恰好与 Gemini 3 的推出 重叠。
谷歌打出的第一记重拳就是 Gemini 3。在一系列基准测试中,它的得分超过了 OpenAI 当前最先进的模型(尽管真实使用中仍有波动)。Gemini 3 的最大优势,是超大规模与背后投入的巨量算力。这一点尤其值得注意,因为过去一年里,OpenAI 一直难以在“规模和复杂度”上突破 GPT-4 的天花板。
支撑 OpenAI 的,是一次真实存在的推理能力突破,在某些任务上表现确实更好,但代价也同样明显——训练更贵、推理更慢、运行成本更高。
换句话说:OpenAI 的优势在算法,谷歌的反击点在“全栈”上的能力。
而这一切,也呼应了 Sundar 最近在访谈中反复强调的一句话——Gemini 的演进不是来自某个单一技术突破,而是谷歌把“模型、TPU、数据中心、基础设施”整合成一条通畅链路后的自然结果:
“当你采用全栈式的方法时,每一层的创新,都会一路向上传递到最顶层的产品。”
他强调此前之所以觉得谷歌“慢了”或“安静”,是因为他们“实际上在拼命把底层基建全部铺好,然后在这个基础上快速执行”。
另外,Gemini 背后还有一条更隐蔽、但可能更关键的变量:早期谷歌文化的回流。
在这次访谈里,Sundar 有一段描述特别耐人寻味。他提到 DeepMind 和核心模型团队聚集的那间著名的 Blue Micro Kitchen,那是公司内部“密度最高”的几个工作区之一:
“那个地方特别像早期的 Google。”
你会在那儿遇到 Sergey,也会看到 Jeff、Sanjay 这些人,他们现在还在亲自写程序,同时还自己做咖啡。Sundar 甚至半开玩笑地说,自己虽然也懂如何做一杯好 espresso,“但在那群人中间操作,我还是会有点怵。”
真正重要的不是咖啡,而是那种 “小而密集” 的工作状态:创始人、顶级工程师、研究员扎堆在一块,很小的空间里不断有人路过、停下、交流、互相跑去看对方屏幕,实时讨论模型、QPS 和线上表现。
“那一小块区域里聚集着极高密度的人才,大家不断交流、互相拜访,思想交换非常活跃。它让我想起公司早期的样子。”
所以可以说,Gemini 的竞争力,并不是“某个模型比对家跑分高了几分”,而是谷歌重新把组织、基础设施和工程文化调回到它本应有的位置。下面,就是这场访谈的完整内容,也是谷歌内部如何看待“Gemini 时代”的底层逻辑所在。
Gemini 作为一根主线,让“全栈”发挥作用
主持人(Logan Kilpatrick):Gemini 3 已经正式发布了,Nano Banana Pro 也已经上线,外界反馈非常积极。所以,我想问问你,是否愿意帮我们框定一下这个时刻的意义——一路走到今天,我们不仅有了最先进的 Gemini 和 Nano Banana Pro,还有 VO 以及其他音乐模型等一系列产品。似乎时间越往后,更新的节奏越密。你能为我们框定一下这个时刻吗?
Sundar Pichai:首先,很高兴来到这里。这对我们来说是非凡的一周。当你在内部做产品时,你总会在脑海中想象那一刻——当你终于可以把一切公开发布的时候。而对做产品的人来说,没有什么比这更令人兴奋的了。这就是我们这周的感受。但我认为所有这一切都是建立在多年深度投入的基础上。我一直都很清楚,能看到我们推进的速度,但当这一切真正汇聚在一起的时候,那真的特别。
主持人:是的,我记得一年半前我们谈话的时候,我当时肯定又在抱怨什么,而你当时让我试着从更长期的视角去看问题。我很好奇,在今天这种竞争极其激烈的环境里,你们要不断在各种排行榜上提升那 1% 的成绩,但真正让我们走到现在、拥有最先进模型和跨 Google 的基础设施的一切,其实是长期视角带来的成果。你是如何在这种“竞争赛跑”环境里保持长期视角的?
Sundar:我一直强迫自己保持这种视角。我们确实处在一个节奏很快、需要快速迭代的行业,而且我也很享受这种节奏。但同时,你需要能够从更高的层面拉开距离,押注长期方向,并且在很长时间内保持专注。我一直认为这非常重要。
你知道,2016 年,我希望整家公司都转向 “AI First”。促使我产生这个想法的,是几件更早之前的事:2012 年的 Google Brain,那篇著名的“猫”论文,让图像分类有了突破;2014 年我们收购了 DeepMind;2016 年 1 月是 AlphaGo;然后很多人都没注意到的是——2016 年 5 月我们发布了第一代 TPU。
所以在 2016 年,对我来说已经非常清楚:我们即将经历一次平台级的转变。因此我做了那个“全栈式 AI 押注”,把 Google 彻底往 AI First 的方向重塑。从那以后,我们取得了大量进展,也有很多突破来自 Google,包括 Transformer,我们在 BERT 和 MUM 里用它提升搜索,在 Google Photos 等产品里落地。
到了生成式 AI 的时刻,我意识到这个窗口更大了——消费者、开发者,都准备好大规模使用这项技术。那么我们要怎么应对这样的时刻?
于是我们启动了 Gemini 项目,让 Google Brain 和 Google DeepMind 联合推进。为此我们甚至决定把两个团队合并成一个 Google DeepMind。在这个过程中,我们大幅加大了基础设施投资——数据中心、TPU、GPU 等等。接下来,就是要推动整个公司以更快节奏前进。当 GDM 团队开始发布 Gemini 后,你也知道我们之后经历的一系列里程碑。我很高兴你一路参与推动这一切。接下来,就是如何确保我们能把 Gemini 整合进所有的产品里——其中很多产品服务的是数十亿用户。我们如何让搜索这样的产品充分迭代,释放模型的能力?
你把框架拉远一点看,就会觉得极度振奋。因为当你采用全栈方法论时,每一层的创新会沿着整条链路向上传递。
主持人:这就是我常说的:预训练之所以表现这么强,是因为当 DeepMind 的预训练做得越来越好,后续的微调、RL 会成为能力的“加速器”。基础设施也是同样的道理。
Sundar:是的。你让基础设施更快、更强,它会让预训练、后训练、测试时计算等所有环节都更好,而最终你把这些能力释放到产品里——比如 Nano Banana 在各种产品中的体现,比如搜索中的 AI 模式、生成式界面(Generative UI)。再加上开发者基于这些能力做创新,就会形成巨大的乘数效应。这种过程永远让人兴奋。
当然,全栈方法也意味着当生成式 AI 爆发的那一刻到来时,我们的响应也需要时间。例如我们一开始确实容量不足。我们必须投入大量资金快速扩容,以达到现在这样的规模。
如果从外界看,可能会觉得我们“慢了”或“安静”,但实际上我们在拼命把底层基建全部铺好,然后在这个基础上快速执行。如今我们已经在另一端了,你现在也能看到团队推进的速度。
主持人:你刚提到 Gemini 出现在我们所有产品中。我觉得现在的挑战之一,是同时在所有产品线上“同步发布”(sim-shipping),不仅是产品节奏的问题,更是容量、性能、可用性等问题。如何确保模型在所有产品形态上都有稳定一致的表现?
历史上,除了 GAIA 或 Google 账号之外,Google 的众多产品之间并没有一个真正贯穿所有产品的“统一主线”。从 Cloud,到 Waymo,到 Search,到 Gmail,各自为政。而现在 Gemini 仿佛变成了贯穿我们几乎所有产品的那条主线。这种感觉真的很神奇。我不知道你怎么看。
Sundar:我觉得这是一个非常好的观察。对我来说,Gemini 是 “AI First” 战略最清晰、最具象的体现。因为现在有一个具体的东西——Gemini——大家都能理解,而 Gemini 让从搜索到 YouTube、从 Cloud 到 Waymo 等等的一切都变得更好。
我特别喜欢 Gemini 3 发布的时候,你提到 sim-shipping:我们同时在很多产品中上线它。但更让我感兴趣的是,在 X(原 Twitter)上,我看到 Copilot、Replit、Figma 等第三方也都在同时发布自己的 Gemini 版本。这才是真正的规模化创新:不仅是我们,全世界其他公司也在一起往前冲。这种同步推进的景象真的非常震撼。
主持人:另一个话题当然就是 Nano Banana Pro。我知道你也花了很多时间在上面,外面的人简直玩疯了,这特别酷。
Sundar:我一直在问自己:我们到底是让世界更高效了,还是只是增加了更多内容?这些信息图确实令人惊艳。随着大家从“玩乐阶段”进入更严肃的使用场景,我在 X 上看到 Ben Bajarin 发了一张他自己的 CoreWeave 分析图,让我也忍不住点进去研究。
PowerPoint 当年释放了一个趋势:人们开始做越来越多的幻灯片,信息量越来越大、层层堆叠。也许 Nano Banana Pro 正将我们带回另一个阶段——把信息压缩、浓缩、用更易消化的方式提供给世界。
主持人:我过去一直对很多生成式媒体模型的“实用价值”持怀疑态度,它们在娱乐上挺好,但对大众来说未必真有价值。然而 Nano Banana Pro 的信息图能力、以及与 Google 搜索结合后的落地性,真的像是“跨越了鸿沟”。我非常清楚地看到它如何符合 Google 的使命:组织全球信息,让人人都能更好地获取它。从这个角度看,信息图让这一切变得直观、具体、可感知。
我记得 Nano Banana 团队在某个内容里说过:他们甚至不是刻意追求信息图能力的,是随着模型能力变强、文本渲染能力变好,这个效果自然出现的。这太迷人了。
Sundar:它还展示了一个事实:世界上存在巨量“被压抑的创造力”。人们会想表达自己,而我们正在给他们提供能够以他们脑中所想的方式去表达的工具。过去我们可能没有意识到工具对人的限制,但我们正创造越来越具表达力、越来越容易被大众触达的工具。看到这一切真的非常激动人心。
主持人:当你看到这些重要发布上线时,你的“成功标尺”是什么?是外界在线反馈?是第一天的用户增长?还是某个别的标准?
Sundar:发布当天我会非常积极地观察各方面的表现。我会看各种反馈。例如在 X 上,我会看普通用户的体验。我甚至会私信对方说:“这是一个有效的反馈,我们要处理这个问题。”所以某种意义上,我是通过这种方式来评估的。
另外,很明显,内部团队本身也在用 Gemini 去收集、归纳反馈。我们有优秀的仪表盘,所以我会从各种来源吸收信号。
但我是一个必须亲自“感受”的人。我会看报告,但也会亲自上网看人们如何使用产品、如何发帖。我也会走到那些有多屏仪表盘的同事那,看 QPS、容量压力等等。
所有这些都能让我真正理解发生了什么。尤其是发布当天,对我来说非常关键——它能让我快速判断什么有效、什么无效。
主持人:这只是 Gemini 3 章节的第一页。我们甚至还没有发布 Flash 版本。现在其实我们还没有把其他模型都推到 3.0 这个级别。我们刚刚发布了 Gemini 2.5 Pro,其实我在看一堆 benchmark 的时候会发现,就算是 2.5、2.5 Pro 也不是在所有项目上都是 SOTA(state-of-the-art)。很明显,很多竞争对手已经追上来了,但即便如此,2.5 Pro 现在在很多能力上依然是「同级里最强」的。然后我们又在这个基础上更进一步,做了 3.0。
Sundar:2.5 Pro 是在 Google I/O 上发布的。你当时就能感觉到,那是一次很大的跃迁。让我感觉很好的一个点是,GDM 等团队现在已经形成了一个很好的节奏——大概每 6 个月左右,我们就会把前沿往前推进一点。
而且这事其实越来越难,因为你说得对:2.5 Pro 已经是一个非常好的模型了,要在此基础上再做出「清晰可见的巨大飞跃」其实挺难的,但这正是让这份进步变得精彩的地方。
我知道你一直对 Flash 很兴奋,我们正在做,也很快要来了。你之所以对 Flash 这么兴奋,是因为它让我们可以服务更多用户。在这场「前沿模型的接力」里,它会起到非常关键的作用。所以我对 Gemini 3.0 Flash 非常期待——我觉得它会是一个非常非常好的模型,可能会是我们迄今为止最好的一个,我们拭目以待。
更重要的是,团队内部已经在思考下一代预训练模型了。所以这种「持续、无情地(relentlessly)创新 + 持续发布」的文化,是让当下这一刻变得格外特别的原因之一。
你能确确实实感到:接下来,到 2026 年,我们会在整个「全栈」的每一层上都有很多令人兴奋的进展。
重回谷歌早期文化
主持人:我有个有点「沙雕」的问题你有没有什么奇怪或者有趣的「发布日仪式」?还是说,你的仪式就是:想办法熬过这一天?
Sundar:对我来说,我每天早上的固定仪式其实比较简单:我起床后会先看看世界上发生了什么。我甚至一开始不会去看 Google 内部邮件,因为我的想法是:如果有跟 Google 相关的重要事情,新闻里肯定会有。所以我会先退一步,从新闻里整体感受一下世界。这是我平时的习惯。
到了发布日,这个「仪式」就会自然变成:看我们的产品、看我们在新闻里的呈现,回到你之前那个问题——去判断这次发布状况如何。所以这是我的主要 routine。
另外,我会尽量把发布日安排得「没那么结构化」,留下更多机动时间。这样我就可以多去团队那边走一走,看看那些负责产品的团队、看看他们对这次发布的感受。对我来说,这种直接的互动非常重要。
主持人:我还有个相关的问题。Dennis 和其他人内部也聊过:在 Creating Canopy 办公区里,有一个微厨房(micro kitchen),是很多 DeepMind 这边「一线行动」发生的地方。每次我去那里,都会有一个感觉:显然 Google 是一个巨大、遍布全球的公司,有无数事情在发生。但那个蓝色的微厨房,会让我觉得 Google 突然变小了、变得很亲密。我挺好奇,你怎么看这种感觉?以及你是怎么思考这种「小而密集」的空间的?
Sundar:那个地方特别像早期的 Google。
说实话,我经常会去那里。你可能会在那儿碰到 Sergey,也会看到像 Jeff、Sanjay 这种人——他们现在还在亲自写程序,同时又在那儿给自己做意式浓缩咖啡。
如果说有什么东西最能体现我们的文化,那就是你看他们在那个微厨房里做 Espresso 时的那种「精确度」。我自己是绝对不敢在那儿做 Espresso 的(笑)。
虽然我也挺懂怎么做一杯好咖啡,但在那群人中间操作,我还是会有点怵。
而且仅仅是上周,我在那里走来走去,就能感受到:那一小块区域里聚集着极高密度的人才,大家不断交流、互相拜访,思想交换非常活跃。我特别喜欢这种氛围——它让我想起公司早期的样子。
我们的 Serving 团队、在 Emma 的那些人也常常在那里。所以当我说我要去看 QPS 的时候,你基本可以想象我是弯着腰趴在他们屏幕前,试图搞清楚发生了什么。
对我来说,那确实是这家公司运转方式中最喜欢的一部分之一。
主持人:我对 Google 的一个「功能请求」就是:我们是不是应该在所有 PA、所有大团队附近都复制出这种 MK(Micro Kitchen)?我不知道具体要怎么做,但感觉应该「量产」这种空间。
Sundar:实际上,其他团队也有类似的小空间,各自有各自的版本。我觉得这种空间非常有助于把大家拉回办公室,让大家意识到现场交流的价值。
你可以在那儿进行高密度的想法碰撞,再回到各自的地方去进行深度专注,这种结合非常有帮助。
未来的登月计划和十年押注
主持人:我们刚才聊的很多 AI 故事,都是你们十年前就开始下的长期赌注,帮公司铺好了今天这条路。而事实证明,这些赌注是对的:Cloud 做得很好,Waymo 做得很好,量子计算看起来也会有很好的结果。我很好奇的是:现在往未来看,你是怎么思考接下来的 10 年押注的?是不是基础设施就是下一波 10 年的重注?还是说我们已经完全确认「AI 就是那件事」,所以所有筹码都押在 AI 上?又或者,你会怎么描述接下来十年我们要布局什么、要怎样为下一层成功打基础?
Sundar:我觉得,思考未来十年永远是非常重要的。往前倒推十年,我们押注的是 AI——而且是以非常深入的方式、以全栈的方式来押。一方面,我们要押注构建新的大型业务,推动公司多元化,比如 YouTube、比如 Cloud。
要知道,Google 本身可能是这个世界上最「云原生」的公司之一,但当时我们并没有把那一整套能力完整提供给外部。所以,当时对 Cloud 的押注,是一个规模极大的深度投入。Waymo 也是一个长期赌注,现在我们正看到一个拐点正在 Waymo 身上发生。
然后就是那些「面向未来」的赌注。量子计算就是一个很棒的例子。我真的相信,再过大概 5 年,我们对量子的兴奋程度,会和今天谈 AI 时差不多。
但我会一直用十年视角去思考这些事。最近一个例子就是两周前我们宣布的「Suncatcher 项目」:我们打算在太空中建数据中心。显然,这是个真正意义上的「Moonshot」——其中很多东西现在看起来都很疯狂。但当你真正退一步去想我们未来会需要多少算力的时候,这件事又开始变得合理起来,只是时间问题而已。
你要做的是:从那个远景倒推回来,拆成一连串里程碑,然后一步步往前走。比如设定 27 个里程碑,开始启动工作。到 2027 年,希望我们真的能在太空里某个地方放上 TPUs,搞不好还能「遇到」那辆在轨道上绕圈的 Tesla Roadster,这会很有趣(笑)。这就是我说的那种你愿意去做的长期项目。和 AlphaFold、Wing(无人机配送)类似,我们也在机器人领域酝酿很多有意思的工作。
主持人:当我看到「TPU 要上太空」的时候,我给 Demis 发了消息,说我们应该资助一辆月球车,在车上把 Gemini 跑在本地,让它在月球上四处探索一下。就算科学价值有限,也会是一个超级炸裂的营销活动(笑)。谁知道呢,说不定这个项目已经在某个地方偷偷立项了。
Sundar:哈哈,我相信有这种可能。
Vibe Coding 的崛起
主持人:你刚才提到的那条主线——模型能力不断提升,让每个人「地板」被抬高,更容易发挥创造力——我自己是真的有这种感受。我本身并不是那种很有艺术创造力的人,但现在我能处理很多过去只有专业创作者才能搞定的任务。
这些工具让我觉得,我看世界的方式都变得更有创造力了,而且不会再因为「我做不到」而焦虑。我觉得 Vibe Coding 就是一个巨大拐点:软件创造可能是人类历史上经济价值最高的活动之一,而现在写程序、做软件这件事,被带到了越来越多人的触手可及的范围内。
你自己也会偶尔搞点 vibe coding。我挺好奇,你如何看待这个时刻——不只是传统的软件工程师,更多「AI Builder」可以真正打造东西的时代?
Sundar:这是一个非常令人兴奋的时刻。就像当年互联网出现后,博客突然爆发,更多人变成了「写作者」;YouTube 出现后,更多人变成了「创作者」。现在你能在代码这一侧感受到同样的事情正在发生。
哪怕只看 Google 内部,你都能看到一个很明显的趋势:提交自己第一份 CL(change list,代码变更)的新人数量出现了非常陡峭的增长。原因就是这些工具降低了门槛,让更多人能参与进来。
举个例子,以前如果你是产品市场人员,有个点子,你可能会去向别人描述它。现在你可能会直接「vibe coding」一下,做个 demo 出来,拿给别人看。
我前几天还跟团队里一个同事聊天,他本身不是工程师、不写代码,但最近在教他儿子学西班牙语变位,他就直接用 Gemini 3「一发入魂」,生成了一个带动画的 HTML 页面来给儿子讲这个知识点。这位同事是我们 Comms(传播)团队的人。你从这样的故事里,就能看到人们开始用这些工具做各种事情,这真的非常有前景。
在我有限的时间里,我自己也会玩一玩这些东西。不只是 vibe coding,整个 IDE 体验也变得更有趣了。对我来说,现在写代码变得更「好玩」了。当然,我不会去碰那种超大型代码库——那种地方你必须完全做对、安全性要求也极高,那还是得让真正的专业工程团队来评估。
但整体上,我确实觉得事情变得更容易接近了,重新变得令人兴奋。而且最惊人的是:这一切还只是「最差版本」。未来只会越来越好。
我以前常跟大家说 Waymo:你现在看到的 Waymo,是它这辈子「开得最差的一天」,之后只会越来越好。我们现在所有这些工具也是同理:你在 AI Studio 里用 Gemini 3 做 vibe coding——一方面它已经非常惊艳,另一方面它也是「它这辈子最差的一版」。
我这么说,是想表达:我们会在未来看到巨大的进步。这真的是个非常令人激动的时期,我迫不及待想看到全世界的人用这些东西造出什么来。
接下来是什么
主持人:太棒了。我的最后一个问题是:接下来呢?我们应该对什么感到兴奋?我知道 pipeline 里还有很多很酷的东西,有没有什么是你此刻最在意、最想提的?
Sundar:有些人可能需要先睡一觉(笑)。我希望团队、包括我自己在内,都能先稍微休息一下。
但从更长的视角看,我对整个 Gemini 的路线图非常兴奋,也对它如何在我们所有产品中不断落地非常期待。
我们也在发布很多新东西。我非常喜欢 Flow,我最近一直在玩 Flow Notebook,它有一个非常热情、不断壮大的社区。看到记者在里面工作、看到博士生用它做完整的科研工作,这一切都非常惊人。所以,后面还有很多很多内容会持续推出。
参考链接:







评论