作者 | 华卫
北京时间 5 月 20 日凌晨 1 点,谷歌一年一度的 I/O 开发者大会准时开幕。
在发布新品前,谷歌 CEO Sundar Pichai 展示了一个惊人的数据:每月处理 3.2 千万亿个 token。“两年前,我们在各个平台每月处理约 9.7 万亿个 token。去年的 I/O 大会上,这一数字增长到了大约 480 万亿个 token。快进到今天,这个数字又跳升了 7 倍,每月超过 3.2 千万亿个 token。”
短短一年增幅达 7 倍。而这些 token,代表着谷歌用户、开发者与客户正在解决的各类问题。据透露,去年 I/O 大会时拥有 4 亿月活跃用户的 Gemini 应用,如今已突破 9 亿,一年内翻了一番多。截至目前,Nano Banana 图像生成模型已生成超过 500 亿张图像。
“还有大量潜在的生产力等待被释放。“Pichai 称。而这次的 I/O 发布,“智能体”可谓是重头戏。几乎所有的重磅新品,都是围绕智能体去迭代和更新的。
Gemini 3.5 登场,彻底改变谷歌内部工作方式
Gemini 3.5 Flash 是此次 I/O 最值得开发者关注的发布,被称为谷歌“迄今为止最强大的智能体和编码模型”。在多项智能体和编码基准测试中得分均高于 Gemini 3.1 Pro,运行速度比其他前沿型号快 4 倍。
对于这款模型,Pichai 特意强调了两点。
第一,与 3.1 Pro 相比,3.5 Flash 在几乎所有基准测试中表现更佳。它在编码能力上取得了巨大进步,尤其是 GDPVal 的飞跃非常显著,反映了许多现实世界中具有经济价值的任务。在 Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和 MCP Atlas(83.6%)等具有挑战性编码和代理基准测试上的表现优于 Gemini 3.1 Pro,并在多模态理解方面领先(CharXiv Reasoning 为 84.2%)。
第二,Gemini 3.5 Flash 在多个维度上提供可媲美大型旗舰机型的智能性能,但速度仍然非常快。以每秒输出 token 数计算,它比其他前沿模型快 4 倍。

此外,Gemini 3.5 Flash 的另一个惊人之处在于,它以不到可比前沿模型一半的成本提供前沿级能力。“我们听说许多公司在五月就已经超出了年度 token 预算。如果公司能够将 Flash 与其他前沿模型混合使用,就可以节省大量成本。举个例子,顶尖公司每天处理约 1 万亿个 token。如果他们将 80% 的工作负载从其他前沿模型切换到 3.5 Flash,每年可节省超过 10 亿美元。这是真实的节省,可以再投入到公司的发展中。”Pichai 表示。
过去一年,AI 编程工具的市场是 Cursor、Claude Code、GitHub Copilot 三家在争。Google 在这个赛道几乎缺席。有消息说,Gemini 团队在编程方面挣扎了一段时间。这次的 Gemini 3.5 系列,就像是谷歌最新的正面回应。
今天起,Gemini 3.5 Flash 在谷歌的所有产品和 API 上向所有人开放。
“新模型在谷歌内部彻底改变了我们的工作方式。”Pichai 表示,他们一直在将 3.5 Flash 与重新构想的以智能体为核心的开发平台 Antigravity 一起使用,显著加快了开发速度。“3 月,我们在内部 AI 开发工具中每天处理约 5000 亿个 token,之后每隔几周就翻一倍。现在,我们每天处理的 token 数量已经超过 3 万亿。如此规模创造了强大的反馈循环,帮助我们不断改进 3.5。”
下个月,谷歌预计推出 Gemini 3.5 Pro。据悉,谷歌在内部已经在使用它,其显示出很大的改进。
Gemini Omni:将你的想法转化为电影视频
大会上,谷歌隆重推出新模型 Gemini Omni,能够从任意输入生成任意输出模态的样本。这一新模型将 Gemini 的智能与生成式媒体模型结合在一起,在现实世界理解上实现了巨大的飞跃。通过 Omni,用户可以将图片、音频、视频和文本作为输入结合,生成基于 Gemini 真实世界知识的高质量视频,也可以通过对话轻松编辑视频。
“借助世界模型,人工智能正从预测文本转向模拟现实。我们一直在努力突破这些模型的边界。”Pichai 表示,Gemini Omni 将从视频输出开始,随后会支持图像和文本。
今日起,谷歌将正式上线 Omni 系列的 Flash 版本,可以在 Gemini 应用、Google Flow 和 YouTube Shorts 上试用,未来几周通过 API 向开发者和企业客户推广。
据介绍,Gemini Omni 的特别之处是让视频编辑变得更简单,只需自然语言,可以修改特定事物或者改动整个场景,还可以修改环境、角度、风格,甚至具体细节,同时始终保持原始场景的连贯性。并且,每条指令都可以在前一条的基础上继续操作,角色保持一致,物理规律得以维持,场景也记得之前发生的事情。
除了构建逼真的场景,Gemini Omni 还能推理接下来应该发生什么。它可以将对物理规律的直觉理解与 Gemini 对历史、科学和文化背景的知识结合起来,实现从照片级真实到有意义故事讲述的跨越。Omni 还能利用 Gemini 的知识,将语言、图像和意义联系起来,其能力远超简单的模式匹配。
不过,所有用 Omni 制作的视频都包含肉眼几乎察觉不到的 SynthID 数字水印,用户可以通过 Gemini 应用、Chrome 中的 Gemini 和 Google 搜索轻松验证视频是否是用 Gemini Omni 生成的。
两款智能体加持,Gemini 应用更“实用”了
对于 Gemini 应用来说,这一年是丰收的一年。去年在谷歌 I/O 大会上,Gemini 服务了 4 亿用户。如今,每月有超过 9 亿人在 230 个国家、70 多种语言中向 Gemini 寻求帮助。
据介绍,Gemini 应用来新增了两个智能体功能。首先是晨间摘要智能体 Daily Brief ,它基于近期 Google Labs 实验 CC 的成功经验,让用户可以无缝、直观地进入 AI 智能体的世界。一旦你选择加入,Gemini 会在后台跨你已连接的应用运行。它会从 Gmail 收件箱收集紧急更新,从日历跟踪即将发生的事件,并将相关的后续信息整理成一份易于浏览的简报。
而且,Daily Brief 的功能远超简单的摘要。它会根据你的具体目标主动组织和优先排序内容,甚至会建议你立即可采取的下一步行动。你还可以通过简单的“点赞”或“点踩”反馈来引导它的行为,使其越用越懂你。今天起,Daily Brief 开始向美国的 Google AI Plus、Pro 和 Ultra 用户推出。
谷歌还推出了 Gemini Spark,这是一款全天候 24/7 个人 AI 智能体,标志着 Gemini 的一次重大转变:从一个可以回答问题的助手,升级为一个可以在用户的指示下实际完成工作、成为主动合作伙伴的智能体。
“我对 Gemini Spark 特别兴奋。它是 Gemini 应用中的个人 AI 智能体,可以帮助你管理数字生活,根据你的指令代你执行操作。”Pichai 表示。
据介绍,Gemini Spark 基于 Gemini 3.5 并使用 Antigravity 框架,与你日常依赖的 Workspace 工具(如 Gmail、Docs、Slides 等)深度集成。更棒的是,因为它是基于云的智能体,即便你关闭笔记本或锁屏手机,Spark 也会在后台持续工作。这意味着 Spark 可以承担复杂任务,让你腾出时间专注于最重要的事情。
使用 Gemini Spark,你可以设置重复任务或触发器,自动解析每月信用卡账单,标记新增或隐藏的订阅费用;教它新技能,让它定期检查孩子学校的邮件更新,提取关键截止日期,并将每日汇总简报发送给你和你的伴侣。创建完整工作流,让它整合邮件和聊天中的会议原始记录,生成整理好的 Google Docs 文档,甚至起草启动项目的配套邮件。
这仅仅是开始, Gemini Spark 有丰富的功能路线图。今天,谷歌扩展了 Gemini 连接应用列表,通过 MCP 新增了 Canva、OpenTable 和 Instacart 的连接。未来几周,Spark 将可以利用这些 MCP 连接完成更多任务。之后,谷歌还将增加新能力,包括通过短信和邮件与 Spark 互动、创建自定义子智能体以及操作本地浏览器。
据悉,Spark 会完全在用户的指挥下运行。用户可以选择是否启用它,以及连接哪些应用;在执行高风险操作(如花费资金或发送邮件)前,它会先征求确认。Gemini Spark 本周将向受信任测试者推出,计划下周向美国 Google AI Ultra 用户推出 Beta 版本。
25 年来搜索最大升级:AI 带来新纪元
同时, 谷歌带来了 25 年来 Search 框的最大升级:全面 AI 化。
“随着我们进入这个智能体时代,搜索将比以往任何时候都更有帮助和强大。”Pichai 说道。据介绍,谷歌在 Search 中引入了信息智能体。这些是用户可以设置的个性化 AI 智能体,它们可以在后台全天候工作,在你最需要的时候找到信息,并帮助你执行操作。据介绍,信息智能体将在今年夏天逐步推出,首先面向 Google AI Pro 和 Ultra 用户。
“我们构建真正智能体化 Search 的另一种方式是赋予其智能体编程能力。”现在,Gemini 3.5 Flash 已经成为全球用户在 Google 搜索 AI 模式下的全新默认模型。“凭借 Gemini 3.5 Flash 和 Google Antigravity 的强大能力,Search 可以为用户的每个问题创建个性化体验,例如动态布局和交互式可视化。这些生成式 UI 功能将在今年夏天向所有用户免费开放。”
对于需要长期持续处理的任务,Search 还能更进一步创建持久化、定制化的仪表盘或追踪器,用户可以随时返回并继续操作,可以把它们看作是为特定任务定制的迷你应用。未来几个月,用户将能够在 Search 中使用 Antigravity 构建个性化体验,首批面向美国的 Google AI Pro 和 Ultra 用户。
另外,谷歌还致力于让用户与 Search 的对话更简单顺畅。用户可以直接在 AI 概览界面提出后续问题,并通过 AI 模式进行连续的对话交流。上下文信息会随你保留,随着深入探索,相关链接和参考文章也会变得更加精准,这个无缝体验已在全球桌面和移动端上线。
从今天起,新的智能 Search 框开始在所有支持 AI 模式的国家和语言中逐步推出。





