写点什么

谷歌发布 Gemini 3

作者: Andrew Hoblitzell

  • 2025-11-19
    北京
  • 本文字数:1310 字

    阅读完需:约 4 分钟

大小:654.37K时长:03:43
谷歌发布Gemini 3

2025 年 11 月 18 日,谷歌推出全新旗舰级多模态大模型家族Gemini 3。该系统的定位是迄今为止功能最强大的系统,自发布首日起即全面部署于搜索引擎、Gemini 应用、AI Studio、Vertex AI、Gemini 命令行界面及Antigravity集成开发环境中。与早期 Gemini 版本仅限于少数产品率先应用不同,Gemini 3 从一开始就是一个统一的平台,同时支撑消费级与企业级应用场景。

 

目前,Gemini 3 以 Gemini 3 Pro 为核心,而 Deep Think 的定位是更高强度的推理模式,将面向高级版和终极版用户推出。谷歌将 Gemini 3 Pro 描述为其多模态理解与代理编码的核心模型,专注于融合文本、代码及富媒体任务。Deep Think 则被描述成一种离线模式,专门处理最复杂的推理工作负载,包括高难度基准测试和长周期规划。

 

Gemini 3 Deep Think 实现了质的飞跃。Deep Think 曾助力我们在 IMO 和 ICPC 赛事中斩获金牌,如今更赋能更为强大的版本 Gemini 3。比最先进还先进。——Quoc Le

 

从 API 的角度来看,Gemini 3 Pro 支持在最多 1,048,576 个 token 的上下文窗口内处理文本、图像、视频、音频和 PDF 文件,输出上限为 65,536 个 token。该核心模型通过 Gemini API、Firebase AI Logic、Vertex AI 和 Gemini Enterprise 提供接口,团队可根据他们现有的基础设施选择适配的集成方案。该模型支持结构化 JSON 输出,并可与内置工具组合使用。



根据模型卡片及相关技术概述,Gemini 3 Pro 在多项公开基准测试(包括考试类任务与科学推理任务)中的成绩都达到或接近顶尖水平。Deep Think 模型进一步提升了其中的多项指标,在针对代理而非单次提示而设计的长期推理测试中,表现尤其突出。

 

有一种感觉,谷歌在 AI 领域挣扎了数年——他们推出了 Bard 和 Gemini 的早期版本,都存在一些问题——我认为,谷歌当时正在追赶最先进的水平。现在的问题是:这是否意味着他们正在夺回王冠?——Kevin Roose,Hard Fork

 

Gemini 3 Pro 能够在单次请求中分析文本、媒体和文档的混合输入,因此,开发人员可以发送长篇 PDF、截图和视频片段,而无需为每种模态构建独立的管道。该功能旨在将文档分析、日志分级和媒体密集型分析等工作负载整合到单个模型中,而非分别维护视觉、语音和语言系统。

 

此外,Gemini 3 Pro 正在整合至 Gemini Code Assist 和 Gemini CLI 中。常见 IDE 中的 Code Assist 用户将率先以代理模式体验 Gemini 3。该模型不仅能执行内联代码补全,更能处理多步骤编码任务。在终端环境中,Gemini CLI 也提供了该模型,支持应用程序框架搭建、代码重构、文档生成及轻量级代理等工作流。

 

谷歌重点展示了 Gemini 3 在跨工具规划和执行长期任务方面的能力,涵盖财务分析、供应链规划及合同审查等领域。利用聚焦于代理和计算机使用的基准测试(如模拟操作和营收任务),谷歌展示了该模型在需要与用户界面及外部系统交互的环境中表现出的卓越性能。

 

开发论坛重点强调了该模型在数学运算密集型工作负载、基于屏幕的任务以及代码密集型项目中的性能提升,同时也探讨了基准测试污染的风险以及综合评估与日常开发工作之间的差距。另外,还有一种观点是,其行为可能存在不一致,并建议在提交代码前进行内部评估。

 

如想要了解更多内容,请参考官方文档模型卡片

 

原文链接:

https://www.infoq.com/news/2025/11/google-gemini-3/

2025-11-19 08:001

评论

发布
暂无评论
发现更多内容

存储之于AI,让算力真正释放价值。

ScaleFlux

NVMeSSD AI存储 MLPerf

分布式事务在分片场景下,TCC和Seata到底怎么选?一线实战全解析!

我爱娃哈哈😍

分布式事务 分布式数据库

合合信息智能审核白皮书上线,AI破解审核业务“数据孤岛”难题

合合技术团队

人工智能 大数据 算法

一文了解增量物化视图维护(IVM):原理、演化与实践落地

tapdata

实时数据平台 物化视图 增量物化视图 增量视图维护 IVM

Mac 使用虚拟机部署TiDB 8.5

TiDB 社区干货传送门

NocoBase 本周更新汇总:优化及缺陷修复

NocoBase

开源 低代码 零代码 无代码 版本更新

社区活动-关于AI智能运维的交流与思考

TiDB 社区干货传送门

人物访谈 社区活动 管理与运维 应用适配 TiDB第四届征文-运维开发之旅

平安科技:从 Oracle 到 TiDB,百 TB 级高并发保险业务的全面国产化实践(业务篇)

TiDB 社区干货传送门

记 TEM on 腾讯云 :超级流畅的一次试用

TiDB 社区干货传送门

社区活动 TEM 试用

MiniMax 语音模型升级,跨语种复刻保留口音,多语种增至 40 个;FlowSpeech:书面语转口语 TTS 服务丨日报

声网

新客户 | 没拆 PI,成本却省了一半,这家钢铁企业是怎么做到的?

TDengine

tdengine 时序数据库 国产时序数据库

基于腾讯云的TiDB TEM平台试用体验

TiDB 社区干货传送门

版本测评 安装 & 部署 TEM 试用

打造“云上超算引擎”,天翼云E-HPC服务赋能福建农林大学科研提速!

天翼云开发者社区

科研 算力服务

2019年Q2/Q3机器学习研究奖获奖名单公布

qife122

机器学习 学术合作

普通人如何利用AI赛道搭建“前店后厂”?

阿星AI工作室

AI 产品经理 一人公司 小而美

Prisma不能优雅的支持DTO,试试Vona ORM吧

node.js typescript ORM prisma Nest.js

🔥IoTOS v1.6.8 爆款配置 | 流量池运营 | 物联卡短信🔥🔥

开源物联卡管理平台-设备管理

5G 物联网 路由器 WiFi card 短信发送

解决企业管理难题,别小瞧了低代码

秃头小帅oi

ArgoDB携手国产操作系统完成兼容适配,构建数智新生态

星环科技

如何基于动态关系进行ORM关联查询,并动态推断DTO?

node.js typescript ORM prisma Nest.js

分片键选错了,你的数据库分片就是"灾难现场"!

我爱娃哈哈😍

数据库 数据库分片 分片键

IT工单堆积如山?ManageEngine卓豪3步实现自动化处理

ServiceDesk_Plus

ManageEngine卓豪

新媒体时代的舆情管理:你监测到情绪拐点了吗?

沃观Wovision

社交媒体 沃观Wovision 舆情监测系统 海外舆情监测

告别微信办公,这款私有化企业聊天软件可能适合你!

BeeWorks

即时通讯 IM 私有化部署

避免“卡脖子”!如何减少内存I/O延迟对程序的影响?

秃头小帅oi

《小K闪电课堂》EP07 :SQL 引擎“第四关”——多模执行器

KaiwuDB

文本转语音技术突破:让计算机拥有自然语音

qife122

语音合成 文本转语音

除了腾讯会议,私有化有哪些选择?

BeeWorks

即时通讯 IM 私有化部署

谷歌发布Gemini 3_Google_InfoQ精选文章