AICon 深圳站聚焦 Agent 技术、应用与生态,大咖分享实战干货 了解详情
写点什么

Gemini 2.5 Deep Think 并行创造性解决问题

  • 2025-08-19
    北京
  • 本文字数:930 字

    阅读完需:约 3 分钟

大小:445.75K时长:02:32
Gemini 2.5 Deep Think并行创造性解决问题

作为谷歌 AI Ultra 订阅的一部分,Gemini 2.5 Deep Think是一个旨在通过使用并行思维技术并延长推理时间来解决创造性问题的模型。

 

根据谷歌的说法,Deep Think 旨在更好地解决需要创造力、战略规划和逐步方法的问题。这些问题包括迭代开发和设计、科学和数学发现以及算法开发。

 

目前可用的模型是 Deep Think 模型的改进和优化版本,该模型在2025年国际数学奥林匹克竞赛(IMO)中获得了金牌

 

Gemini Deep Think 的一个高级版本完美解决了六道 IMO 问题中的五道,总共获得了 35 分,达到了金牌水平。解决方案可以在网上找到。

 

谷歌解释道,这种变体可能需要数小时来推理复杂的问题,而新的版本则为了速度牺牲了一些推理深度,使其更适合日常使用。谷歌特别强调了他们自 2024 年 IMO 竞赛以来取得的进步,当时他们的 AlphaProof 和 AlphaGeometry 模型需要专家先将问题从自然语言翻译成特定领域的语言,并需要三天时间来产生解决方案。

 

谷歌解释说,Gemini Deep Think 会并行生成多个备选解决方案,并在整个推理过程中修订或组合它们,以得出最佳答案。为了使这种方法可行,该模型需要一个延长的推理时间窗口,这使得它不适合交互式使用,例如在聊天中。正如谷歌所指出的,模型可能会偶尔表现出缓慢或超时问题。

 

与 Gemini 家族中的其他模型的另一个关键区别是在训练期间使用新颖的强化学习技术,这鼓励模型利用这些延长的推理路径同时测试多个假设。最后但同样重要的是,模型还可以访问一个策划的高质量数学问题解决方案语料库。

 

谷歌表示,Gemini 2.5 Deep Think 在几个基准测试上实现了最先进的性能,包括 LiveCodeBench V6 和 Humanity's Last Exam。

 


Reddit 上的早期采用者指出的一个限制是,即使是付费用户,可用的查询数量也受到了限制,最初是每天五次,后来增加到十次。一些评论者将此视为模型运行成本高昂的迹象,可能相当于同时启动大量 Gemini Pro 模型。

 

与其家族中的其他模型一样,Gemini Deep Think 遵循稀疏混合专家(MoE)架构,并原生支持文本、视觉和音频输入的原生多模态支持。它支持 100 万个 token 的输入上下文窗口和 192K 个 token 的输出窗口。

 

除了为 AI Ultra 订阅者提供的优化 Deep Think 模型外,谷歌还向研究社区发布了竞赛版本。

 

原文链接:

https://www.infoq.com/news/2025/08/gemini-2-5-deep-think/

2025-08-19 10:191

评论

发布
暂无评论
发现更多内容

ICE构建坚不可摧的交易环境

科技热闻

GeminiDB全面联动MySQL:热点数据,一键加速

华为云开发者联盟

MySQL 数据库 华为云 华为云开发者联盟 企业号2024年6月PK榜

Unity 确认参展 2024 ChinaJoy BTOB,展示应用出海增长全链路解决方案

极客天地

适用于Mac的专业EPUB阅读软件GM EPUB Reader Pro

Rose

什么是开源软件 (OSS)?

NGINX开源社区

OSS 源代码 开源软件 SBOM 开源软件的优势

万字解析 Go 官方结构化日志包 slog

江湖十年

Go 日志 log Go web #后端

信创生态+1!天谋科技与百信完成兼容性互认证

Apache IoTDB

聊聊性能指标CPU利用率如何计算的

派大星

性能指标

业务和技术,哪个更重要?

老张

技术 业务

零信任三大产品板块快速发展

芯盾时代

iam 零信任 微隔离 零信任模型 sdp

基于Python和TensorFlow实现BERT模型应用

华为云开发者联盟

人工智能 深度学习 华为云 华为云开发者联盟 企业号2024年6月PK榜

官答丨操作系统升级 Openssl 导致 GreatSQL 无法启动

GreatSQL

数据库 greatsql

ICE构建坚不可摧的交易环境

科技汇

性能测试公开课来啦!从性能测试方案到性能调优,从负载均衡到中间件测试,全方位讲解性能测试核心内容

测试人

软件测试

合成数据:解锁通用人工智能的“关键之钥”?

Baihai IDP

AI 合成数据 LLMs 企业号 6 月 PK 榜

Qt(C++)开发一款图片防盗用水印制作小工具

DS小龙哥

6 月 优质更文活动

Android网络面试题之Http1.1和Http2.0

AntDream

面试 网络 Android;

一文读懂:大数据可视化

AR玩家

大数据 可视化数据 Rokid Vision pro 炬目AR

低代码平台如何重塑项目管理:效率与创新的新边界

天津汇柏科技有限公司

项目管理 低代码

信创好搭档,企业好选择| 亚信安慧AntDB诚邀您参与企业数智化升级云端研讨会

亚信AntDB数据库

数据库 AntDB 信创产业 企业号 6 月 PK 榜 亚信安慧antdb

11年之约 聚焦上海 | 亚信科技邀您相约2024 MWC上海展

亚信AntDB数据库

AntDB MWC 企业号 6 月 PK 榜 亚信安慧antdb

OpenAI封锁中国API?天工助您一键搬家!

新消费日报

美国安腾Anton,全球最强生物计算专用超级计算机的前世今生

极客天地

1kx:如何突破预测市场的瓶颈

TechubNews

Percona Toolkit 神器全攻略(配置类)

GreatSQL

数据库 greatsql

VMware ESXi 8.0U2c macOS Unlocker & OEM BIOS Dell (戴尔) 定制版

sysin

macos esxi OEM BIOS dell

Gemini 2.5 Deep Think并行创造性解决问题_Google_Sergio De Simone_InfoQ精选文章