写点什么

Gemini 2.5 Deep Think 并行创造性解决问题

  • 2025-08-19
    北京
  • 本文字数:930 字

    阅读完需:约 3 分钟

大小:445.75K时长:02:32
Gemini 2.5 Deep Think并行创造性解决问题

作为谷歌 AI Ultra 订阅的一部分,Gemini 2.5 Deep Think是一个旨在通过使用并行思维技术并延长推理时间来解决创造性问题的模型。

 

根据谷歌的说法,Deep Think 旨在更好地解决需要创造力、战略规划和逐步方法的问题。这些问题包括迭代开发和设计、科学和数学发现以及算法开发。

 

目前可用的模型是 Deep Think 模型的改进和优化版本,该模型在2025年国际数学奥林匹克竞赛(IMO)中获得了金牌

 

Gemini Deep Think 的一个高级版本完美解决了六道 IMO 问题中的五道,总共获得了 35 分,达到了金牌水平。解决方案可以在网上找到。

 

谷歌解释道,这种变体可能需要数小时来推理复杂的问题,而新的版本则为了速度牺牲了一些推理深度,使其更适合日常使用。谷歌特别强调了他们自 2024 年 IMO 竞赛以来取得的进步,当时他们的 AlphaProof 和 AlphaGeometry 模型需要专家先将问题从自然语言翻译成特定领域的语言,并需要三天时间来产生解决方案。

 

谷歌解释说,Gemini Deep Think 会并行生成多个备选解决方案,并在整个推理过程中修订或组合它们,以得出最佳答案。为了使这种方法可行,该模型需要一个延长的推理时间窗口,这使得它不适合交互式使用,例如在聊天中。正如谷歌所指出的,模型可能会偶尔表现出缓慢或超时问题。

 

与 Gemini 家族中的其他模型的另一个关键区别是在训练期间使用新颖的强化学习技术,这鼓励模型利用这些延长的推理路径同时测试多个假设。最后但同样重要的是,模型还可以访问一个策划的高质量数学问题解决方案语料库。

 

谷歌表示,Gemini 2.5 Deep Think 在几个基准测试上实现了最先进的性能,包括 LiveCodeBench V6 和 Humanity's Last Exam。

 


Reddit 上的早期采用者指出的一个限制是,即使是付费用户,可用的查询数量也受到了限制,最初是每天五次,后来增加到十次。一些评论者将此视为模型运行成本高昂的迹象,可能相当于同时启动大量 Gemini Pro 模型。

 

与其家族中的其他模型一样,Gemini Deep Think 遵循稀疏混合专家(MoE)架构,并原生支持文本、视觉和音频输入的原生多模态支持。它支持 100 万个 token 的输入上下文窗口和 192K 个 token 的输出窗口。

 

除了为 AI Ultra 订阅者提供的优化 Deep Think 模型外,谷歌还向研究社区发布了竞赛版本。

 

原文链接:

https://www.infoq.com/news/2025/08/gemini-2-5-deep-think/

2025-08-19 10:194930

评论

发布
暂无评论
发现更多内容

深入浅出虚拟内存

泰伦卢

c c++ C#

回"疫"录(10):危机与希望

小天同学

疫情 回忆录 现实纪录 纪实

聊聊Redis SDS

huizhou92

redis

想看懂stl代码,先搞定type_traits是关键

泰伦卢

c c++ C#

作为自由职业者,我的近况

一尘观世界

程序员 自由职业 复盘

go 怎样做 stw

huizhou92

Go 语言

DDD 实践手册(5. Factory 与 Repository)

Joshua

企业架构 设计模式 领域驱动设计 DDD 架构模式

C++中glog源码剖析以及如何设计一个高效 log模块

泰伦卢

c c++ C#

Java并发编程基础--Java内存模型

Java收录阁

Netty 源码解析(八): 回到 Channel 的 register 操作

猿灯塔

时间足够爱你

rmrf

学习 思考 持之以恒

理解go 的 sort

huizhou92

Go 语言

未完成乞丐版 Args

escray

学习 CSD 认证实战营

Java并发编程--ReentrantLock

Java收录阁

并发编程

C++ sqlite3使用指南

泰伦卢

c c++ C#

数据湖引擎是什么鬼

数据社

大数据 数据仓库 数据湖 数据架构

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (三)单元测试在整个测试体系中的位置

编程道与术

软件测试 TDD 单元测试 集成测试 验收测试

架构师快问快答2

IT民工大叔

自助设备系列——增长点

孙苏勇

产品 行业资讯 智能设备

游戏开发通用技术和工具

波波

编程 游戏开发 H5游戏

电脑城最简单骗局,仍然有无数人上当

周三不加班

电脑城 电脑选购

程序员• 后浪

古时的风筝

程序员 后浪

无所不能 就像妈妈一样

Neco.W

思考 情绪

MacOS高效使用指南-我的体系化方案以及软件清单

lmymirror

高效工作 效率工具 知识管理 Mac 操作系统

关于 WordPress-Automatic 的分布式办公实践

刘培培

分布式办公 远程办公

和孩子聊聊死亡

陈医僧Ethan

感悟 育儿

程序员《后浪》-图文版

Java_若依框架教程

后浪 程序媛 娱乐

每日算法之leetcode 50 Power

田镇珲

递归 LeetCode 分治

Redis学习笔记(列表类型)

编程随想曲

redis

工作感悟随笔

程序员小岑

感悟

Web百度离线地图开发

玏佾

WebGIS 离线地图 Web离线地图

Gemini 2.5 Deep Think并行创造性解决问题_Google_Sergio De Simone_InfoQ精选文章