10 月 23 - 25 日,QCon 上海站即将召开,9折优惠最后2天 了解详情
写点什么

Gemini 2.5 Deep Think 并行创造性解决问题

  • 2025-08-19
    北京
  • 本文字数:930 字

    阅读完需:约 3 分钟

大小:445.75K时长:02:32
Gemini 2.5 Deep Think并行创造性解决问题

作为谷歌 AI Ultra 订阅的一部分,Gemini 2.5 Deep Think是一个旨在通过使用并行思维技术并延长推理时间来解决创造性问题的模型。

 

根据谷歌的说法,Deep Think 旨在更好地解决需要创造力、战略规划和逐步方法的问题。这些问题包括迭代开发和设计、科学和数学发现以及算法开发。

 

目前可用的模型是 Deep Think 模型的改进和优化版本,该模型在2025年国际数学奥林匹克竞赛(IMO)中获得了金牌

 

Gemini Deep Think 的一个高级版本完美解决了六道 IMO 问题中的五道,总共获得了 35 分,达到了金牌水平。解决方案可以在网上找到。

 

谷歌解释道,这种变体可能需要数小时来推理复杂的问题,而新的版本则为了速度牺牲了一些推理深度,使其更适合日常使用。谷歌特别强调了他们自 2024 年 IMO 竞赛以来取得的进步,当时他们的 AlphaProof 和 AlphaGeometry 模型需要专家先将问题从自然语言翻译成特定领域的语言,并需要三天时间来产生解决方案。

 

谷歌解释说,Gemini Deep Think 会并行生成多个备选解决方案,并在整个推理过程中修订或组合它们,以得出最佳答案。为了使这种方法可行,该模型需要一个延长的推理时间窗口,这使得它不适合交互式使用,例如在聊天中。正如谷歌所指出的,模型可能会偶尔表现出缓慢或超时问题。

 

与 Gemini 家族中的其他模型的另一个关键区别是在训练期间使用新颖的强化学习技术,这鼓励模型利用这些延长的推理路径同时测试多个假设。最后但同样重要的是,模型还可以访问一个策划的高质量数学问题解决方案语料库。

 

谷歌表示,Gemini 2.5 Deep Think 在几个基准测试上实现了最先进的性能,包括 LiveCodeBench V6 和 Humanity's Last Exam。

 


Reddit 上的早期采用者指出的一个限制是,即使是付费用户,可用的查询数量也受到了限制,最初是每天五次,后来增加到十次。一些评论者将此视为模型运行成本高昂的迹象,可能相当于同时启动大量 Gemini Pro 模型。

 

与其家族中的其他模型一样,Gemini Deep Think 遵循稀疏混合专家(MoE)架构,并原生支持文本、视觉和音频输入的原生多模态支持。它支持 100 万个 token 的输入上下文窗口和 192K 个 token 的输出窗口。

 

除了为 AI Ultra 订阅者提供的优化 Deep Think 模型外,谷歌还向研究社区发布了竞赛版本。

 

原文链接:

https://www.infoq.com/news/2025/08/gemini-2-5-deep-think/

2025-08-19 10:194595

评论

发布
暂无评论
发现更多内容

在线英文名随机生成器

入门小站

工具

14 K8S之对外访问容器服务

穿过生命散发芬芳

k8s 11月日更

微服务中台技术之延迟中心实践

小江

Java redis kafka 延时队列

再见了,纸币!数字人民币,席卷而来

CECBC

设计消息队列存储消息数据的 MySQL 表格

缘分呐

架构实战营 - 模块八作业

Alex.Wu

模块三作业:学生管理系统架构设计文档

赵先生

架构实战营

linux之ClamAV杀毒软件安装配置

入门小站

Linux

架构实战营 - 模块八作业

en

#架构实战营

和12岁小同志搞创客开发:手撕代码,做一款声控灯

不脱发的程序猿

少儿编程 DIY 传感器 创客开发 Arduino

模块三作业

忘记喝水的猫

架构训练营

Go语言,定时器的使用

微客鸟窝

Go 语言 11月日更

低碳企业和个人如何参与碳交易市场?

石云升

碳中和 11月日更 碳交易

如何使用 Prometheus Kafka Adapter 向 Kafka 推送 Prometheus 数据

耳东@Erdong

kafka Prometheus Adapter 11月日更

进击的Java(六)

ES_her0

11月日更

对于排序号中参数值的校验

卢卡多多

参数校验 11月日更

无处不在的 Kubernetes,难用的问题解决了吗?

阿里巴巴云原生

阿里云 Kubernetes 容器 云原生 难题攻克

模块三课后作业 - 详细架构设计文档 - 外包学生管理系统

渐行渐远

架构实战营

模块三作业

周文

「架构实战营」

【Promise 源码学习】第七篇 - 实现 Promise 返回值 x 的处理

Brave

源码 Promise 11月日更

《PyTorch深度学习实战》复习之环境搭建

IT蜗壳-Tango

11月日更

Android C++系列:JNI中的线程操作

轻口味

c++ android jni 11月日更

模块三作业

lxz

【LeetCode】键值映射Java题解

Albert

算法 LeetCode 11月日更

基于Serverless的测试服务化-理论篇

刘冉

软件测试 自动化测试 测试服务化

PS 基础操作 - 文件格式和存储

hepingfly【gzh:和平本记】

ps教程 ps学习笔记

PS 基础操作 - 缩放、抓手、移动工具

hepingfly【gzh:和平本记】

ps教程 ps学习笔记

.NET6新东西--CallerArgumentExpression

喵叔

11月日更

架构营模块三作业

GTiger

架构实战营

Golang Gin 框架入门介绍(一)

liuzhen007

11月日更

自动化前端页面性能测试介绍

刘冉

大前端 软件测试 性能测试 软件自动化测试

Gemini 2.5 Deep Think并行创造性解决问题_Google_Sergio De Simone_InfoQ精选文章