写点什么

用了推理价格要贵 6 倍!谷歌“炒作最少但最有性价比”的 Gemini Flash,狠刷网友好感度

  • 2025-04-18
    北京
  • 本文字数:953 字

    阅读完需:约 3 分钟

大小:488.26K时长:02:46
用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度

今天,谷歌通过 Gemini API,在 Google AI Studio 和 Vertex AI 预览中上线了 Gemini 2.5 Flash 的早期版本。

 

Gemini 2.5 Flash 是谷歌首个完全混合式推理模型,用户可以根据需求选择是否开启“思考”功能。该模型还支持开发者设置“思考预算”,用户可以精细控制模型在思考阶段最多可生成的 token 数量,以找到质量、成本与延迟之间的最佳平衡。关闭思考功能后模型会保持 2.0 Flash 的响应速度和性能。

 

开发者使用 Gemini 2.5 Flash 的输入费用是 0.15 美元/百万 token,而输出费用则根据是否启用推理差异显著:

  • 关闭推理时,0.60 美元/百万 token;

  • 启用推理时,上升至 3.50 美元/百万 token。

 

推理输出的近六倍价格差异反映了“思考”过程的计算强度,其中模型在生成响应之前会评估多种潜在路径和考虑因素。


而“思考预算”可以在 0 到 24,576 个 token 之间调整,其作用是设置上限,而不是固定分配。谷歌表示,模型会根据任务复杂程度智能决定使用多少预算,当不需要复杂推理时,会节省资源。

性能方面,谷歌称 Gemini 2.5 Flash 在多项关键基准测试中表现出色,同时保持了比同类模型更小的规模。在被称为“人类最后的考试”(Humanity’s Last Exam)测试中,2.5 Flash 取得了 12.1% 的成绩,超过了 Anthropic 的 Claude 3.7 Sonnet(8.9%)和 DeepSeek R1(8.6%),但略低于 OpenAI 最新发布的 o4-mini(14.3%)。

 

在其他技术基准测试中,如 GPQA diamond 得分 78.3%,AIME 数学考试中,2025 年测试得分 78.0%,2024 年测试得分更高,达到 88.0%


业内人士指出,基准测试结果表明谷歌正在缩小与竞争对手的性能差距,同时保持价格优势。这对关注 AI 预算的企业客户而言,可能极具吸引力。

 


“Gemini Flash 的炒作最少,但根据我的生产经验,它具有最佳的性价比和多模态工具。谷歌正在默默地赢得人工智能竞赛。”有网友称。

 

有网友还内涵了下 OpenAI 新模型测试对比。“谷歌在其 Flash 2.5 的对比中加入了 O4-mini,真是太棒了。这款型号昨天才发布,而有些公司只跟自家的型号比较。Gemini 真不错。”


还有人分享道,“就我的体验而言,Gemini 2.5 Pro 的进步非常显著,以至于我现在都对 Google 模型整体表现有了改观。它不仅在我提供的大多数主题上都比我聪明,也不会一味地迎合我。这个模型会在适当的时候反驳我,而不是刻意扭曲自己来迎合我的观点。”

2025-04-18 14:4510439

评论

发布
暂无评论

超强版干货投递!Milvus 的部署心得、运维秘籍都在这里了!

Zilliz

Milvus Zilliz ChatGPT LLM zillizcloud

从零到跑通TPC-H:如何快速实现查询计划

MatrixOrigin

分布式数据库 MatrixOrigin MatrixOne TPC-H

景区共享电单车如何投放?投放意义?

共享电单车厂家

共享电动车厂家 景区共享电单车 共享电单车投放

TiDB迁移、升级与案例分享(TiDB v4.0.11 → v6.5.1)

TiDB 社区干货传送门

迁移 版本升级 安装 & 部署 扩/缩容 6.x 实践

微服务 - 注册中心和配置中心(Consul)

Java 微服务 注册中心 配置中心

maya软件在建模上有什么优势?

Finovy Cloud

maya 3D软件

【Linux】之创建普通用户并禁止root用户远程登陆

A-刘晨阳

Linux 三周年连更 用户名

PCB阻焊桥存在的DFM(可制造性)问题,华秋一文告诉你

华秋电子

阿里大牛纯手写的微服务入门笔记,从基础到进阶直接封神

Java 微服务 spring cloud alibaba

多元融合成为音视频技术发展新风向

中关村科金

实时音视频 监管合规

保险行业如何将质检覆盖率从5%提升至100%?

中关村科金

保险 智能质检

即时通讯系统为什么选择GaussDB(for Redis)?

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

python正则 | python小知识

AIWeker

Python python小知识 三周年连更

物联网常见协议之Amqp协议及使用场景解析

华为云开发者联盟

后端 物联网 华为云 华为云开发者联盟 企业号 4 月 PK 榜

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB 社区干货传送门

版本测评

谷歌 Chrome 正式发布 WebGPU!Orillusion开源倒计时!

Orillusion

开源 WebGL 元宇宙 web3d #WebGPU

AIGC的阿克琉斯之踵

华为云开发者联盟

人工智能 AI 华为云 华为云开发者联盟 企业号 4 月 PK 榜

4 月 25 日直播预告 | 深入解读 Flink 1.17

Apache Flink

大数据 flink 实时计算

即时通讯技术文集(第13期):Web端即时通讯技术精华合集 [共15篇]

JackJiang

网络编程 即时通讯 IM

免费领取 | ONES 联合中国信通院发布《中国企业软件研发管理白皮书》

万事ONES

Neuron 2.4.0发布:体验下一代工业物联网连接和管理

EMQ映云科技

UI 物联网 IoT neuron 企业号 4 月 PK 榜

OneNote 2019 for Mac 中文版附激活工具

真大的脸盆

Mac Mac 软件 笔记应用

GitHub星标48k!蚂蚁金服开源的这份SpringBoot笔记

Java spring Spring Boot 框架

云上数据变革:Databend Cloud 正式发布

Databend

tidb-loadbalance 客户端方式软负载均衡配置实践

TiDB 社区干货传送门

数据库架构设计 数据库连接

WordPress 使用 TiDB Cloud 替换 MySQL

TiDB 社区干货传送门

迁移 实践案例 版本测评 应用适配

面试官:Redis有什么持久化策略?

Java redis 缓存 面试 持久化

用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度_AI&大模型_褚杏娟_InfoQ精选文章