10 月 23 - 25 日,QCon 上海站即将召开,现在大会已开始正式报名,可以享受 8 折优惠 了解详情
写点什么

用了推理价格要贵 6 倍!谷歌“炒作最少但最有性价比”的 Gemini Flash,狠刷网友好感度

  • 2025-04-18
    北京
  • 本文字数:953 字

    阅读完需:约 3 分钟

大小:488.26K时长:02:46
用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度

今天,谷歌通过 Gemini API,在 Google AI Studio 和 Vertex AI 预览中上线了 Gemini 2.5 Flash 的早期版本。

 

Gemini 2.5 Flash 是谷歌首个完全混合式推理模型,用户可以根据需求选择是否开启“思考”功能。该模型还支持开发者设置“思考预算”,用户可以精细控制模型在思考阶段最多可生成的 token 数量,以找到质量、成本与延迟之间的最佳平衡。关闭思考功能后模型会保持 2.0 Flash 的响应速度和性能。

 

开发者使用 Gemini 2.5 Flash 的输入费用是 0.15 美元/百万 token,而输出费用则根据是否启用推理差异显著:

  • 关闭推理时,0.60 美元/百万 token;

  • 启用推理时,上升至 3.50 美元/百万 token。

 

推理输出的近六倍价格差异反映了“思考”过程的计算强度,其中模型在生成响应之前会评估多种潜在路径和考虑因素。


而“思考预算”可以在 0 到 24,576 个 token 之间调整,其作用是设置上限,而不是固定分配。谷歌表示,模型会根据任务复杂程度智能决定使用多少预算,当不需要复杂推理时,会节省资源。

性能方面,谷歌称 Gemini 2.5 Flash 在多项关键基准测试中表现出色,同时保持了比同类模型更小的规模。在被称为“人类最后的考试”(Humanity’s Last Exam)测试中,2.5 Flash 取得了 12.1% 的成绩,超过了 Anthropic 的 Claude 3.7 Sonnet(8.9%)和 DeepSeek R1(8.6%),但略低于 OpenAI 最新发布的 o4-mini(14.3%)。

 

在其他技术基准测试中,如 GPQA diamond 得分 78.3%,AIME 数学考试中,2025 年测试得分 78.0%,2024 年测试得分更高,达到 88.0%


业内人士指出,基准测试结果表明谷歌正在缩小与竞争对手的性能差距,同时保持价格优势。这对关注 AI 预算的企业客户而言,可能极具吸引力。

 


“Gemini Flash 的炒作最少,但根据我的生产经验,它具有最佳的性价比和多模态工具。谷歌正在默默地赢得人工智能竞赛。”有网友称。

 

有网友还内涵了下 OpenAI 新模型测试对比。“谷歌在其 Flash 2.5 的对比中加入了 O4-mini,真是太棒了。这款型号昨天才发布,而有些公司只跟自家的型号比较。Gemini 真不错。”


还有人分享道,“就我的体验而言,Gemini 2.5 Pro 的进步非常显著,以至于我现在都对 Google 模型整体表现有了改观。它不仅在我提供的大多数主题上都比我聪明,也不会一味地迎合我。这个模型会在适当的时候反驳我,而不是刻意扭曲自己来迎合我的观点。”

2025-04-18 14:459687

评论

发布
暂无评论

第五周-笔记

leo

极客大学架构师训练营

架构师训练营第 1 期 - 第九周作业

Todd-Lee

极客大学架构师训练营

算法讲解|贪心算法的理解与分析

Java架构师迁哥

一张图片一份文档,我想redis就到这里吧,剩下的只有实践了

小Q

Java redis 学习 编程 面试

Spring Cloud Config 实现分布式配置中心

AI乔治

Java 架构 微服务 Spring Cloud

架构师训练营第 1 期 - 第九周总结

Todd-Lee

极客大学架构师训练营

React 灵魂 23 问

局外人

Java 大前端 React

MyBatis 面试题(附答案解析)

比伯

Java 大数据 编程 架构 面试

架构师训练营第 1 期第 9 周作业

好吃不贵

极客大学架构师训练营

2021年Java程序员请先把这几项硬技能熟悉掌握,再想着跳槽拿高薪

Java架构之路

Java 编程 程序员 架构 面试

奉劝各位准备面试的Java程序员耗子尾汁,赶紧扔掉网上那些千篇一律的面试题

Java架构之路

Java 程序员 架构 面试 编程语言

MySQL 连接为什么挂死了?

Java架构师迁哥

《使用C ++的数据结构和程序设计》限时免费下载

计算机与AI

c++

并发编程Bug的源头-原子性

Java架构师迁哥

网络冲浪信任危机频发,区块链能否破局?

CECBC

区块链 征信透明

用 Python 实现定时自动化收取蚂蚁森林能量

Python小二

Python

给,你们想要的内存溢出MAT排查工具

田维常

内存溢出

LeetCode 热题 - 递归

helbing

LeetCode

Redis 分布式锁原理看这篇就够了, 循循渐进

马丁玩编程

redis 架构 分布式 分布式锁

并发编程Bug的源头-原子性

996小迁

Java 程序员 架构 面试 并发编程

架构师系列之6: python实现一致性hash

桃花原记

《ZooKeeper分布式过程协同技术详解》.pdf

田维常

电子书

Nacos实战及其源码分析

Fox666

Spring Cloud nacos spring cloud alibaba

阿里内部“新鲜出炉”手慢无!首发面试终极指南V3.0,符合一线大厂面试知识点+面试题

Java架构追梦

Java 阿里巴巴 架构 面试 分布式

第五周 - 作业

leo

极客大学架构师训练营

区块链的新信任模式将重塑传统金融业

CECBC

区块链 资产流动性

看“区块链”如何为外贸企业融资

CECBC

区块链 银行

接口的幂等性的多重考虑,你会了吗?

moon聊技术

Java 接口

接口测试之json中的key获取

测试人生路

接口测试

4年Java开发经验,从传统公司裸辞之后足足准备了3个月,终于拿到美团、京东、字节跳动等大厂offer

Java架构之路

Java 程序员 架构 面试 编程语言

五、一致性哈希算法

Geek_28b526

用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度_AI&大模型_褚杏娟_InfoQ精选文章