写点什么

用了推理价格要贵 6 倍!谷歌“炒作最少但最有性价比”的 Gemini Flash,狠刷网友好感度

  • 2025-04-18
    北京
  • 本文字数:953 字

    阅读完需:约 3 分钟

大小:488.26K时长:02:46
用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度

今天,谷歌通过 Gemini API,在 Google AI Studio 和 Vertex AI 预览中上线了 Gemini 2.5 Flash 的早期版本。

 

Gemini 2.5 Flash 是谷歌首个完全混合式推理模型,用户可以根据需求选择是否开启“思考”功能。该模型还支持开发者设置“思考预算”,用户可以精细控制模型在思考阶段最多可生成的 token 数量,以找到质量、成本与延迟之间的最佳平衡。关闭思考功能后模型会保持 2.0 Flash 的响应速度和性能。

 

开发者使用 Gemini 2.5 Flash 的输入费用是 0.15 美元/百万 token,而输出费用则根据是否启用推理差异显著:

  • 关闭推理时,0.60 美元/百万 token;

  • 启用推理时,上升至 3.50 美元/百万 token。

 

推理输出的近六倍价格差异反映了“思考”过程的计算强度,其中模型在生成响应之前会评估多种潜在路径和考虑因素。


而“思考预算”可以在 0 到 24,576 个 token 之间调整,其作用是设置上限,而不是固定分配。谷歌表示,模型会根据任务复杂程度智能决定使用多少预算,当不需要复杂推理时,会节省资源。

性能方面,谷歌称 Gemini 2.5 Flash 在多项关键基准测试中表现出色,同时保持了比同类模型更小的规模。在被称为“人类最后的考试”(Humanity’s Last Exam)测试中,2.5 Flash 取得了 12.1% 的成绩,超过了 Anthropic 的 Claude 3.7 Sonnet(8.9%)和 DeepSeek R1(8.6%),但略低于 OpenAI 最新发布的 o4-mini(14.3%)。

 

在其他技术基准测试中,如 GPQA diamond 得分 78.3%,AIME 数学考试中,2025 年测试得分 78.0%,2024 年测试得分更高,达到 88.0%


业内人士指出,基准测试结果表明谷歌正在缩小与竞争对手的性能差距,同时保持价格优势。这对关注 AI 预算的企业客户而言,可能极具吸引力。

 


“Gemini Flash 的炒作最少,但根据我的生产经验,它具有最佳的性价比和多模态工具。谷歌正在默默地赢得人工智能竞赛。”有网友称。

 

有网友还内涵了下 OpenAI 新模型测试对比。“谷歌在其 Flash 2.5 的对比中加入了 O4-mini,真是太棒了。这款型号昨天才发布,而有些公司只跟自家的型号比较。Gemini 真不错。”


还有人分享道,“就我的体验而言,Gemini 2.5 Pro 的进步非常显著,以至于我现在都对 Google 模型整体表现有了改观。它不仅在我提供的大多数主题上都比我聪明,也不会一味地迎合我。这个模型会在适当的时候反驳我,而不是刻意扭曲自己来迎合我的观点。”

2025-04-18 14:4510064

评论

发布
暂无评论

大数据-57 Kafka 高级特性 Producer 消息发送流程与核心配置详解

武子康

Java 大数据 kafka 分布式 后端

大庆等保测评:助力企业数字化转型行稳致远

等保测评

民航领域数据分类分级怎么做?|《民航领域数据分类分级要求》标准解读

原点安全

SILENTTRINITY最新部署指南:现代C2框架快速搭建

qife122

渗透测试 红队工具

ARM物联网漏洞利用实验室在Blackhat USA 2017首次亮相

qife122

ARM漏洞利用 二进制漏洞开发

如何安装CST的Linux版本

思茂信息

cst CST软件 CST Studio Suite

构建 AI 护城河的六大常见误区分析

Baihai IDP

人工智能 AI LLM 人工智能护城河

工具分享-通过开源工具 tuning-primer快速巡检MySQL5.7

GreatSQL

2025年国内智能锁十大品牌排名分析

新消费日报

Apache RocketMQ for AI 战略升级,开启 AI MQ 新时代

阿里巴巴云原生

阿里云 AI 云原生 Apache RocketMQ

2025大语言模型部署实战指南:个人笔记本到企业级服务的全栈方案

测试人

IK 字段级别词典的升级之路

极限实验室

ik easysearch

MoveIt Transfer漏洞引发更多受害者数据泄露,联邦机构也未能幸免

qife122

网络安全 数据泄露

当当网商品详情API响应数据解析

tbapi

当当网API 当当网数据采集 当当网商品详情API

解构 Coze Studio:DDD 与整洁架构的 Go 语言最佳实践

十三Tech

DDD 构架 Coze开源

李锦记 x 赛博威 | 共酿调味品行业营销费用管理新典范

赛博威科技

营销费用管理 赛博威 李锦记

告别人工误差与效率瓶颈:智能仓储助力烟草企业实现精益化管理

中烟创新

区块链U卡APP外包开发成本

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

Web3 项目外包开发成本估算方法

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

用1分钟“招”了个AI同事,我在WAIC整顿职场

脑极体

AI

哈尔滨三级等保测评:关键信息系统的坚固铠甲

等保测评

北京理工大学医工交叉教学实践分享(2)|如何利用知识图谱工具实施教学

ModelWhale

知识图谱 AI教育 北京理工大学

a+b=c,处理器一步搞定,Java虚拟机为啥要四步?

poemyang

Java虚拟机

前瞻与回顾:长期个性化对话代理的反射式记忆管理技术

qife122

强化学习 对话系统

哈尔滨等保测评:为城市数字化筑牢安全根基

等保测评

区块链U卡APP外包的项目管理

北京木奇移动技术有限公司

软件外包公司 web3开发 区块链外包

告别缓存击穿!Go 语言中的防并发神器:singleflight 包深度解析

左诗右码

「迁移急救包」全云平台无缝迁移云效实操手册

阿里巴巴云原生

阿里云 云原生 云效

区块链U卡APP外包开发

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

阿里云联合信通院发布《面向LLM应用的可观测性能力要求》

阿里巴巴云原生

阿里云 云原生 LLM

用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度_AI&大模型_褚杏娟_InfoQ精选文章