写点什么

用了推理价格要贵 6 倍!谷歌“炒作最少但最有性价比”的 Gemini Flash,狠刷网友好感度

  • 2025-04-18
    北京
  • 本文字数:953 字

    阅读完需:约 3 分钟

大小:488.26K时长:02:46
用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度

今天,谷歌通过 Gemini API,在 Google AI Studio 和 Vertex AI 预览中上线了 Gemini 2.5 Flash 的早期版本。

 

Gemini 2.5 Flash 是谷歌首个完全混合式推理模型,用户可以根据需求选择是否开启“思考”功能。该模型还支持开发者设置“思考预算”,用户可以精细控制模型在思考阶段最多可生成的 token 数量,以找到质量、成本与延迟之间的最佳平衡。关闭思考功能后模型会保持 2.0 Flash 的响应速度和性能。

 

开发者使用 Gemini 2.5 Flash 的输入费用是 0.15 美元/百万 token,而输出费用则根据是否启用推理差异显著:

  • 关闭推理时,0.60 美元/百万 token;

  • 启用推理时,上升至 3.50 美元/百万 token。

 

推理输出的近六倍价格差异反映了“思考”过程的计算强度,其中模型在生成响应之前会评估多种潜在路径和考虑因素。


而“思考预算”可以在 0 到 24,576 个 token 之间调整,其作用是设置上限,而不是固定分配。谷歌表示,模型会根据任务复杂程度智能决定使用多少预算,当不需要复杂推理时,会节省资源。

性能方面,谷歌称 Gemini 2.5 Flash 在多项关键基准测试中表现出色,同时保持了比同类模型更小的规模。在被称为“人类最后的考试”(Humanity’s Last Exam)测试中,2.5 Flash 取得了 12.1% 的成绩,超过了 Anthropic 的 Claude 3.7 Sonnet(8.9%)和 DeepSeek R1(8.6%),但略低于 OpenAI 最新发布的 o4-mini(14.3%)。

 

在其他技术基准测试中,如 GPQA diamond 得分 78.3%,AIME 数学考试中,2025 年测试得分 78.0%,2024 年测试得分更高,达到 88.0%


业内人士指出,基准测试结果表明谷歌正在缩小与竞争对手的性能差距,同时保持价格优势。这对关注 AI 预算的企业客户而言,可能极具吸引力。

 


“Gemini Flash 的炒作最少,但根据我的生产经验,它具有最佳的性价比和多模态工具。谷歌正在默默地赢得人工智能竞赛。”有网友称。

 

有网友还内涵了下 OpenAI 新模型测试对比。“谷歌在其 Flash 2.5 的对比中加入了 O4-mini,真是太棒了。这款型号昨天才发布,而有些公司只跟自家的型号比较。Gemini 真不错。”


还有人分享道,“就我的体验而言,Gemini 2.5 Pro 的进步非常显著,以至于我现在都对 Google 模型整体表现有了改观。它不仅在我提供的大多数主题上都比我聪明,也不会一味地迎合我。这个模型会在适当的时候反驳我,而不是刻意扭曲自己来迎合我的观点。”

2025-04-18 14:4510338

评论

发布
暂无评论

阿里P8整理的新版手抄本,所有Java知识操作

钟奕礼

Java java程序员 java面试 java编程

让 Serverless 更普惠,阿里云函数计算 FC 宣布全面降价,最大幅度达 37.5%

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

Wallys/DR7915/MT7915/MT7975/industrial mini pcie card 2T2R

Cindy-wallys

MT7915 MT7975 / 2.4G&5G

FAQ是什么?该如何编辑FAQ?

Baklib

Apisix网关快速入门实践

IT巅峰技术

MyBatis 延迟加载代码详解

千锋IT教育

让 Serverless 更普惠,阿里云函数计算 FC 宣布全面降价,最大幅度达 37.5%

Serverless Devs

阿里云 Serverless

前端leetcde算法面试套路之回溯

js2030code

JavaScript LeetCode

如何通过Java代码给Word文档添加水印?

在下毛毛雨

Java word 水印

3.1版本【HarmonyOS 第一课】正式上线!参与学习赢官方好礼>>

HarmonyOS开发者

HarmonyOS

银行APP用户体验外滩峰会圆满落幕!易观分析赋能用户体验体系,助力体验提升

易观分析

App 银行 易观

PHP反序列化漏洞解析

网络安全学海

网络安全 安全 信息安全 渗透测试 漏洞挖掘

5分钟实现「视频检索」:基于内容理解,无需任何标签

Zilliz

人工智能 Towhee 视频检索

信息论与编码:信道编码的基本概念

timerring

11月月更 信息论

适合小白Web前端入门JS基础知识梳理汇总

千锋IT教育

开源共建 | Dinky 扩展批流统一数据集成框架 ChunJun 的实践分享

袋鼠云数栈

如何做好成熟完整的企业团队知识管理?

Baklib

团队管理 知识管理

用javascript分类刷leetcode3.动态规划(图文视频讲解)

js2030code

JavaScript LeetCode

Spring Bean的生命周期(详细解读)

千锋IT教育

日志异常检测准确率低?一文掌握日志指标序列分类

云智慧AIOps社区

深度学习 日志分析 时间序列 指标预测 日志异常

为什么你的敏捷总是不成功?

敏捷开发

【计算讲谈社】第十二讲|数据中心那些事儿

大咖说

数据中心 碳中和

Baklib知识分享 | 搭建企业在线帮助中心的最佳攻略

Baklib

【案例】数字化浪潮中,云科通明湖如何助力能源行业弯道超车?

通明湖

负载均衡

mysql经典面试题

@下一站

MySQL 编程 dba 11月月更

《大厂面试》之JVM篇21问与答

钟奕礼

Java java程序员 java面试 java编程

深度解读|NebulaGraph x 阿里云计算巢,云上构建超大规模图数据库

阿里云弹性计算

图数据库 计算巢

Wallys/ industrial mini pcie card/2x 2 5G /High power Radio card

Cindy-wallys

QCA9882 2x 2 5G high power

Linux之用户管理、权限管理、程序安装卸载

C++后台开发

Linux 后端开发 linux开发 Linux服务器开发 C++开发

国标解读|从关键信息基础设施安全国标看软件供应链安全

墨菲安全

SBOM 软件供应链安全

调用链路上千条,如何观测 Nacos 的运行状态

阿里巴巴云原生

阿里云 微服务 云原生 naocs

用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度_AI&大模型_褚杏娟_InfoQ精选文章