写点什么

用了推理价格要贵 6 倍!谷歌“炒作最少但最有性价比”的 Gemini Flash,狠刷网友好感度

  • 2025-04-18
    北京
  • 本文字数:953 字

    阅读完需:约 3 分钟

大小:488.26K时长:02:46
用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度

今天,谷歌通过 Gemini API,在 Google AI Studio 和 Vertex AI 预览中上线了 Gemini 2.5 Flash 的早期版本。

 

Gemini 2.5 Flash 是谷歌首个完全混合式推理模型,用户可以根据需求选择是否开启“思考”功能。该模型还支持开发者设置“思考预算”,用户可以精细控制模型在思考阶段最多可生成的 token 数量,以找到质量、成本与延迟之间的最佳平衡。关闭思考功能后模型会保持 2.0 Flash 的响应速度和性能。

 

开发者使用 Gemini 2.5 Flash 的输入费用是 0.15 美元/百万 token,而输出费用则根据是否启用推理差异显著:

  • 关闭推理时,0.60 美元/百万 token;

  • 启用推理时,上升至 3.50 美元/百万 token。

 

推理输出的近六倍价格差异反映了“思考”过程的计算强度,其中模型在生成响应之前会评估多种潜在路径和考虑因素。


而“思考预算”可以在 0 到 24,576 个 token 之间调整,其作用是设置上限,而不是固定分配。谷歌表示,模型会根据任务复杂程度智能决定使用多少预算,当不需要复杂推理时,会节省资源。

性能方面,谷歌称 Gemini 2.5 Flash 在多项关键基准测试中表现出色,同时保持了比同类模型更小的规模。在被称为“人类最后的考试”(Humanity’s Last Exam)测试中,2.5 Flash 取得了 12.1% 的成绩,超过了 Anthropic 的 Claude 3.7 Sonnet(8.9%)和 DeepSeek R1(8.6%),但略低于 OpenAI 最新发布的 o4-mini(14.3%)。

 

在其他技术基准测试中,如 GPQA diamond 得分 78.3%,AIME 数学考试中,2025 年测试得分 78.0%,2024 年测试得分更高,达到 88.0%


业内人士指出,基准测试结果表明谷歌正在缩小与竞争对手的性能差距,同时保持价格优势。这对关注 AI 预算的企业客户而言,可能极具吸引力。

 


“Gemini Flash 的炒作最少,但根据我的生产经验,它具有最佳的性价比和多模态工具。谷歌正在默默地赢得人工智能竞赛。”有网友称。

 

有网友还内涵了下 OpenAI 新模型测试对比。“谷歌在其 Flash 2.5 的对比中加入了 O4-mini,真是太棒了。这款型号昨天才发布,而有些公司只跟自家的型号比较。Gemini 真不错。”


还有人分享道,“就我的体验而言,Gemini 2.5 Pro 的进步非常显著,以至于我现在都对 Google 模型整体表现有了改观。它不仅在我提供的大多数主题上都比我聪明,也不会一味地迎合我。这个模型会在适当的时候反驳我,而不是刻意扭曲自己来迎合我的观点。”

2025-04-18 14:459427

评论

发布
暂无评论

百度文心大模型4.0正加紧训练,即将发布

阿Q说代码

大模型训练 大模型 百度文心

DevOps|研发效能解决的是企业效率问题

laofo

DevOps cicd 研发效能 持续交付 效能度量

网络文件安全共享工具Dropshare 5免激活最新版

胖墩儿不胖y

Mac软件

如何利用动态配置中心在JavaAgent中实现微服务的多样化治理

华为云开源

云原生 微服务治理

Spring扩展-自定义标签

陷入企业ERP管理困境?这些才是破局密码

YG科技

关于A/B 测试系统的基本知识

QE_LAB

A/B 测试 测试技术

小间距led显示屏型号主要有哪几种?有什么优势?

Dylan

显示器 LED显示屏 led显示屏厂家

ICCV 2023 | 当尺度感知调制遇上Transformer,会碰撞出怎样的火花?

阿里云大数据AI技术

人工智能

飞桨大模型套件:一站式体验,性能极致,生态兼容

飞桨PaddlePaddle

nlp 大模型 套件 大语言模型

运维 | 解决 CentOS 终端主机名显示-bash-4.2 问题

Appleex

centos 运维

图文结合丨Prometheus+Grafana+GreatSQL性能监控系统搭建指南(上)

GreatSQL

greatsql

Groovy初学者指南

Java随想录

Java Groovy

亚马逊收购Anthropic,意在切断英伟达的芯片垄断

B Impact

C++ 使用getline()从文件中读取一行字符串

芯动大师

Flux.never是什么

0x5d0de9

Java WebFlux SpringWebflux

ARTS-WEEK8(23.10.1-23.10.6)

Echo!!!

基于 ACK Fluid 的混合云优化数据访问(一):场景与架构

阿里巴巴云原生

阿里云 容器 云原生 混合云 ACK

数据库:定义、历史及分类

Frank

OpenTiny 系列产品 TinyEngine 低代码引擎在 HC 大会正式宣布开源~(源码已开放)

OpenTiny社区

开源 前端 低代码

深度学习算法:从模仿到创造

小魏写代码

监控分析工具比较 (Zipkin, Skywalking, Pinpoint, CAT)

周晓宁

用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度_AI&大模型_褚杏娟_InfoQ精选文章