写点什么

谷歌发布 AI 模型 MedGemma,用于医学领域的文本和图像理解

作者:Robert Krzaczyński

  • 2025-06-04
    北京
  • 本文字数:1001 字

    阅读完需:约 3 分钟

大小:501.23K时长:02:51
谷歌发布AI模型MedGemma,用于医学领域的文本和图像理解

谷歌发布 MedGemma,一对开源的生成式 AI 模型,旨在支持医疗保健应用中的医学文本和图像理解。这些模型基于 Gemma 3 架构,提供两种配置:MedGemma 4B,一个能够处理图像和文本的多模态模型,以及 MedGemma 27B,一个专注于医学文本的大模型。


谷歌表示,这些模型专为助力放射学报告生成、临床总结、患者分流以及一般医学问题解答等任务而设计。MedGemma 4B 基于广泛去识别化医学图像进行预训练,涵盖胸部 X 光、皮肤科照片、组织病理学幻灯片以及眼科图像等多种类型。两种模型均以开放许可的形式提供,可用于研究和开发,并提供预训练及指令调整的版本。


谷歌强调,尽管 MedGemma 模型具备诸多先进能力,但它们并非为直接应用于临床而设计,未经进一步验证和调整,不应直接用于临床实践。这些模型的定位是为开发人员提供一个基础框架,开发人员可以在此基础上,根据具体的医疗应用场景对模型进行针对性的调整和微调。


一些早期测试者已经分享了他们对模型优势和局限性的观察。临床医生兼人工智能从业者 Vikas Gaur 使用一位确诊患有结核病的患者的胸部 X 光测试了 MedGemma 4B-it 模型。他发现 ,模型生成了正常的解读,却遗漏了临床明显的疾病迹象:


尽管该病例存在明确的结核病迹象,但 MedGemma 却给出了“胸部 X 光正常,心脏大小在正常范围内,肺部扩张良好且清晰”的诊断结果


Gaur 认为,通过增加高质量标注数据的训练,或许能够让模型的输出结果更贴合临床预期。

此外,生物医学工程师 Mohammad Zakaria Rajabi 表示,他十分期待将 27B 大模型的功能扩展到图像处理上:


我们急切期待看到 MedGemma 27B 支持图像分析。


技术文档显示,这些模型已在超过 22 个数据集上进行了评估,这些数据集覆盖了多种医学任务和成像模态。用于训练的公共数据集包括 MIMIC-CXRSlake-VQAPAD-UFES-20 等。此外,在获得许可或许可参与者的同意后,还使用了多个专有数据集和内部数据集。


这些模型可以通过提示词工程、微调以及使用 Gemini 生态系统的其他工具与智能体系统集成等技术进行调整。不过模型性能可能会因提示词结构的不同而有所差异,而且这些模型尚未针对多轮对话或多图像输入能力进行过评估。


MedGemma 为医学人工智能的研究和开发提供了一个便捷的基础框架,不过在实际应用中的表现将取决于其在特定临床或操作环境中的验证、微调以及整合程度。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


查看英文原文https://www.infoq.com/news/2025/05/google-medgemma/

2025-06-04 11:004286

评论

发布
暂无评论

又一个开源第一!飞桨联合百舸,Stable Diffusion推理速度遥遥领先

百度Geek说

人工智能 开源 PaddlePaddle 企业号 3 月 PK 榜

BSN-DDC基础网络详解(五):接入DDC网络(1)

BSN研习社

基于 Istio 的灰度发布架构方案实践之路

京东科技开发者

微服务 istio 灰度发布 企业号 3 月 PK 榜

国家基础学科公共科学数据中心与和鲸科技共建数据社区

ModelWhale

数据 科学分析 社区 合作

FinOps首次超越安全成为企业头等大事|云计算趋势报告

SEAL安全

云计算 云成本 FinOps 企业号 3 月 PK 榜

Spring Boot或Spring Cloud快速实现文件上传

Java Spring Cloud Spring Boot

Spring源码分析-BeanFactoryPostProcessor

Java spring spring源码

GitHub险崩盘,竟是因网易大牛「Redis应用与深度实践笔记」泄露

Java 数据库 redis 缓存 面试

TIDB升级发生故障时,快速强行回退方案

TiDB 社区干货传送门

实践案例

坚如磐石:TiDB 基于时间点的恢复(PiTR)特性优化之路丨6.5 新特性解析

TiDB 社区干货传送门

新版本/特性解读

坏了!面试官问我垃圾回收机制

Java JVM 垃圾回收

PCB焊盘设计应掌握哪些要素?

华秋电子

通过TiDB Operator为已有TiDB集群部署异构集群

TiDB 社区干货传送门

集群管理 管理与运维 故障排查/诊断 安装 & 部署 扩/缩容

物理机安装 TiKV 时 RAID 卡在线配置方式

TiDB 社区干货传送门

实践案例 集群管理 安装 & 部署

脚本调用工具:FastScripts 直装版

真大的脸盆

Mac 脚本 Mac 软件 Mac 系统

NebulaGraph:打造灵活弹性的云原生图数据库,与阿里云计算巢共同拥抱开放生态

云布道师

数据库 阿里云

MQTT 5.0连接属性

EMQ映云科技

物联网 IoT mqtt 企业号 3 月 PK 榜 连接属性

通过Chaos-Mesh打造更稳定TiDB数据库高可用架构(一)

TiDB 社区干货传送门

实践案例 集群管理 管理与运维 扩/缩容 数据库架构设计

通过Chaos-Mesh打造更稳定TiDB数据库高可用架构(二)

TiDB 社区干货传送门

实践案例 集群管理 管理与运维 故障排查/诊断 安装 & 部署

手把手教你基于luatos的4G(LTE Cat.1)模组接入华为云物联网平台

华为云开发者联盟

物联网 华为云 华为云开发者联盟 企业号 3 月 PK 榜 4G

「 项目管理 」项目立项前需要思考的9个问题

小刘学编程

项目管理 pmp 项目经理

【信创小知识】国产化和信创是一回事吗?怎么理解?

行云管家

信创 国产化

【征文大赛】TiDB 社区第二届征文大赛,一次性带走社区全部新周边,还有bose 降噪耳机、倍轻松按摩仪等你拿!

TiDB 社区干货传送门

对TiDB监控方式的一点点研究

TiDB 社区干货传送门

监控 TiDB 源码解读

阿里三面被面试官狂问Redis,简历上再也不敢写"精通"了

Java 数据库 redis 缓存 面试

手把手教你改 sysbench 代码

TiDB 社区干货传送门

开发语言 管理与运维

Region is unavailable的排查总结

TiDB 社区干货传送门

管理与运维 故障排查/诊断 扩/缩容

增强认证--MQTT 5.0新特性

EMQ映云科技

物联网 IoT mqtt 企业号 3 月 PK 榜 增强认证

软件测试/测试开发丨后端Web开发框架(Java)

测试人

软件测试 springboot 测试开发

买了等保安全设备就一定安全吗?就一定能抵御网络风险呢?

行云管家

网络安全 等保 等级保护

TiDB 的事务和一致性校验工具 BANK

TiDB 社区干货传送门

实践案例 故障排查/诊断 数据库架构选型

谷歌发布AI模型MedGemma,用于医学领域的文本和图像理解_AI&大模型_InfoQ精选文章