智能体刷屏的背后,是 AI 应用拐点的来临?AICon 北京站议程重磅公布,50+ 硬核分享不容错过 了解详情
写点什么

谷歌发布 AI 模型 MedGemma,用于医学领域的文本和图像理解

作者:Robert Krzaczyński

  • 2025-06-04
    北京
  • 本文字数:1001 字

    阅读完需:约 3 分钟

大小:501.23K时长:02:51
谷歌发布AI模型MedGemma,用于医学领域的文本和图像理解

谷歌发布 MedGemma,一对开源的生成式 AI 模型,旨在支持医疗保健应用中的医学文本和图像理解。这些模型基于 Gemma 3 架构,提供两种配置:MedGemma 4B,一个能够处理图像和文本的多模态模型,以及 MedGemma 27B,一个专注于医学文本的大模型。


谷歌表示,这些模型专为助力放射学报告生成、临床总结、患者分流以及一般医学问题解答等任务而设计。MedGemma 4B 基于广泛去识别化医学图像进行预训练,涵盖胸部 X 光、皮肤科照片、组织病理学幻灯片以及眼科图像等多种类型。两种模型均以开放许可的形式提供,可用于研究和开发,并提供预训练及指令调整的版本。


谷歌强调,尽管 MedGemma 模型具备诸多先进能力,但它们并非为直接应用于临床而设计,未经进一步验证和调整,不应直接用于临床实践。这些模型的定位是为开发人员提供一个基础框架,开发人员可以在此基础上,根据具体的医疗应用场景对模型进行针对性的调整和微调。


一些早期测试者已经分享了他们对模型优势和局限性的观察。临床医生兼人工智能从业者 Vikas Gaur 使用一位确诊患有结核病的患者的胸部 X 光测试了 MedGemma 4B-it 模型。他发现 ,模型生成了正常的解读,却遗漏了临床明显的疾病迹象:


尽管该病例存在明确的结核病迹象,但 MedGemma 却给出了“胸部 X 光正常,心脏大小在正常范围内,肺部扩张良好且清晰”的诊断结果


Gaur 认为,通过增加高质量标注数据的训练,或许能够让模型的输出结果更贴合临床预期。

此外,生物医学工程师 Mohammad Zakaria Rajabi 表示,他十分期待将 27B 大模型的功能扩展到图像处理上:


我们急切期待看到 MedGemma 27B 支持图像分析。


技术文档显示,这些模型已在超过 22 个数据集上进行了评估,这些数据集覆盖了多种医学任务和成像模态。用于训练的公共数据集包括 MIMIC-CXRSlake-VQAPAD-UFES-20 等。此外,在获得许可或许可参与者的同意后,还使用了多个专有数据集和内部数据集。


这些模型可以通过提示词工程、微调以及使用 Gemini 生态系统的其他工具与智能体系统集成等技术进行调整。不过模型性能可能会因提示词结构的不同而有所差异,而且这些模型尚未针对多轮对话或多图像输入能力进行过评估。


MedGemma 为医学人工智能的研究和开发提供了一个便捷的基础框架,不过在实际应用中的表现将取决于其在特定临床或操作环境中的验证、微调以及整合程度。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


查看英文原文https://www.infoq.com/news/2025/05/google-medgemma/

2025-06-04 11:001

评论

发布
暂无评论

攻克编译器技术(2)

刘旭东

源代码 编译器原理 5月月更

Global Tensor和实习总结|OneFlow学习笔记

OneFlow

深度学习 学习笔记 分布式训练 Global Tensor

博睿数据获得分布式系统稳定性实验室成员单位证书 亮相全球信息系统稳定性峰会

博睿数据

五、高可用之全链路压测

穿过生命散发芬芳

5月月更

无需修改代码,用 fcapp.run 运行你的 REST 应用

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

每日一题——PAT乙级1004 成绩排名 python

武师叔

ssh常用命令总结

入门小站

SSH

在线时间戳格式化转换工具

入门小站

工具

InfoQ AI开发者召集令!快来助力中国AI产业发展,参与抽奖!

InfoQ写作社区官方

AI 热门活动 白玉兰开源

Tech Talk 宣传 | 如何高效、极简构造无服务器 Web 应用

亚马逊云科技 (Amazon Web Services)

Web

一“碳”究竟:碳交易的生意经与飞轮“燃料”

脑极体

Jackson 解决没有无参构造函数的反序列化问题

TRAMP

Jackson java 序列化与反序列化

喜报!阿里云首个通过应用多活“先进级”能力评估

阿里巴巴云原生

阿里云 云原生 应用多活

时序数据库在水电站领域的应用

CnosDB

IoT 时序数据库 开源社区 CnosDB infra

Django Model 如何返回空的 QuerySet

AlwaysBeta

django

聊聊 Kafka:Kafka 消息丢失的场景以及最佳实践

老周聊架构

kafka 4月月更 5月月更

MySQL存储过程批量生成假用户电话号码

芝士味的椒盐

MySQL MySQL 数据库 5月月更

一文搞定 Flutter 文件下载和管理

岛上码农

flutter 跨平台 安卓开发 ios 开发 5月月更

【愚公系列】2022 年 05 月 二十三种设计模式(五)-单例模式(Singleton Pattern)

愚公搬代码

5月月更

硬仗白酒,解锁当下“社交密码”

联营汇聚

闲置计费 | Serverless 冷启动与成本间的最优解

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

Nacos源码系列—关于服务注册的那些事

牧小农

源码 nacos

Spring data JPA实践和原理浅析

领创集团Advance Intelligence Group

工作原理 java Spring JPA

Git 安装及配置

Emperor_LawD

git 基础 5月月更

低代码实现探索(四十一)未实现小目标

零道云-混合式低代码平台

python进阶-迭代器和生成器

AIWeker

Python 人工智能 5月月更

易周金融观点 央行设立科技创新再贷款;多家银行下调大额存单利率

易观分析

金融 银行

Linux多线程-概念及控制

可口也可樂

c++ Linux 后端

不仅仅是自动化,DevOps 测试工具推荐

飞算JavaAI开发助手

浅谈TCP和UDP协议

工程师日月

5月月更

CleanMyMac2022免费版Mac电脑清理软件功能

茶色酒

CleanMyMac2022 CleanMyMac

谷歌发布AI模型MedGemma,用于医学领域的文本和图像理解_AI&大模型_InfoQ精选文章