写点什么

谷歌发布 AI 模型 MedGemma,用于医学领域的文本和图像理解

作者:Robert Krzaczyński

  • 2025-06-04
    北京
  • 本文字数:1001 字

    阅读完需:约 3 分钟

大小:501.23K时长:02:51
谷歌发布AI模型MedGemma,用于医学领域的文本和图像理解

谷歌发布 MedGemma,一对开源的生成式 AI 模型,旨在支持医疗保健应用中的医学文本和图像理解。这些模型基于 Gemma 3 架构,提供两种配置:MedGemma 4B,一个能够处理图像和文本的多模态模型,以及 MedGemma 27B,一个专注于医学文本的大模型。


谷歌表示,这些模型专为助力放射学报告生成、临床总结、患者分流以及一般医学问题解答等任务而设计。MedGemma 4B 基于广泛去识别化医学图像进行预训练,涵盖胸部 X 光、皮肤科照片、组织病理学幻灯片以及眼科图像等多种类型。两种模型均以开放许可的形式提供,可用于研究和开发,并提供预训练及指令调整的版本。


谷歌强调,尽管 MedGemma 模型具备诸多先进能力,但它们并非为直接应用于临床而设计,未经进一步验证和调整,不应直接用于临床实践。这些模型的定位是为开发人员提供一个基础框架,开发人员可以在此基础上,根据具体的医疗应用场景对模型进行针对性的调整和微调。


一些早期测试者已经分享了他们对模型优势和局限性的观察。临床医生兼人工智能从业者 Vikas Gaur 使用一位确诊患有结核病的患者的胸部 X 光测试了 MedGemma 4B-it 模型。他发现 ,模型生成了正常的解读,却遗漏了临床明显的疾病迹象:


尽管该病例存在明确的结核病迹象,但 MedGemma 却给出了“胸部 X 光正常,心脏大小在正常范围内,肺部扩张良好且清晰”的诊断结果


Gaur 认为,通过增加高质量标注数据的训练,或许能够让模型的输出结果更贴合临床预期。

此外,生物医学工程师 Mohammad Zakaria Rajabi 表示,他十分期待将 27B 大模型的功能扩展到图像处理上:


我们急切期待看到 MedGemma 27B 支持图像分析。


技术文档显示,这些模型已在超过 22 个数据集上进行了评估,这些数据集覆盖了多种医学任务和成像模态。用于训练的公共数据集包括 MIMIC-CXRSlake-VQAPAD-UFES-20 等。此外,在获得许可或许可参与者的同意后,还使用了多个专有数据集和内部数据集。


这些模型可以通过提示词工程、微调以及使用 Gemini 生态系统的其他工具与智能体系统集成等技术进行调整。不过模型性能可能会因提示词结构的不同而有所差异,而且这些模型尚未针对多轮对话或多图像输入能力进行过评估。


MedGemma 为医学人工智能的研究和开发提供了一个便捷的基础框架,不过在实际应用中的表现将取决于其在特定临床或操作环境中的验证、微调以及整合程度。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


查看英文原文https://www.infoq.com/news/2025/05/google-medgemma/

2025-06-04 11:004157

评论

发布
暂无评论

从 “卡顿” 到 “秒开”:外投首屏性能优化的 6 个实战锦囊|得物技术

得物技术

开发语言

开源赋能能源转型:MyEMS 落地 ISO 50007 的全链路指南

开源能源管理系统

开源 iso 50007 能源管理系统

Java锁这样用,从单机到分布式一步到位

电子尖叫食人鱼

Java

【LazyLLM全面教程(图文版)】新系列来袭!今天学,明天别人追着喊你大佬!

商汤万象开发者

AI 多模态 agent LLM

实操体验 - KWDB分布式多模数据库深度探索:高效部署安装指南与TSBS性能压测技巧全攻略

KaiwuDB

数据库

关于 KWDB 数据存储的几件事儿

KaiwuDB

数据库

东荟城名店仓联乘韩国人气玩偶 BELLYGOM 打造「Dive into Summer」主题活动

极客天地

MyEMS开源能源管理系统广泛应用

开源能源管理系统

开源 能源管理系统

Obsidian 浏览器插件关联 - 极简版

虚实的星空

Linux Obsidian 黑曜石笔记

轻帆云AI Inside实践:GenAI 如何推动 ITSM 驶入产业深水区?

云智慧AIOps社区

ITSM ITSM软件 工单管理

百万奖金,2025 阿里云「AI安全」全球挑战赛等你来!

新消费日报

钉钉MCP能力上新:AI如何提效你的工作流程

钉钉开发者

MCP MCP Server

解决Linxu Obsidian 黑曜石笔记无法关联浏览器插件问题

虚实的星空

Obsidian 黑曜石笔记

火极一时的AI蛋白质解析,怎么样了?

脑极体

AI

“2025京东方投资者日”在沪举办 资本战略转型开启价值创造新阶段

爱极客侠

10+热门 AI Agent 框架深度解析:谁更适合你的项目?

测试人

面试官:谈谈你AI项目的具体实现?

王磊

黑龙江等保测评2025新政策

等保测评

我把PS卸载了!只因这款国产免费AI,动动嘴就能把废片变大片。

田威AI

IT服务台经理的角色是什么?-ManageEngine卓豪

ServiceDesk_Plus

IT服务台

MyEMS开源能源管理系统简介

开源能源管理系统

开源 能源管理系统

原点安全签约金网络数科,共建一体化数据安全防护体系

原点安全

数据安全 数据安全厂商 一体化数据安全平台 供应链数据安全 数据安全产品

同济医院R语言训练营第三期开讲!上交大张维拓老师主讲

ModelWhale

R 语言 同济医院 上海交通大学

Python 语言连接并操作 KWDB 数据库

KaiwuDB

数据库

n8n的基础安装分享

溪抱鱼

Docker n8n

东荟城名店仓联乘韩国人气玩偶 BELLYGOM 打造「Dive into Summer」主题活动

编程猫

订单初版—生单链路实现的重构文档

不在线第一只蜗牛

WPF

渣运公司心头好:“充电便宜跑得远,豪沃TX新能源自卸车巴适得板!”

科技热闻

NL2SQL 再创佳绩!阿里云论文中选 SIGMOD 2025

阿里云大数据AI技术

人工智能 深度学习 云计算 大数据 阿里云

OpenAI Agents 概述

wasa

挖掘数据价值,构建数据驱动型财务规划

智达方通

数字化转型 数据驱动 全面预算管理 财务规划 企业运营

谷歌发布AI模型MedGemma,用于医学领域的文本和图像理解_AI&大模型_InfoQ精选文章