阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

医疗 AI 落地利器:腾讯优图开源业界首个 3D 医疗影像大数据预训练模型

  • 2019-08-08
  • 本文字数:1474 字

    阅读完需:约 5 分钟

医疗AI落地利器:腾讯优图开源业界首个3D医疗影像大数据预训练模型


近日,腾讯优图首个医疗 AI 深度学习预训练模型 MedicalNet 正式对外开源。这也是全球第一个提供多种 3D 医疗影像专用预训练模型的项目,将为全球医疗 AI 发展提供基础。


许多研究表明,深度学习的发展非常依赖数据量。自然图像领域中存在着许多海量数据集,如 ImageNet,MSCOCO。基于这些数据集产生的预训练模型推动了分类、检测、分割等应用的进步。不同于自然图像,医疗影像大部分都是 3D 结构形态的,同时,由于数据获取和标注难度大,数据量稀少,目前尚未存在海量数据集及对应的预训练模型。


MedicalNet 是腾讯优图首个专为 3D 医疗影像在深度学习应用上所开发的一系列预训练模型,为任何 3D 医疗影像 AI 应用起到“打地基”的作用,加快模型收敛,减轻模型对数据量的依赖,MedicalNet 具备以下特性:


  1. MedicalNet 提供的预训练网络可迁移到任何 3D 医疗影像的 AI 应用中,包括但不限于分割、检测、分类等任务;

  2. 尤其适用小数据医疗影像 AI 场景,能加快网络收敛,提升网络性能;

  3. 通过简单配置少量接口参数值,即可进行微调训练;

  4. 项目提供多卡训练以及测试评估代码,接口丰富,扩展性强;

  5. 提供不同深度 3D ResNet 预训练模型,可供不同数据量级应用使用。


为了产生 3D 医疗影像的预训练模型,MedicalNet 聚集多个来自不同 3D 医疗领域的语义分割小规模数据集,并提出了基于多分支解码器的多域联合训练模型来解决数据集中的标注缺失问题。我们的预训练模型可以迁移到任何 3D 医疗影像应用的深度学习模型中。整个系统的工作流程如下图所示:



我们将 MedicalNet 模型迁移到预训练时未接触过的 Visceral 和 LIDC 数据集中,完成全新的肺部分割和肺结节分类任务,并与目前常用的从零训练(train from scratch)以及 Kinetics 视频 3D 预训练模型在性能以及收敛速度上做了比较。在肺部分割应用上,相比于 Train from Scratch,MedicalNet 在 Dice 上有 16%到 33%幅度的提升,相比于 Kinetics 有 4%到 7%幅度的提升。在肺结节良恶性分类应用上,相比于 Train from Scratch,MedicalNet 有 6%到 23%幅度的预测正确率(Acc)提升,相比于 Kinetics 有 7%到 20%幅度的提升。


在收敛速度上,实验证明,无论是在肺分割任务还是肺结节分类任务上,MedicalNet 均能为模型提供一个较低的初始化损失值,明显加快损失下降速度,下图为 MedicalNet 性能的一个简单示例,展示了在全器官分割应用中,不同预训练方式在一定训练迭代次数下的测试结果。可以看出,基于我们的预训练模型(MedicalNet)的结果最接近标签(ground truth),且远优于从零训练(train from scratch)的结果,更多细节请参考论文[footnoteRef:1]。



随着人工智能的火热化,医疗影像 AI 也成为了当前各应用领域中最热门的版块。区别于其他人工智能应用,人工智能在医疗领域的应用门槛最高,最大的原因在于标注数据的匮乏。医疗影像数据的获取通常需要经历重重关卡,同时,由于领域的专一性,数据通常需要资深医师标注,而每个 3D 数据的标注耗时耗力。在当前紧张的医护资源下,医疗影像数据的获取战线将非常漫长,大大阻碍了应用落地的进程。再者,标注数据量相当有限,大部分医疗部门都需要面临数据量稀少和深度学习之间的鸿沟


专有领域专有模型,MedicalNet 相当于为各个 3D 医疗影像应用准备了具备临床通用知识的数据库。即使在小数据量中,该数据库的有效特征也能帮助落地应用取得较好的医疗检测性能,这大大减轻医疗影像 AI 应用对数据量的依赖,进而实现落地需求并加快落地速度


腾讯优图表示,MedicalNet 是腾讯在医疗 AI 领域的首个开源项目,后续将继续提供更多类型的模型,为全球医疗 AI 的基础建设助力。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-08-08 17:199272

评论

发布
暂无评论
发现更多内容

无监督欺诈检测|基于iForest异常值检测法的反欺诈研究

索信达控股

算法 模型 反欺诈 iForest 金融交易欺诈检测

在亚马逊云科技Marketplace上的SaaS架构设计——如何支持多产品使用单一账户中心

亚马逊云科技 (Amazon Web Services)

AI/ML

使用Amazon SageMaker部署CVAT AI自动图像标注系统

亚马逊云科技 (Amazon Web Services)

AI/ML

网易云音乐广告CTR预估模型演进过程

网易数帆

机器学习 CTR 网易云音乐

如何将您的自定义容器镜像导入Amazon SageMaker Studio Notebooks

亚马逊云科技 (Amazon Web Services)

AI/ML

关于Stream转Map的Duplicate key异常处理

一盐难进

java基础

从350ms到80ms,打造新零售场景下 iOS 短视频的极致丝滑体验

阿里巴巴终端技术

ios App 短视频 移动开发

Java 中的 xx ≠ null 是什么新语法?

CRMEB

【12月日更】深度解析redis分布式锁,那些你不知道的秘密!

小梁编程汇

redis 分布式 RedLock redis分布式锁

虎符上线“圣诞狂欢 没礼不行”活动 邀你瓜分等值66,666 USDT的圣诞礼包

区块链前沿News

区块链 节日 Hoo 虎符交易所 圣诞

Dubbo 框架学习笔记十一

风翱

dubbo 12月日更

“腾源会”成立一周年:助力 40+ 开源项目成长,集结 50+ 位导师大使

腾源会

开源 开源社区 腾源会

数字化石油的开采利器:智能图像识别系统

百度大脑

人工智能

Amazon Marketplace上的SaaS架构设计 ——如何支持跨多账户对接

亚马逊云科技 (Amazon Web Services)

AI/ML

基于Amazon Machine Learning Bot 的 Named-entity Recognition 快速解决方案

亚马逊云科技 (Amazon Web Services)

AI/ML

在Amazon SageMaker上快速、灵活构建Amazon TensorFlow模型的在线推理服务

亚马逊云科技 (Amazon Web Services)

AI/ML

使用 Amazon Redshift ML 构建多分类模型

亚马逊云科技 (Amazon Web Services)

AI/ML

语音信号处理7:语音信号的非线性产生模型

轻口味

28天写作 12月日更

优酷弱网平台落地实践

阿里巴巴终端技术

弱网 弱网环境高可用

直播预告 | 拍乐云与你相约RTSCon2021开发者沙龙

拍乐云Pano

WebRTC RTC

Amazon SageMaker Data Wrangler 简化数据准备过程,助力机器学习

亚马逊云科技 (Amazon Web Services)

AI/ML

手把手教程 | 基于Amazon Kinesis Video Streams实现IP Camera云存项目

亚马逊云科技 (Amazon Web Services)

IoT

2022 全栈开发值得关注的技术产品

开源之巅

ide Web 云服务

模块七作业

21°Char

2021年的感悟生活

卢卡多多

盘点2021

百分点认知智能实验室:基于NL2SQL的问答技术和实践

百分点科技技术团队

54 K8S之Prometheus介绍

穿过生命散发芬芳

k8s 28天写作 12月日更

阿里云混合云重磅亮相中国信通院2021混合云大会

Amazon DeepRacer训练日志分析范例与强化学习Reward Function设计

亚马逊云科技 (Amazon Web Services)

AI/ML

利用 Amazon IoT Greengrass 在边缘 DIY 自动浇花系统

亚马逊云科技 (Amazon Web Services)

IoT

CRM 和 C4C product category hierarchy的可编辑性控制逻辑

Jerry Wang

中间件 CRM 28天写作 ERP 12月日更

医疗AI落地利器:腾讯优图开源业界首个3D医疗影像大数据预训练模型_AI&大模型_云加社区_InfoQ精选文章