写点什么

医疗 AI 落地利器:腾讯优图开源业界首个 3D 医疗影像大数据预训练模型

  • 2019-08-08
  • 本文字数:1474 字

    阅读完需:约 5 分钟

医疗AI落地利器:腾讯优图开源业界首个3D医疗影像大数据预训练模型


近日,腾讯优图首个医疗 AI 深度学习预训练模型 MedicalNet 正式对外开源。这也是全球第一个提供多种 3D 医疗影像专用预训练模型的项目,将为全球医疗 AI 发展提供基础。


许多研究表明,深度学习的发展非常依赖数据量。自然图像领域中存在着许多海量数据集,如 ImageNet,MSCOCO。基于这些数据集产生的预训练模型推动了分类、检测、分割等应用的进步。不同于自然图像,医疗影像大部分都是 3D 结构形态的,同时,由于数据获取和标注难度大,数据量稀少,目前尚未存在海量数据集及对应的预训练模型。


MedicalNet 是腾讯优图首个专为 3D 医疗影像在深度学习应用上所开发的一系列预训练模型,为任何 3D 医疗影像 AI 应用起到“打地基”的作用,加快模型收敛,减轻模型对数据量的依赖,MedicalNet 具备以下特性:


  1. MedicalNet 提供的预训练网络可迁移到任何 3D 医疗影像的 AI 应用中,包括但不限于分割、检测、分类等任务;

  2. 尤其适用小数据医疗影像 AI 场景,能加快网络收敛,提升网络性能;

  3. 通过简单配置少量接口参数值,即可进行微调训练;

  4. 项目提供多卡训练以及测试评估代码,接口丰富,扩展性强;

  5. 提供不同深度 3D ResNet 预训练模型,可供不同数据量级应用使用。


为了产生 3D 医疗影像的预训练模型,MedicalNet 聚集多个来自不同 3D 医疗领域的语义分割小规模数据集,并提出了基于多分支解码器的多域联合训练模型来解决数据集中的标注缺失问题。我们的预训练模型可以迁移到任何 3D 医疗影像应用的深度学习模型中。整个系统的工作流程如下图所示:



我们将 MedicalNet 模型迁移到预训练时未接触过的 Visceral 和 LIDC 数据集中,完成全新的肺部分割和肺结节分类任务,并与目前常用的从零训练(train from scratch)以及 Kinetics 视频 3D 预训练模型在性能以及收敛速度上做了比较。在肺部分割应用上,相比于 Train from Scratch,MedicalNet 在 Dice 上有 16%到 33%幅度的提升,相比于 Kinetics 有 4%到 7%幅度的提升。在肺结节良恶性分类应用上,相比于 Train from Scratch,MedicalNet 有 6%到 23%幅度的预测正确率(Acc)提升,相比于 Kinetics 有 7%到 20%幅度的提升。


在收敛速度上,实验证明,无论是在肺分割任务还是肺结节分类任务上,MedicalNet 均能为模型提供一个较低的初始化损失值,明显加快损失下降速度,下图为 MedicalNet 性能的一个简单示例,展示了在全器官分割应用中,不同预训练方式在一定训练迭代次数下的测试结果。可以看出,基于我们的预训练模型(MedicalNet)的结果最接近标签(ground truth),且远优于从零训练(train from scratch)的结果,更多细节请参考论文[footnoteRef:1]。



随着人工智能的火热化,医疗影像 AI 也成为了当前各应用领域中最热门的版块。区别于其他人工智能应用,人工智能在医疗领域的应用门槛最高,最大的原因在于标注数据的匮乏。医疗影像数据的获取通常需要经历重重关卡,同时,由于领域的专一性,数据通常需要资深医师标注,而每个 3D 数据的标注耗时耗力。在当前紧张的医护资源下,医疗影像数据的获取战线将非常漫长,大大阻碍了应用落地的进程。再者,标注数据量相当有限,大部分医疗部门都需要面临数据量稀少和深度学习之间的鸿沟


专有领域专有模型,MedicalNet 相当于为各个 3D 医疗影像应用准备了具备临床通用知识的数据库。即使在小数据量中,该数据库的有效特征也能帮助落地应用取得较好的医疗检测性能,这大大减轻医疗影像 AI 应用对数据量的依赖,进而实现落地需求并加快落地速度


腾讯优图表示,MedicalNet 是腾讯在医疗 AI 领域的首个开源项目,后续将继续提供更多类型的模型,为全球医疗 AI 的基础建设助力。


2019-08-08 17:199757

评论

发布
暂无评论
发现更多内容

最全数据分类分级标准汇编,有必要了解一下!

极盾科技

《2022年数据库大调查》正式启动,共同助力国产数据库发展

墨天轮

数据库 oracle TiDB 问卷调查 国产数据库

用户面对面 | 对话某新能源汽车行业工程师:如何落地Atlassian工具?

龙智—DevSecOps解决方案

时间复杂度和空间复杂度

C++后台开发

数据结构 算法 网络编程 linux开发 C++开发

【附视频】在线研讨会回顾|龙智引入自动化测试工具,帮助企业优化DevSecOps工具链,提升QA效率

龙智—DevSecOps解决方案

自动化测试

2.1如何设计可扩展架构

程序员小张

「架构实战营」

时序数据库破局开放探讨

YMatrix 超融合数据库

物联网 时序数据库 超融合数据库 数据库架构选型 YMatrix

Databend 索引结构说明

Databend

代码质量与安全 | 如何应对网络安全威胁,保障软件安全?

龙智—DevSecOps解决方案

软件安全 安全软件开发生命周期 网络安全威胁

基于人眼视觉模型,实现码率、质量、成本的最优均衡

阿里云CloudImagine

云计算 阿里云

通过 NFTScan 实时监控钱包地址和 NFT 合约地址

NFT Research

区块链 数据分析 NFT

7天搞定一门新技术!5个含金量很高的短篇课程推荐

博文视点Broadview

中台+低代码 企业数字化转型新范式

力软低代码开发平台

空间音频技术与生态发展高峰论坛成功举办,业界首个Audio Vivid创作工具花瓣三维声亮相

HarmonyOS SDK

HMS Core

数字化转型的十大优势

优秀

数字化转型 数字化升级

版本控制 | 如何将UnrealGameSync与Perforce Helix Core结合使用

龙智—DevSecOps解决方案

虚拟引擎 UnrealGameSync

flutter系列之:如丝般顺滑的SliverAppBar

程序那些事

flutter 程序那些事

YMatrix:超融合数据库如何在泵车智能运维场景实现 One for All 价值

YMatrix 超融合数据库

智能运维 三一重工 超融合数据库 智能化运维 YMatrix

Elasticsearch Head插件使用小结

京东科技开发者

elasticsearch 索引 chorme 数据库· 数据查询

软件测试丨Git分支管理实操,搞定在线合并和本地合并

测试人

GitHub 软件测试 自动化测试 测试开发

对于Getaverse,灵魂绑定和去中心化身份是什么?

Geek_Web3

Web3 Daily 去中心化信任 #区块链# did

喜报 | 秒云获评2022(第二届)“金信通”金融科技创新应用优秀案例

MIAOYUN

金融科技 解决方案 信创

十亿国民新宠:皮皮App线上派对新社交

联营汇聚

Karmada多云多集群生产实践专场圆满落幕|CNDC南京站

科技热闻

校招Java岗学到什么程度,才能找到所谓的好工作呢?

Java永远的神

Java 程序员 面试 程序人生 秋招

数据库运维 | 携程分布式图数据库NebulaGraph运维治理实践

NebulaGraph

图数据库 数据库运维

模型精度再被提升,统一跨任务小样本学习算法 UPT 给出解法!

阿里云大数据AI技术

人工智能 自然语言处理 机器学习 模型 12 月 PK 榜

架构实战营 2-4 架构质量提升随堂练习

西山薄凉

「架构实战营」

华为侯金龙:能源流与信息流融合,共建绿色低碳城市

Geek_2d6073

iQOO11 国内安卓首发背景音过滤,人声更突显,通话更隐私

Geek_2d6073

医疗AI落地利器:腾讯优图开源业界首个3D医疗影像大数据预训练模型_AI&大模型_云加社区_InfoQ精选文章