写点什么

医疗 AI 落地利器:腾讯优图开源业界首个 3D 医疗影像大数据预训练模型

  • 2019-08-08
  • 本文字数:1474 字

    阅读完需:约 5 分钟

医疗AI落地利器:腾讯优图开源业界首个3D医疗影像大数据预训练模型


近日,腾讯优图首个医疗 AI 深度学习预训练模型 MedicalNet 正式对外开源。这也是全球第一个提供多种 3D 医疗影像专用预训练模型的项目,将为全球医疗 AI 发展提供基础。


许多研究表明,深度学习的发展非常依赖数据量。自然图像领域中存在着许多海量数据集,如 ImageNet,MSCOCO。基于这些数据集产生的预训练模型推动了分类、检测、分割等应用的进步。不同于自然图像,医疗影像大部分都是 3D 结构形态的,同时,由于数据获取和标注难度大,数据量稀少,目前尚未存在海量数据集及对应的预训练模型。


MedicalNet 是腾讯优图首个专为 3D 医疗影像在深度学习应用上所开发的一系列预训练模型,为任何 3D 医疗影像 AI 应用起到“打地基”的作用,加快模型收敛,减轻模型对数据量的依赖,MedicalNet 具备以下特性:


  1. MedicalNet 提供的预训练网络可迁移到任何 3D 医疗影像的 AI 应用中,包括但不限于分割、检测、分类等任务;

  2. 尤其适用小数据医疗影像 AI 场景,能加快网络收敛,提升网络性能;

  3. 通过简单配置少量接口参数值,即可进行微调训练;

  4. 项目提供多卡训练以及测试评估代码,接口丰富,扩展性强;

  5. 提供不同深度 3D ResNet 预训练模型,可供不同数据量级应用使用。


为了产生 3D 医疗影像的预训练模型,MedicalNet 聚集多个来自不同 3D 医疗领域的语义分割小规模数据集,并提出了基于多分支解码器的多域联合训练模型来解决数据集中的标注缺失问题。我们的预训练模型可以迁移到任何 3D 医疗影像应用的深度学习模型中。整个系统的工作流程如下图所示:



我们将 MedicalNet 模型迁移到预训练时未接触过的 Visceral 和 LIDC 数据集中,完成全新的肺部分割和肺结节分类任务,并与目前常用的从零训练(train from scratch)以及 Kinetics 视频 3D 预训练模型在性能以及收敛速度上做了比较。在肺部分割应用上,相比于 Train from Scratch,MedicalNet 在 Dice 上有 16%到 33%幅度的提升,相比于 Kinetics 有 4%到 7%幅度的提升。在肺结节良恶性分类应用上,相比于 Train from Scratch,MedicalNet 有 6%到 23%幅度的预测正确率(Acc)提升,相比于 Kinetics 有 7%到 20%幅度的提升。


在收敛速度上,实验证明,无论是在肺分割任务还是肺结节分类任务上,MedicalNet 均能为模型提供一个较低的初始化损失值,明显加快损失下降速度,下图为 MedicalNet 性能的一个简单示例,展示了在全器官分割应用中,不同预训练方式在一定训练迭代次数下的测试结果。可以看出,基于我们的预训练模型(MedicalNet)的结果最接近标签(ground truth),且远优于从零训练(train from scratch)的结果,更多细节请参考论文[footnoteRef:1]。



随着人工智能的火热化,医疗影像 AI 也成为了当前各应用领域中最热门的版块。区别于其他人工智能应用,人工智能在医疗领域的应用门槛最高,最大的原因在于标注数据的匮乏。医疗影像数据的获取通常需要经历重重关卡,同时,由于领域的专一性,数据通常需要资深医师标注,而每个 3D 数据的标注耗时耗力。在当前紧张的医护资源下,医疗影像数据的获取战线将非常漫长,大大阻碍了应用落地的进程。再者,标注数据量相当有限,大部分医疗部门都需要面临数据量稀少和深度学习之间的鸿沟


专有领域专有模型,MedicalNet 相当于为各个 3D 医疗影像应用准备了具备临床通用知识的数据库。即使在小数据量中,该数据库的有效特征也能帮助落地应用取得较好的医疗检测性能,这大大减轻医疗影像 AI 应用对数据量的依赖,进而实现落地需求并加快落地速度


腾讯优图表示,MedicalNet 是腾讯在医疗 AI 领域的首个开源项目,后续将继续提供更多类型的模型,为全球医疗 AI 的基础建设助力。


2019-08-08 17:199912

评论

发布
暂无评论
发现更多内容

千行万业的数智化,将在全闪普惠的土壤上开出新花

Alter

将大模型装进PC和手机,需要怎样的底层创“芯”?

脑极体

AI

开启DevOps+AI智能新时代,嘉为蓝鲸智能AI助手CAssist全新上线!

嘉为蓝鲸

DevOps 生成式AI

嘉为蓝鲸WeOps上新:新增机房机柜视图,集中管理IT设备

嘉为蓝鲸

运维 weops IT资产管理

可观测产品剖析——日志统一管理

嘉为蓝鲸

日志监控 日志管理 日志采集

数据复盘“黑色星期一”:加密市场震荡,代币表现如何?

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

代理IP如何助力品牌保护?

IPIDEA全球HTTP

品牌 代理IP

Spring Boot 基于 SCRAM 认证集成 Kafka 的详解

不在线第一只蜗牛

kafka Spring Boot

防盗、防泄露、防篡改,我们把 ZooKeeper 的这种认证模式玩明白了

阿里巴巴云原生

阿里云 微服务 云原生

通义灵码代码大模型应用实践访谈

阿里巴巴云原生

阿里云 云原生 通义灵码

再获殊荣!嘉为蓝鲸携手电力公司入选工信部信创典型解决方案

嘉为蓝鲸

运维 数字化转型 信创

私网环境下如何使用云效流水线进行 CI/CD?

阿里云云效

阿里云 云原生 云效

国际化战略:京东商品详情API的全球视野

技术冰糖葫芦

api 货币化 API 接口 API 文档 API 测试

广汽集团与火山引擎签署战略合作协议

新消费日报

Golang 策略设计模式

俞凡

架构 设计模式

AI 点燃体育热情!使用 PAI-Artlab 定制专属海报

阿里云大数据AI技术

人工智能 奥运会 AIGC 文生图 PAI

重磅!观测云荣获SOC 2 Type II鉴证报告

观测云

安全合规

未来已来:阿里巴巴商品搜索API返回值的智能化展望

技术冰糖葫芦

api 货币化 API 接口 API 文档 API 测试

通义灵码代码大模型应用实践访谈

阿里云云效

阿里云 云原生 通义灵码

私网环境下如何使用云效流水线进行 CI/CD?

阿里巴巴云原生

阿里云 云原生 云效

从一个服务预热不生效问题谈微服务无损上线

阿里巴巴云原生

阿里云 微服务 云原生

涨姿势啦!Go语言中正则表达式初始化的最佳实践

左诗右码

Go

可观测产品剖析——硬件监控

嘉为蓝鲸

运维 监控 数据监测 数据接入

30% 代码由 AI 生成,单测准确率达到 90%,我在阿里巴巴国际站推广通义灵码

阿里巴巴云原生

阿里云 云原生 通义灵码

如何用 CocosCreator 对接抖音小游戏的侧边栏复访

北桥苏

小游戏 小游戏开发 CocosCreator

文旅科技公司:云管高效赋能,加速云上业务蓬勃发展

嘉为蓝鲸

运维 多云管理平台 云管理

医疗AI落地利器:腾讯优图开源业界首个3D医疗影像大数据预训练模型_AI&大模型_云加社区_InfoQ精选文章