训练样本“喂不饱”,数据标注难破解:医疗 AI 热潮背后的“弹药”难题

阅读数:2206 2019 年 9 月 10 日 08:00

训练样本“喂不饱”,数据标注难破解:医疗AI热潮背后的“弹药”难题

训练样本“喂不饱”,数据标注难破解:医疗AI热潮背后的“弹药”难题

随着 AI 技术的发展,医疗成为人工智能最重要的应用场景之一,深度学习算法、计算能力、大数据为 AI 与医疗产业的融合奠定了基础。人工智能技术赋能传统的医疗产业并为之带来了不少可喜的变化和改进:AI 技术帮助医生提高诊断速度和准确率,助力医疗机构降低医疗成本、提升管理水平,为患者提供更精准、高效的诊疗方案。有人认为,人工智能技术代表着医疗的未来。

发展至今,人工智能技术在医疗产业的主流技术路线是怎样的?这些技术能够解决哪些问题?未来 3-5 年,医疗 AI 技术将会是怎样的发展趋势?本文是医疗 AI 系列专题的第 2 篇之「技术篇」,将对医疗 AI 技术进行一次全面的解读。

医疗 AI 五大主流技术

2017 年 7 月,国务院正式印发了我国在人工智能领域展开系统性部署的第一份文件《新一代人工智能发展规划》,正式将人工智能上升为国家战略。规划中还重点提到了要加快人工智能在医疗领域的创新应用,建立智能医疗体系、探索智慧医院建设,基于人工智能开展医学研究和新药研发等,医疗人工智能再一次被提到了政策高度。

与此同时,资本的敏锐目光也聚焦到了医疗 AI 领域,创投热情高涨,据前瞻研究院数据统计,2013 年到 2017 年,中国医疗人工智能行业共获得 241 笔融资,其中单是 2018 年上半年,就有 18 家公司获投,总金额超过 31 亿元。在政策助力和资本加持下,医疗人工智能成为时下最火热的领域之一。

近年来,伴随着机器学习、数据挖掘、计算机视觉等技术的发展,人工智能与医疗领域融合的趋势在不断加强并碰撞出新的火花,人工智能技术的运用为医疗健康行业赋予了新的活力,帮助提升医疗服务水平,降低医疗成本,让医疗活动更加有效率。

在技术层面,由于算法算力的改进和提升,加之医疗大数据的规模激增,各个医疗场景中的 AI 技术发展趋向成熟。目前,医疗人工智能有 7 大应用场景:医学影像、辅助诊断、疾病预测、药物研发、健康管理、医院管理、医学研究七大应用场景。

在上述场景中运用到了五大主流的 AI 技术:计算机视觉、数据挖掘、智能语音交互、自然语言处理、机器(深度)学习。

计算机视觉

简单来说,计算机视觉技术就是来研究如何让机器具有“看”的智能,现在这项技术已经广泛运用到了日常生活中,如人脸识别、虹膜识别、自动驾驶等,它也是目前医疗场景中运用最多的技术之一,尤其广泛用于医疗影像中。

计算机视觉技术能够对医学影像进行图像分类、图像检索、目标检测、图像分割等处理,人工智能可 24 小时无疲劳不间断工作,能够大批量处理图像数据,减少医生的阅片时间,降低漏诊率。

在医学影像中,人工智能技术主要解决三种需求:

1、病灶识别与标注。人工智能技术对医学影像进行图像分割、特征提取、定量分析、对比分析等工作。

2、 靶区自动勾画与自适应放疗,辅助放疗科医生对肿瘤放疗环节的影像进行靶区自动勾画,按照传统方式,放疗科医生一次靶区勾画通常要处理 200-450 张 CT 图像,勾画速度和耗时长,一次勾画要花 3-5 小时,而通过 AI 技术自动勾画可以将时间大大缩短为 30 分钟,而且还可以在患者 15-20 次上机照射过程中间不断识别病灶位置变化以达到自适应放疗,有效减少射线对病人健康组织的伤害。

3、针对手术环节的影像三维重建。

数据挖掘

数据量大是中国医疗产业的“特色”。曾有统计表明,到 2020 年,医疗数据将增至 35ZB,占全球的 20%,但这些庞大的数据中却有 75% 以上是非结构化的。目前中国的医疗体系中,不同医院、不同科室信息不互通,一个个信息孤岛将数据(信息)壁垒越堆越高。此外,患者的病历报告没有统一标准、医生手写不规范等导致医疗数据质量不佳,数据的价值并没有真正被挖掘出来。

借助数据挖掘技术、深度学习算法通过数据采集、存储、分析等环节对海量的医疗数据进行大规模清洗处理和分析,并将临床数据结构化,从中挖掘有价值的信息诸如病症的规律总结等,可以有效辅助医生做诊断决策和安排治疗方案。

语音 / 语义识别

语音识别是指将语言转换为文字的过程,语音识别系统主要包括 4 个部分:特征提取、声学模型、语言模型和解码搜索。近年来,语音识别技术已经逐渐走向成熟,基于深度学习的端到端的语音识别方法简化了声学模型训练的过程,在实用性方面颇受业界青睐。

在医疗场景下,语音 / 语义识别主要用于辅助诊疗,相应的产品有导诊机器人、诊断与治疗机器人、虚拟助理、康复机器人、语音电子病历等。其中,导诊机器人运用语音识别、人脸识别等技术,为患者提供挂号、就医流程指导等服务。虚拟助理可以帮助医生回复患者的线上问诊,实现智能问诊、导诊、智能用药等。

自然语言处理

自然语言处理是分析、理解和生成自然语言以方便人与计算机、人与人交流的技术,其核心技术有机器翻译、信息检索、推荐系统、语言生成等。在医疗产业中,自然语言处理多和语音识别等人机交互技术一起用于智能问诊、结构化电子病历等虚拟助理产品中。

机器 / 深度学习

以机器学习为核心的人工智能技术正在改变着传统医疗产业,它包括迁移学习、强化学习、对抗学习等类别。最近几年,机器学习尤其是深度学习技术的发展推动医疗 AI 走向新的高潮。按照拓扑结构分类,深度学习可分为卷积神经网络、循环神经网络和全连接神经网络。

深度学习在医学上的应用已卓有成效,例如卷积神经网络 CNN 在识别、处理医疗图像上的准确率非常高。深度学习算法可以更有效、更全面地处理医学数据,提炼出有价值的信息,进行快速准确地图像标注来为医生提供辅助诊疗意见,帮助医生提高效率、节省时间。

医疗影像 AI 技术运用

医学影像,是目前人工智能在医疗领域最热门的应用方向。

据亿欧智库统计,截至 2019 年 7 月,中国共有医疗人工智能企业 126 家,其中开展医学影像业务的企业数量最多,共 57 家,其次是开展疾病风险预测业务的公司,共 41 家。反映在资本市场上,也是医疗影像最受青睐,在 2012 年至 2019 年 5 月获投的医疗人工智能企业中,智能影像领域占比最高,医学数据挖掘领域及健康管理领域分列第二、第三位。

医学影像的处理本质上就是计算机视觉技术的运用,计算机视觉技术能够对医疗影像进行快速阅片和智能分析诊断,准确标记特定异常结构来辅助医生诊断。在技术层面,由于计算机视觉技术发展相对成熟,其在医学影像上的运用也更广泛,医学影像场景下的公司数量也最多。因此本文重点探讨医学影像领域的技术运用。

癌症早筛

在产品的技术成熟度方面,目前医疗影像 AI 在肺结节、眼底、乳腺癌、宫颈癌方面已有较为成熟的产品,其中肺癌、糖网眼底筛查最成熟,针对其他病种的产品大多处于使用或研发阶段 。

在癌症检测与早筛方面,医疗 AI 影像产品腾讯觅影目前已有了体系化的解决方案。腾讯觅影利用图像识别、深度学习等 AI 技术,对各类医学影像进行训练学习,智能识别不同病灶,能够做肺癌、糖网眼底筛查、食管癌、宫颈癌等疾病的早筛,并辅助医生作出临床诊断。

自腾讯觅影发布以来,一共上线了 6 个病种的辅助诊断产品,其中有三款是由其背后的算法和技术提供方—腾讯优图实验室的医疗 AI 团队主导开发的,分别是肺结节、眼科疾病(包括糖网、青光眼和老年性黄斑等 7 大眼底疾病)和宫颈癌筛查,此外,优图实验室还研发了乳腺癌早筛、肝癌早筛等产品。为了解腾讯优图在癌症早筛方面的最新成果,AI 前线采访了腾讯优图实验室郑冶枫博士。

在肺癌早筛方面,腾讯优图采用全卷积神经网络完成早期肺结节检测和分割,腾讯觅影的早期肺癌筛查 AI 系统采用了腾讯优图实验室的“端到端肺癌辅助诊断技术”,它能够精准定位微小结节位置和辅助医生准确判断患者患肺癌的风险。 “腾讯觅影” 能精确定位 3mm 以上的微小肺结节,检出率≥95%。

在宫颈癌早筛上,腾讯优图于今年 5 月份取得了新的研发进展——AI 电子阴道镜辅助诊断系统,并与腾讯觅影联合发布。该系统利用 AI 技术可以进行阴道镜下癌前病变的辅助判读。郑冶枫介绍,优图实验室是在中国医学科学院肿瘤院乔友林教授指导下开展这个项目的,在核心算法上,该系统采用了全新设计的深度学习网络架构,在一致性方面,团队花了很多精力将算法从单中心向中心拓展,通过自适应图像规整化的方法,提高算法的准确率,通过模拟医生读片过程,帮助判别病灶的位置,为医生提供快速可靠的临床辅诊建议,目前,该系统已经在几家医院做试点,在病人活检上面,可以达到最顶尖医生的水平,要超出 5 个百分点。

在其他应用方面,最近半年来,腾讯优图打破了 3 项记录:1 月份,腾讯优图实验室联合厦门大学组成的 TencentX 团队刷新全球医疗影像大赛 LiTS 双纪录,获得肝分割、肝肿瘤分割两项技术世界记录。全球胸部多器官分割大赛上,TencentX 团队提出的胸部多器官分割系统,在 Dice 指标上取得三项第一和一项第二的成绩,刷新 3 项全球新纪录。

胸部多器官分割系统提供了一种全自动化的基于卷积神经网络结构的健康器官分割方法,能够精确快速地分割出胸腔内位于靶肿瘤附近的健康器官,该系统先通过缩小三维 CT 影像空间距离采样,配合 3D 卷积神经网络实现快速定位,接着利用 2.5D 卷积神经网络沿矢状面、冠状面和水平面三个方向逐层预测结果,同时与 3D 卷积神经网络在完整的 VOI 下直接预测出的结果相结合,产生准确、全面的多器官分割结果,实现了精细分割。

郑冶枫表示,该系统融合了二维和三维图像分割的结果。二维三维分割各自有优缺点:二维分割算法独立分割每层 CT 图像,好处是内存消耗比较小,所以可以采用更深、更大的网络来取得较好的层内分割结果,不过层间一致性较差,会出现不光滑的问题。三维算法能保证层间上的分割结果是连续的,但最大问题是内存消耗大,不能采用较小的网络,导致层内分割精度受影响。为解决这个问题,优图团队将二维、三维图像分割结果做融合,即保证层内分割结果的高准确率,又保证层间的连续性。在郑冶枫看来,在工程上如何让将二维、三维结合起来,这是一个关键技术。

视网膜检查 AI

视网膜检查也是医疗影像 AI 领域最为重要的项目。常言说,眼睛是心灵的窗口,其实,眼睛还是人全身疾病检测的“窗口”。视网膜是全身唯一的、不用开刀就能直接看到血管和神经的部位,几乎所有血液血管疾病、全身性疾病都能在视网膜有所反映,通过做视网膜的异常表现能发现糖尿病、心血管疾病、眼科疾病、肾病等多种全身性疾病的早期征兆,并及时做诊断和治疗,保障患者最佳的诊疗时期。

尽管有如此重要的医疗价值,这项视网膜检查技术却并没有大规模普及。国内专业的眼科医生数量少,全国眼科医生仅 3 万人,且真正会看视网膜照片的医生非常稀缺,全国有资格分析视网膜图像的眼科医生仅有约 1100 人。在医院科系设置上,视网膜检查属于眼科,除视网膜疾病外,眼科医生在诊断心血管疾病等病变的专业性上不足,而其他科医生也不具备视网膜阅片的能力,此外,眼底照相设备价格昂贵,以上种种限制导致了视网膜检查技术普及困难。

AI 成为解决这一难题的突破口。

AI 通过对大量的视网膜图像进行学习后,可以帮助医生阅片,辅助判别病变。Airdoc 是在视网膜检测 AI 这个垂直赛道上的领先企业,在业内深耕数年,Airdoc 积累了一套成熟的技术解决方案。

据悉,Airdoc 研发的人工智能健康风险识别系统可以基于视网膜影像识别 30 种慢性疾病和并发症风险,比如动脉硬化、高血压、心脑血管疾病、糖尿病、青光眼、白内障、视神经疾病、高度近视、年龄相关性黄斑变性等慢性病导致的视网膜异常征兆。

操作该系统的方法非常简单,机器拍摄下用户的进行视网膜影像后,算法立即将视网膜影像发送到云端,并开始用人工智能算法分析视网膜影像,在云端完成视网膜影像的识别,于此同时分析结果实时传输到用户手机上。在准确率方面,大多数临床试验显示,Airdoc 人工智能健康风险评估系统的识别准确率与三甲医院主任医师的水平相当。

Airdoc 创始人张大磊向 AI 前线表示,Airdoc 的人工智能健康风险评估系统依托人工智能图像识别技术,基于数百万张医学影像,邀请 300 多位医学专家进行交叉标注,建立起了标注网络,设计构建了特定的深度神经网络模型。目前 Airdoc 用于深度学习的训练数据已经达到了千万量级,在数据处理上会经过筛选、质控、风险评估、分级、运算、反馈等过程。视网膜检测系统运用了监督学习、强化学习、迁移学习等大量的深度学习方法,像素比更大的医学影像数据对计算力要求较高,Airdoc 采用了 Tensorflow、TNCK 等开放式框架进行训练。

除人工智能健康风险识别系统外,Airdoc 还推出了近视预测产品、自动多功能综合检眼仪等眼睛检测产品。针对儿童青少年的近视问题,Airdoc 的近视预测产品基于医院逾百万条持续追踪的验光数据,能自动预测 3-18 岁儿童青少年的近视发展趋势,如何时会近视,近视度数增长趋等。

自动多功能综合检眼仪是 Airdoc 和一家以色列公司合作推出的视功能检测机器,该机器可以在 2 分钟内将人的眼睛全方位扫描一遍,筛查眼部上千数据,形成关于双眼度数、明暗视差、视疲劳、白内障、青光眼等疾病的风险报告,让人全面了解眼睛的状态。

除了基于眼睛检测,在医疗影像 AI 领域,Airdoc 还延伸出了皮肤病检测、算法自动识别心电图、血糖检测传感器等几大产品线。

攻克小样本学习问题

小样本学习是这两年医疗 AI 领域的一个热门却又棘手的研究课题。

当下医疗 AI 技术的发展还存在一些局限性,比如过度依赖训练样本,深度学习是一个非常依赖数据的技术,要保障深度学习的效果,前提条件是训练样本足够多,要“投喂”给它大量的数据。

然而,现实中是没有足够的已标注的数据的,获得大量已标注的数据又非常困难。一方面,数据的来源是受限制的,很多数据的采集需要专业的设备,比如 CT 和 MRI 等设备非常昂贵;出于对自身隐私的保护,患者也不愿意共享自己的医疗数据信息。另一方面,在数据的标注上也是一个难题,医疗影像标注需要顶尖的医疗专家参与,但因为相关人才缺乏,加之临床、科研任务重,很多医疗专家没有时间做数据标注。

郑冶枫认为,小样本学习的问题是当下医疗影像 AI 面临的最大挑战。“我们经常希望拿到几千万量级的数据,而实际上能够有几万数据就已经很好了,很多时候,遇到一些罕见疾病的时候,只有一两千甚至几百的数据量,这让最后出来的效果难以保障,小样本学习是一个迫切需要解决的问题“。

现在针对小样本学习问题,业界也提出了一些解决方法,目前小样本学习的研究成果主要是把一些已知类别的一些信息迁移到新的类别上,无监督学习或半监督方法也是未来的发展方向。

郑冶枫表示,目前腾讯优图团队在致力于解决小样本学习的问题,他表示,目前团队已提出了两种解决方案:迁移学习、计算机合成图像。针对有监督的小样本学习问题,优图会专门在医学图像上预训练一个模型,然后做迁移。最近团队在腾讯 GitHub 的官方账号下开源了 MedicalNet 预训模型和相关代码,供业界免费使用。这是全球首个专门针对 3D 医学影像的预训练模型,也是腾讯在医疗 AI 方面的首个开源项目。此外,计算机合成图像可以对训练样本形成有效补充,尤其是可以利用生成对抗网络(GAN)产生逼真图像。

“我们最近开始尝试把样本数据再往下减,从几千张、几百张再进行压缩,压缩到几十张甚至更少到两三张,我认为这是一个非常关键的技术,在这样的情况下,如何去训练出一个好的结果。”

张大磊认为小样本学习尽管热度高,但效果一般化,在这方面,Airdoc 在尝试利用对抗生成网络技术攻克难题。他认为,在医疗领域,一张影像不能解决所有的问题,要广泛结合病史、病例、发展进程去综合考量。多模态的一个局限性是,算法“造”出来了一个样本,看上去理论上似乎是存在的,但现实生活中是否真正存在这样一个人,如果不存在,最后又该如何验证结果?有些罕见的疾病一年全中国可能就发生 1-2 例,类似这样的情况在积攒足量的数据上难度很大。

在数据标注方面,Airdoc 建立起了一个标注网络,以视网膜为例,每个标注专家会通过自动推荐的算法领到自己喜欢或者擅长的标注任务,接下来,多个专家独立执行标注任务,如果所有专家达成共识的部分,将其作为标注,反之,则舍弃掉,通过独立标注、交叉质控的方法大大提高了标注质量。

张大磊坦言,数据标注这件“苦”活儿没有什么好的办法,只有依靠持续的积累,“我不觉得它难,我觉得它需要坚持去做”。在标注专家这方面,Airdoc 已经形成了一个 300 多人的全球标注医生团队,他认为做大标注网络是针对数据标注难题的一个有效解决方案。

写在最后

未来 3-5 年,哪些医疗 AI 技术比较有发展前景?

“小样本学习是未来几年需要重点攻克的问题”,郑冶枫表示,腾讯优图目前还在基于医疗影像的个性化治疗方案上做探索。

张大磊认为,人工智能技术在疾病的预测和预防上仍有很多的实现场景和应用潜力,Airdoc 目前在探索的一个方向是,通过皮下植入传感器持续监测生命体征,进而研究生命体征与遗产基因代谢、生活方式间的关系。

人工智能技术的运用为传统的传统医疗体系带来了一些充满惊喜的颠覆和改变,当然也不乏挑战和隐忧,有人担心,AI 是否会抢了医生的饭碗?事实上,这种担忧未免太早。“治疗端的活儿还是要交给医生“,张大磊的观点简洁明了。郑冶枫认为,在流程方面,腾讯优图希望把 AI 算法无缝嵌入到诊断流程里,并不希望改变医生的流程,而是基于医生现有的流程之上做一些辅助诊断。

谈到技术是否是一家医疗 AI 公司的“护城河”这一问题时,两位专家都认为,技术只是其中的壁垒之一,但不是唯一,尤其是在如今行业、技术发展革新速度迅猛的大环境下,固守技术便意味着某种程度上的落后,“对技术的追求和技术能否保持持续演进、对客户需求和落地场景的理解、三者缺一不可,为技术找到一个好的应用场景、构建好的生态系统非常重要“,张大磊表示。郑冶枫亦表示,腾讯优图要利用在算法上的优势,将 AI 技术落地到更多基层的场景去,帮助基层医生提高诊断准确率。

技术诚重要,落地是关键,而商业化变现才是终极大考,接下来的「落地篇」将重点探讨关于医疗 AI 技术的应用落地与商业化变现,敬请关注。

参考资料

1、上海交通大学,《2019 中国人工智能医疗白皮书》

2、CAIEAR 中国医学影像 AI 白皮书

延伸阅读:

《2019 年,医疗 AI 的热潮将会退去》

评论

发布