解密平安科技:突破医学影像世界纪录背后的故事

  • 陈利鑫

2018 年 1 月 30 日

话题:语言 & 开发架构

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

古人医在心,心正药自真。

古时与现在的医疗水平不可同日而语,随着现代社会医疗水平不断提高,尤其是新的医疗技术出现,让医者不必仿李时珍、扁鹊之类医者尝百草,遍游诸国救死扶伤,医疗效果也大大提高,比如医疗影像技术。然而,即使这种技术提高了效率,但是仍然无法解决很多新出现的问题。

医疗影像是现代医学最重要的临床诊断和鉴别诊断工具。影像成像技术的不断丰富使医学影像从辅助检查工具变为现阶段医生做诊断时最大的信息入口,接近 70% 的临床诊断需借助医学影像。在中国,放射科有超过 50% 的医生工作时间在 8 小时以上,20.6% 的医生每天平均工作时间超过 10 个小时。我国目前医学影像数据的年增长率约为 30%,而放射科医师数量的年增长率只有 4.1%,放射科医师数量增长远不及影像数据增长。病理医生现今的人才缺口也达到 70 万人左右。在繁重的工作负担下,医学影像只能通过影像医生的经验对可疑病灶进行识别及判断,误诊和漏诊率较高,部分疾病中高年资与低年资医生的诊断差距可达 30% 左右。

在供需存在巨大缺口,而且短期很难补齐的现实条件下,将人工智能应用于医学影像,提高医生的读片效率和准确率,减轻现在影像科医生的工作压力,成为了刚需。 此外,机器看片更为客观的分析结果,其实也一定程度上降低了人为操作的误判率。2018 年伊始,平安科技的医疗影像产品平安颖像以 95.1% 和 96.8% 的精度刷新了“肺结节检测”和“假阳性筛选”的世界纪录,这显示着医疗影像智能识别的精准度不断提高,终将帮助医生有效提高医疗质量和效率,对于相关行业和普通大众来说都是一个好消息。

平安科技医疗影像团队打破世界纪录的成果具体是什么?此项目获得成功的背后经历了怎样的故事?AI 前线采访了平安科技首席科学家,平安技术研究院院长,兼智能引擎部总经理肖京博士对此进行了解,希望能透过平安医疗影像开发的过程,一定程度上映射出人工智能医疗影像目前的应用和所处的发展阶段。

  • 技术突破

图像分析 2D 转 3D,实现全链路深度学习和迁移学习

平安科技打破世界纪录的这项技术的特别之处在于,“首先,我们的技术创新是将结节图像分析技术从 2D 转到 3D,3D 转换之后候选区域看得更加明显,多角度更加清晰,抓取肺结节的 360 度全景信息,3D 模型比 2D 模型的表现更好。”算法工程师刘莉红说道,“同时我们还将鲁棒控制理论与之前比赛使用的一些模型结合,实现全链路深度学习和迁移学习,最后找到深度融合的集成学习解决方案,最终在肺结节检测定位及识别领域取得了不错的成绩,达到的 96.8% 精度是目前世界范围内的最好成绩,并已经逐步在多家医院的实际场景中应用。”

融合 AI 算法,肺结节检测获突破

在全球范围内,肺癌是所有癌症种类中死亡率最高的疾病之一。目前最为适用的方法是以美国所推进的低剂量 CT 来扫描筛查高风险个体肺癌。但这种方法有一个弊端,即一般筛查过程需要医生分析数百张 CT 影像,这对医治过程来说是一个很大的负担。因此,开发智能肺癌检测算法来优化筛选迫在眉睫。针对这个极具挑战性的课题,平安科技医疗影像团队利用在医疗诊断领域的综合优势,创造性地提出了将鲁棒控制理论与深度学习及迁移学习等人工智能先进算法深度融合的解决方案,最终在肺结节检测定位及识别领域取得突破。目前,该技术正逐步在多家各级医院的实际医疗辅助诊断场景中应用。

  • 非结构化数据处理——深度学习云平台“平安深弹”

医疗影像包含海量的非结构化数据,了解数据处理的专业人士知道,非结构化数据是数据处理过程中比较棘手的问题。对此,平安科技依托于自建的平安深度学习云平台——“平安深弹”。“‘深’是深度学习,‘弹’是多音字,又有弹性的意思,同时意味着,这是个弹性平台。目前平安深度学习平台已经可以实现从一百个节点到一万个节点的拓展在平安科技的整个生态中是作为一个工具存在的。”

肖京博士告诉 AI 前线记者,该平台在作为数据载体的同时,也是一个模型训练引擎。通过这样一个平台,最终能够实现快速的数据获取和数据的 ETL(Extract-Transform-Load) 处理。利用海量数据的深度学习训练往往迭代一次耗时很长,而平安的深度学习平台能够加速迭代,快速地实现模型优化。

在实际的业务场景应用中,该平台也可以发挥很大作用。举一个简单的例子:在服务量很大的时候,平台会做自动的、弹性的处理,名词叫弹性计算(Elastic Computing),假设总共有一百台机器,90 台是在提供线上服务,10 台在进行训练;等到服务高峰期过后,平台会自动将机器切换成 90 台提供训练,10 台提供先上服务,同时还能够实现多机多卡的 GPU 的训练和调度,支持所有的图像语音视频进行训练。 “这一技术平台产品也将对外输出,不仅授人以鱼,也授人以渔。”

突破瓶颈背后的故事

在医疗影像这个具体领域中,肖京博士凭着 20 多年图像分析识别的研发经验,针对肺结节的识别难点和特征,制定出整体解决方案和路线图,是整个算法的总设计师,并建议团队在具体项目实施过程中尝试图像多尺度、上下文信息、2.5-3 维建模等多种方法,使得模型准确率得到显著的提高。

“为山九仞,岂一日之功”。平安科技在医疗影像方面取得成绩并非一日达成,事实上,在过去几年中,平安在科技研发方面投入的资金已经超过 500 亿元。

应用场景

平安科技目前除了推出了胃癌检测、骨龄预测、糖网筛查、宫颈癌判定、甲状腺癌及胸片疾病检测系统等多项医疗 AI 能力以外,在医疗领域,还通过海量数据训练形成高精度的 OCR 识别算法,并采用众包模式的人工审核配套辅助,轻松完成图片转文字的录入工作,有效的推动了医疗档案数字化管理。与此同时,“刷脸就医”、“刷脸缴费”等智能化医疗过程也极大便利了患者就诊,提升了公共医疗系统的服务和效率。在预测 AI 方面,平安科技携手重庆疾控中心首创国内 “人工智能 + 大数据”疾病预测与筛查模型,实现提前一周预测传染病发生情况,助力相关部门在疾病预防和控制的工作中提升效率并降低成本。

此外平安科技联合业务公司研发的智能闪赔、平安声纹等多项产品不仅技术上国际领先,更重要的是形成了完整的业务解决方案,并且其实用效果在平安丰富而大量的业务生产环境中得到了充分的验证。

比如智能闪赔,利用先进的图像识别技术,加上对平安多年积累的大数据分析挖掘而成的强大业务知识图谱和规则引擎,从而通过车损图片,即可风险可控地自动计算损失项目、损失程度、和理赔方案,将车险定损时长从天级缩短到秒级,大大提升定损效率以及客户体验。目前平安是国际上唯一一家能够在生产环境中实现此类技术全面商用的企业。

另外,毫无疑问身份认证对于金融领域的重要性极高,客户信息准确确认能够极大程度降低信息盗用风险。传统的身份认证环节往往需要人工介入。平安声纹利用独创的深度融合算法模型,实时比对声纹特征进行说话人确认和辨识, 大大节省核身时间并改善用户体验, 目前已经在电话客服核身、移动应用登陆、“黑名单”拦截等多个业务场景中得到广泛应用。

刚萌芽到初步成长的阶段

人工智能在医疗影像方面的应用起步很早,但目前仍然处于初级阶段,大多数医疗影像 AI 公司尝试与医院进行科研合作,但真正深入到临床的医疗影像 AI 产品则非常少。

技术上通过算法寻找影像中的病灶可能不是最大的挑战,更大的问题在于获取足够的训练数据以及得到医疗专家的专业支持与合作。对此,平安的行业属性使其具备了得天独厚的优势。因为保险本身就是医疗体系中的重要环节之一,平安与医疗健康行业之间的深度联系,以及平安集团在传统医疗健康和互联网医疗领域的布局,为人工智能技术在医疗健康领域得到有效实际应用创造了优越的条件。

“我们可以看出来,目前来说,整个行业处于一个刚萌芽到初步成长的阶段,接下来需要在不断优化模型算法的同时,积极与各级医疗机构合作,拓展应用场景并快速迭代提高产品质量和体验。相信在不远的将来,智能医疗影像产品能够为医生和患者节省时间和成本,优化诊疗效率。”肖京说道。


感谢杜小芳对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

语言 & 开发架构