写点什么

解密平安科技:突破医学影像世界纪录背后的故事

  • 2018-01-30
  • 本文字数:3302 字

    阅读完需:约 11 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

古人医在心,心正药自真。

古时与现在的医疗水平不可同日而语,随着现代社会医疗水平不断提高,尤其是新的医疗技术出现,让医者不必仿李时珍、扁鹊之类医者尝百草,遍游诸国救死扶伤,医疗效果也大大提高,比如医疗影像技术。然而,即使这种技术提高了效率,但是仍然无法解决很多新出现的问题。

医疗影像是现代医学最重要的临床诊断和鉴别诊断工具。影像成像技术的不断丰富使医学影像从辅助检查工具变为现阶段医生做诊断时最大的信息入口,接近 70% 的临床诊断需借助医学影像。在中国,放射科有超过 50% 的医生工作时间在 8 小时以上,20.6% 的医生每天平均工作时间超过 10 个小时。我国目前医学影像数据的年增长率约为 30%,而放射科医师数量的年增长率只有 4.1%,放射科医师数量增长远不及影像数据增长。病理医生现今的人才缺口也达到 70 万人左右。在繁重的工作负担下,医学影像只能通过影像医生的经验对可疑病灶进行识别及判断,误诊和漏诊率较高,部分疾病中高年资与低年资医生的诊断差距可达 30% 左右。

在供需存在巨大缺口,而且短期很难补齐的现实条件下,将人工智能应用于医学影像,提高医生的读片效率和准确率,减轻现在影像科医生的工作压力,成为了刚需。 此外,机器看片更为客观的分析结果,其实也一定程度上降低了人为操作的误判率。2018 年伊始,平安科技的医疗影像产品平安颖像以 95.1% 和 96.8% 的精度刷新了“肺结节检测”和“假阳性筛选”的世界纪录,这显示着医疗影像智能识别的精准度不断提高,终将帮助医生有效提高医疗质量和效率,对于相关行业和普通大众来说都是一个好消息。

平安科技医疗影像团队打破世界纪录的成果具体是什么?此项目获得成功的背后经历了怎样的故事?AI 前线采访了平安科技首席科学家,平安技术研究院院长,兼智能引擎部总经理肖京博士对此进行了解,希望能透过平安医疗影像开发的过程,一定程度上映射出人工智能医疗影像目前的应用和所处的发展阶段。

  • 技术突破

图像分析 2D 转 3D,实现全链路深度学习和迁移学习

平安科技打破世界纪录的这项技术的特别之处在于,“首先,我们的技术创新是将结节图像分析技术从 2D 转到 3D,3D 转换之后候选区域看得更加明显,多角度更加清晰,抓取肺结节的 360 度全景信息,3D 模型比 2D 模型的表现更好。”算法工程师刘莉红说道,“同时我们还将鲁棒控制理论与之前比赛使用的一些模型结合,实现全链路深度学习和迁移学习,最后找到深度融合的集成学习解决方案,最终在肺结节检测定位及识别领域取得了不错的成绩,达到的 96.8% 精度是目前世界范围内的最好成绩,并已经逐步在多家医院的实际场景中应用。”

融合 AI 算法,肺结节检测获突破

在全球范围内,肺癌是所有癌症种类中死亡率最高的疾病之一。目前最为适用的方法是以美国所推进的低剂量 CT 来扫描筛查高风险个体肺癌。但这种方法有一个弊端,即一般筛查过程需要医生分析数百张 CT 影像,这对医治过程来说是一个很大的负担。因此,开发智能肺癌检测算法来优化筛选迫在眉睫。针对这个极具挑战性的课题,平安科技医疗影像团队利用在医疗诊断领域的综合优势,创造性地提出了将鲁棒控制理论与深度学习及迁移学习等人工智能先进算法深度融合的解决方案,最终在肺结节检测定位及识别领域取得突破。目前,该技术正逐步在多家各级医院的实际医疗辅助诊断场景中应用。

  • 非结构化数据处理——深度学习云平台“平安深弹”

医疗影像包含海量的非结构化数据,了解数据处理的专业人士知道,非结构化数据是数据处理过程中比较棘手的问题。对此,平安科技依托于自建的平安深度学习云平台——“平安深弹”。“‘深’是深度学习,‘弹’是多音字,又有弹性的意思,同时意味着,这是个弹性平台。目前平安深度学习平台已经可以实现从一百个节点到一万个节点的拓展在平安科技的整个生态中是作为一个工具存在的。”

肖京博士告诉 AI 前线记者,该平台在作为数据载体的同时,也是一个模型训练引擎。通过这样一个平台,最终能够实现快速的数据获取和数据的 ETL(Extract-Transform-Load) 处理。利用海量数据的深度学习训练往往迭代一次耗时很长,而平安的深度学习平台能够加速迭代,快速地实现模型优化。

在实际的业务场景应用中,该平台也可以发挥很大作用。举一个简单的例子:在服务量很大的时候,平台会做自动的、弹性的处理,名词叫弹性计算(Elastic Computing),假设总共有一百台机器,90 台是在提供线上服务,10 台在进行训练;等到服务高峰期过后,平台会自动将机器切换成 90 台提供训练,10 台提供先上服务,同时还能够实现多机多卡的 GPU 的训练和调度,支持所有的图像语音视频进行训练。 “这一技术平台产品也将对外输出,不仅授人以鱼,也授人以渔。”

突破瓶颈背后的故事

在医疗影像这个具体领域中,肖京博士凭着 20 多年图像分析识别的研发经验,针对肺结节的识别难点和特征,制定出整体解决方案和路线图,是整个算法的总设计师,并建议团队在具体项目实施过程中尝试图像多尺度、上下文信息、2.5-3 维建模等多种方法,使得模型准确率得到显著的提高。

“为山九仞,岂一日之功”。平安科技在医疗影像方面取得成绩并非一日达成,事实上,在过去几年中,平安在科技研发方面投入的资金已经超过 500 亿元。

应用场景

平安科技目前除了推出了胃癌检测、骨龄预测、糖网筛查、宫颈癌判定、甲状腺癌及胸片疾病检测系统等多项医疗 AI 能力以外,在医疗领域,还通过海量数据训练形成高精度的 OCR 识别算法,并采用众包模式的人工审核配套辅助,轻松完成图片转文字的录入工作,有效的推动了医疗档案数字化管理。与此同时,“刷脸就医”、“刷脸缴费”等智能化医疗过程也极大便利了患者就诊,提升了公共医疗系统的服务和效率。在预测 AI 方面,平安科技携手重庆疾控中心首创国内 “人工智能 + 大数据”疾病预测与筛查模型,实现提前一周预测传染病发生情况,助力相关部门在疾病预防和控制的工作中提升效率并降低成本。

此外平安科技联合业务公司研发的智能闪赔、平安声纹等多项产品不仅技术上国际领先,更重要的是形成了完整的业务解决方案,并且其实用效果在平安丰富而大量的业务生产环境中得到了充分的验证。

比如智能闪赔,利用先进的图像识别技术,加上对平安多年积累的大数据分析挖掘而成的强大业务知识图谱和规则引擎,从而通过车损图片,即可风险可控地自动计算损失项目、损失程度、和理赔方案,将车险定损时长从天级缩短到秒级,大大提升定损效率以及客户体验。目前平安是国际上唯一一家能够在生产环境中实现此类技术全面商用的企业。

另外,毫无疑问身份认证对于金融领域的重要性极高,客户信息准确确认能够极大程度降低信息盗用风险。传统的身份认证环节往往需要人工介入。平安声纹利用独创的深度融合算法模型,实时比对声纹特征进行说话人确认和辨识, 大大节省核身时间并改善用户体验, 目前已经在电话客服核身、移动应用登陆、“黑名单”拦截等多个业务场景中得到广泛应用。

刚萌芽到初步成长的阶段

人工智能在医疗影像方面的应用起步很早,但目前仍然处于初级阶段,大多数医疗影像 AI 公司尝试与医院进行科研合作,但真正深入到临床的医疗影像 AI 产品则非常少。

技术上通过算法寻找影像中的病灶可能不是最大的挑战,更大的问题在于获取足够的训练数据以及得到医疗专家的专业支持与合作。对此,平安的行业属性使其具备了得天独厚的优势。因为保险本身就是医疗体系中的重要环节之一,平安与医疗健康行业之间的深度联系,以及平安集团在传统医疗健康和互联网医疗领域的布局,为人工智能技术在医疗健康领域得到有效实际应用创造了优越的条件。

“我们可以看出来,目前来说,整个行业处于一个刚萌芽到初步成长的阶段,接下来需要在不断优化模型算法的同时,积极与各级医疗机构合作,拓展应用场景并快速迭代提高产品质量和体验。相信在不远的将来,智能医疗影像产品能够为医生和患者节省时间和成本,优化诊疗效率。”肖京说道。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2018-01-30 18:004378
用户头像

发布了 42 篇内容, 共 16.1 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

GitHub标星75k,阿里15W字的Spring高级文档(全彩版),真的太香了

程序知音

Java spring ssm java架构 后端技术

三到五年互联网公司Java面试题大全

钟奕礼

Java 程序员 java面试 java编程

2022年华为Java面经,还没搞懂JVM

钟奕礼

Java 程序员 Java 面试 java编程

霸榜巨作!阿里内部顶级大佬整理(Redis 5设计与源码分析)

钟奕礼

Java 程序员 java面试 java编程

Scrum Patterns:产品的自豪感(Product Pride)

Bruce Talk

Scrum 敏捷 Agile Scrum Patterns

网络核心笔记(一)

lxmoe

学习笔记 网络 11月月更

如何召回流失用户

穿过生命散发芬芳

11月月更 流失召回

架构实战营模块 5 作业

陌生流云

架构实战营

从基础到实战,阿里巴巴高并发系统设计全彩版手册限时开源

Java全栈架构师

程序员 面试 程序员人生 高并发 架构师

网络核心笔记(二)

lxmoe

学习笔记 网络 11月月更

2022成功入职阿里:阿里的三套Java研发岗面试题总结(文末有答案)

钟奕礼

Java java面试 java编程 程序员、

8年Java开发含泪刷题,架构岗现在好难进,有点崩溃

钟奕礼

Java 程序员 java面试 java编程

赞不绝口!仅靠阿里P9分享的 Redis 工作手册,拿到60W年薪Offer

程序知音

Java 数据库 redis 后端技术 Redis 6.0

ABBYY FineReader16最新版PDF编辑器功能介绍

茶色酒

abbyy

架构误区系列5:滥用分布式锁

agnostic

分布式锁

精选2022年大厂高频Java面试真题集锦(含答案),面试一路开挂

程序知音

java面试 大厂面试 java架构 后端技术 Java面试八股文

有限状态机

芯动大师

Verilog 11月月更 Melay FSM

Camtasia2023免费电脑录屏视频软件使用教程

茶色酒

Camtasia Camtasia2023

FL Studio21最新版编曲DJ舞曲制作软件

茶色酒

FL Studio FL Studio 21

聊聊香港优才-续篇(58/100)

hackstoic

香港优才

亿级万物互联新时代的物联网消息中间件EMQX调研

宋小生

物联网 mqtt emqx

阿里、百度、美团、面试题大集合,愿你更轻松拿下大厂offer

钟奕礼

Java java面试 java编程 程序员、

API渗透测试4个关键步骤

阿泽🧸

11月月更 API渗透测试

LeetCode题解:783. 二叉搜索树节点最小距离,栈,JavaScript,详细注释

Lee Chen

JavaScript 算法 LeetCode

这20道微服务面试题,阿里、字节、美团、百度面试都问了

钟奕礼

Java 程序员 java面试 java编程

CorelDraw2023主要功能特性

茶色酒

CorelDraw2023 CorelDraw

算法题学习---链表的奇偶重排

桑榆

算法题 11月月更

OSPF路由协议三

初学者

网络 11月月更

CleanMyMac2023Mac系统电脑磁盘优化软件

茶色酒

CleanMyMac CleanMyMac2023

Redis分布式锁剖析和几种客户端的实现

C++后台开发

redis 分布式 后端开发 C++开发

一篇文章彻底理解 HDFS 的安全模式

明哥的IT随笔

hadoop hdfs

解密平安科技:突破医学影像世界纪录背后的故事_语言 & 开发_陈利鑫_InfoQ精选文章