【锁定直播】字节、华为云、阿里云等技术专家讨论如何将大模型接入 AIOps 解决实际问题,戳>>> 了解详情
写点什么

解密平安科技:突破医学影像世界纪录背后的故事

  • 2018-01-30
  • 本文字数:3302 字

    阅读完需:约 11 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

古人医在心,心正药自真。

古时与现在的医疗水平不可同日而语,随着现代社会医疗水平不断提高,尤其是新的医疗技术出现,让医者不必仿李时珍、扁鹊之类医者尝百草,遍游诸国救死扶伤,医疗效果也大大提高,比如医疗影像技术。然而,即使这种技术提高了效率,但是仍然无法解决很多新出现的问题。

医疗影像是现代医学最重要的临床诊断和鉴别诊断工具。影像成像技术的不断丰富使医学影像从辅助检查工具变为现阶段医生做诊断时最大的信息入口,接近 70% 的临床诊断需借助医学影像。在中国,放射科有超过 50% 的医生工作时间在 8 小时以上,20.6% 的医生每天平均工作时间超过 10 个小时。我国目前医学影像数据的年增长率约为 30%,而放射科医师数量的年增长率只有 4.1%,放射科医师数量增长远不及影像数据增长。病理医生现今的人才缺口也达到 70 万人左右。在繁重的工作负担下,医学影像只能通过影像医生的经验对可疑病灶进行识别及判断,误诊和漏诊率较高,部分疾病中高年资与低年资医生的诊断差距可达 30% 左右。

在供需存在巨大缺口,而且短期很难补齐的现实条件下,将人工智能应用于医学影像,提高医生的读片效率和准确率,减轻现在影像科医生的工作压力,成为了刚需。 此外,机器看片更为客观的分析结果,其实也一定程度上降低了人为操作的误判率。2018 年伊始,平安科技的医疗影像产品平安颖像以 95.1% 和 96.8% 的精度刷新了“肺结节检测”和“假阳性筛选”的世界纪录,这显示着医疗影像智能识别的精准度不断提高,终将帮助医生有效提高医疗质量和效率,对于相关行业和普通大众来说都是一个好消息。

平安科技医疗影像团队打破世界纪录的成果具体是什么?此项目获得成功的背后经历了怎样的故事?AI 前线采访了平安科技首席科学家,平安技术研究院院长,兼智能引擎部总经理肖京博士对此进行了解,希望能透过平安医疗影像开发的过程,一定程度上映射出人工智能医疗影像目前的应用和所处的发展阶段。

  • 技术突破

图像分析 2D 转 3D,实现全链路深度学习和迁移学习

平安科技打破世界纪录的这项技术的特别之处在于,“首先,我们的技术创新是将结节图像分析技术从 2D 转到 3D,3D 转换之后候选区域看得更加明显,多角度更加清晰,抓取肺结节的 360 度全景信息,3D 模型比 2D 模型的表现更好。”算法工程师刘莉红说道,“同时我们还将鲁棒控制理论与之前比赛使用的一些模型结合,实现全链路深度学习和迁移学习,最后找到深度融合的集成学习解决方案,最终在肺结节检测定位及识别领域取得了不错的成绩,达到的 96.8% 精度是目前世界范围内的最好成绩,并已经逐步在多家医院的实际场景中应用。”

融合 AI 算法,肺结节检测获突破

在全球范围内,肺癌是所有癌症种类中死亡率最高的疾病之一。目前最为适用的方法是以美国所推进的低剂量 CT 来扫描筛查高风险个体肺癌。但这种方法有一个弊端,即一般筛查过程需要医生分析数百张 CT 影像,这对医治过程来说是一个很大的负担。因此,开发智能肺癌检测算法来优化筛选迫在眉睫。针对这个极具挑战性的课题,平安科技医疗影像团队利用在医疗诊断领域的综合优势,创造性地提出了将鲁棒控制理论与深度学习及迁移学习等人工智能先进算法深度融合的解决方案,最终在肺结节检测定位及识别领域取得突破。目前,该技术正逐步在多家各级医院的实际医疗辅助诊断场景中应用。

  • 非结构化数据处理——深度学习云平台“平安深弹”

医疗影像包含海量的非结构化数据,了解数据处理的专业人士知道,非结构化数据是数据处理过程中比较棘手的问题。对此,平安科技依托于自建的平安深度学习云平台——“平安深弹”。“‘深’是深度学习,‘弹’是多音字,又有弹性的意思,同时意味着,这是个弹性平台。目前平安深度学习平台已经可以实现从一百个节点到一万个节点的拓展在平安科技的整个生态中是作为一个工具存在的。”

肖京博士告诉 AI 前线记者,该平台在作为数据载体的同时,也是一个模型训练引擎。通过这样一个平台,最终能够实现快速的数据获取和数据的 ETL(Extract-Transform-Load) 处理。利用海量数据的深度学习训练往往迭代一次耗时很长,而平安的深度学习平台能够加速迭代,快速地实现模型优化。

在实际的业务场景应用中,该平台也可以发挥很大作用。举一个简单的例子:在服务量很大的时候,平台会做自动的、弹性的处理,名词叫弹性计算(Elastic Computing),假设总共有一百台机器,90 台是在提供线上服务,10 台在进行训练;等到服务高峰期过后,平台会自动将机器切换成 90 台提供训练,10 台提供先上服务,同时还能够实现多机多卡的 GPU 的训练和调度,支持所有的图像语音视频进行训练。 “这一技术平台产品也将对外输出,不仅授人以鱼,也授人以渔。”

突破瓶颈背后的故事

在医疗影像这个具体领域中,肖京博士凭着 20 多年图像分析识别的研发经验,针对肺结节的识别难点和特征,制定出整体解决方案和路线图,是整个算法的总设计师,并建议团队在具体项目实施过程中尝试图像多尺度、上下文信息、2.5-3 维建模等多种方法,使得模型准确率得到显著的提高。

“为山九仞,岂一日之功”。平安科技在医疗影像方面取得成绩并非一日达成,事实上,在过去几年中,平安在科技研发方面投入的资金已经超过 500 亿元。

应用场景

平安科技目前除了推出了胃癌检测、骨龄预测、糖网筛查、宫颈癌判定、甲状腺癌及胸片疾病检测系统等多项医疗 AI 能力以外,在医疗领域,还通过海量数据训练形成高精度的 OCR 识别算法,并采用众包模式的人工审核配套辅助,轻松完成图片转文字的录入工作,有效的推动了医疗档案数字化管理。与此同时,“刷脸就医”、“刷脸缴费”等智能化医疗过程也极大便利了患者就诊,提升了公共医疗系统的服务和效率。在预测 AI 方面,平安科技携手重庆疾控中心首创国内 “人工智能 + 大数据”疾病预测与筛查模型,实现提前一周预测传染病发生情况,助力相关部门在疾病预防和控制的工作中提升效率并降低成本。

此外平安科技联合业务公司研发的智能闪赔、平安声纹等多项产品不仅技术上国际领先,更重要的是形成了完整的业务解决方案,并且其实用效果在平安丰富而大量的业务生产环境中得到了充分的验证。

比如智能闪赔,利用先进的图像识别技术,加上对平安多年积累的大数据分析挖掘而成的强大业务知识图谱和规则引擎,从而通过车损图片,即可风险可控地自动计算损失项目、损失程度、和理赔方案,将车险定损时长从天级缩短到秒级,大大提升定损效率以及客户体验。目前平安是国际上唯一一家能够在生产环境中实现此类技术全面商用的企业。

另外,毫无疑问身份认证对于金融领域的重要性极高,客户信息准确确认能够极大程度降低信息盗用风险。传统的身份认证环节往往需要人工介入。平安声纹利用独创的深度融合算法模型,实时比对声纹特征进行说话人确认和辨识, 大大节省核身时间并改善用户体验, 目前已经在电话客服核身、移动应用登陆、“黑名单”拦截等多个业务场景中得到广泛应用。

刚萌芽到初步成长的阶段

人工智能在医疗影像方面的应用起步很早,但目前仍然处于初级阶段,大多数医疗影像 AI 公司尝试与医院进行科研合作,但真正深入到临床的医疗影像 AI 产品则非常少。

技术上通过算法寻找影像中的病灶可能不是最大的挑战,更大的问题在于获取足够的训练数据以及得到医疗专家的专业支持与合作。对此,平安的行业属性使其具备了得天独厚的优势。因为保险本身就是医疗体系中的重要环节之一,平安与医疗健康行业之间的深度联系,以及平安集团在传统医疗健康和互联网医疗领域的布局,为人工智能技术在医疗健康领域得到有效实际应用创造了优越的条件。

“我们可以看出来,目前来说,整个行业处于一个刚萌芽到初步成长的阶段,接下来需要在不断优化模型算法的同时,积极与各级医疗机构合作,拓展应用场景并快速迭代提高产品质量和体验。相信在不远的将来,智能医疗影像产品能够为医生和患者节省时间和成本,优化诊疗效率。”肖京说道。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2018-01-30 18:003656
用户头像

发布了 42 篇内容, 共 13.6 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

十大算法

wudaxue

第6章-《Linux一学就会》- Centos8 用户管理

学神来啦

Linux 运维 linux学习 linux云计算

当支付宝 App 遇见 AndroidX......

阿里巴巴终端技术

android App 移动端 AndroidX

GraphQL 快速入门【4】GraphQL 组件

码语者

Rest graphql

不愧是阿里高工出产的《Java面试手册》,实战命中率竟高达“80%”

Java 架构 面试 后端

大数据presto作业

Clarke

后端选择 java, 还是 python?

cdhqyj

低代码的自动化工作流靠谱吗?对企业有何帮助?

优秀

自动化 低代码

网站攻击到提权的全部过程

网络安全学海

黑客 网络安全 信息安全 WEB安全 漏洞分析

2022前端react高频面试题

buchila11

React

DCEP:真正的“无现金新时代”!现已完成技术对接!

CECBC

顺丰对供应链+区块链应用的思考与规划

CECBC

太有用,Alibaba架构师十年心血熬成的435网络协议文档

程序员 编程语言 网络协议 TCP/IP

AI技术在漫画阅读体验上的应用

快看工程技术中心

深度学习 AI 漫画

技术干货 | Native 页面下如何实现导航栏的定制化开发?

蚂蚁集团移动开发平台 mPaaS

大前端 H5 移动开发 mPaaS

夸克APP端智能:文档关键点检测实践与应用

阿里巴巴终端技术

算法 移动开发 客户端 端智能

云拨测助力节卡机器人 全面优化海外网站性能

阿里巴巴云原生

阿里云 云原生 拨测 成功案例

P8整理的OpenStack构架,希望能帮助到你

hanaper

财经大课:从效率公平看“共同富裕”

石云升

学习笔记 9月日更 共同富裕

小程序下一破局点?钉钉小程序卡片,应用与平台的深度集成

阿里巴巴终端技术

小程序 ios android App 移动开发

大模型时代的AI之变与开发之根

脑极体

常用的 分布式事务 都有哪些?我该用哪个?

Java 程序员 面试 后端 计算机

百度智能云全面升级金融AI中台解决方案, 打造软硬一体AI开发全栈能力

百度大脑

人工智能 金融

内含(基础+进阶+高级+调优)的神仙级的阿里巴巴“MySQL”教程限时开源!

Java 架构 面试 程序人生 编程语言

深入浅出Redis宝典,阿里架构师10年经验汇总,PDF免费分享

Java redis 架构

列举出常见的Java面试题100+,我靠这个在十月拿到了阿里的offer

Java 程序员 编程语言

企业如何通过图数据库及知识图谱形成业务壁垒

星环科技

这份阿里P8手写的JDK发展史源码剖析手册,竟获GitHub热门榜第一

Java 架构 面试 程序人生 编程语言

开发上云,化繁为简 | CIF 论坛精彩看点

CODING DevOps

腾讯云 DevOps 云原生 云开发 CIF

如何处理各种「陨石开发」的紧急要求?

LigaAI

敏捷开发

想要入职阿里P8?至少是要啃完这本500页Java并发多线程源码笔记!

Java 架构 面试 程序人生 编程语言

解密平安科技:突破医学影像世界纪录背后的故事_语言 & 开发_陈利鑫_InfoQ精选文章