Zocdoc 在 AWS 上使用 TensorFlow 帮助患者安心看病

2019 年 10 月 31 日

Zocdoc 在 AWS 上使用 TensorFlow 帮助患者安心看病

医疗保健行业的情况非常复杂。最近的调查表明,超过一半的美国人不清楚所持保险涵盖的范围,四分之三的人希望通过更简单的方法来确认医生是否在保险公司网络内。


Zocdoc 帮助患者理清了这一混乱局面,让需要医疗保健的个人能够做出更明智的选择,同时找到满足其需求的医疗服务。Zocdoc 致力于优化医疗保健数据来帮助患者,支持其完成该使命的核心就是 AWS 上的深度学习。有了使用 TensorFlow 深度学习框架构建的算法,Zocdoc 可更高效地为患者分配医生。患者可预约 24 小时内看诊,过去全国新患者等待看诊的平均等待时间为 24 天。


“作为一家面向消费者的医疗保健技术公司,我们渴望引入以数据为基础的创新技术,改善患者体验。我们的搜索流程使用多种算法来分析患者意图,并根据其需求寻找适合的专科医生”,Zocdoc 的首席技术官 Serkan Kutan 说。


由深度学习提供支持的搜索体验


借助 Zocdoc 的 Insurance Checker,患者只需拍摄一张医保卡的照片,系统便会使用基于深度学习的计算机视觉技术来扫描身份证,并提取正确的保单身份信息。Zocdoc 的工程和数据科学团队曾面临各种难以辨认的身份证,但他们使用 AWS 提供的基于云的 GPU 服务器,只用了一天便创建了神经网络概念验证。



提取人员身份信息后,Insurance Checker 将实时验证患者的医疗保险,查看网络内福利,以及估计的自付率。


即使患者了解其医保计划涵盖的范围,也经常会遇到安排错位的情况:患者要等待数周才能看诊,而其他医生却有较近日期的预约缺口。Zocdoc 提供基于机器学习的数字医疗平台,可以帮助患者找到适合且有空档的网络内医生。


“我们使用深度学习将医保卡图像按承保单位和计划进行分类,同时还提取并读取关键文本字段来帮助患者了解保险涵盖范围,并找到最适合的医生”,Zocdoc 数据科学总监 Brian D’Alessandro 解释道。


幕后原理


Zocdoc 将 TensorFlow 应用于其辨认和匹配系统。该系统使用计算机视觉技术和深度神经网络来同时进行图像分类、图像裁剪和光学字符辨识 (OCR)。由于 OCR 业已成熟,因此 Zocdoc 团队之前曾尝试使用现有的服务。但是,他们发现,任何现有服务都无法足够灵活地处理客户所提交照片在图像质量方面的差异,例如模糊程度、大小、背景和方向等因素。


现在,Zocdoc 系统使用三个深度学习模型,包括基本卷积神经网络 (CNN) 分类模型、对齐模型和 OCR 模型。每个模型在训练算法时所使用的特定参数都可以帮助 Insurance Checker 获得相应结果。例如,神经网络的基本模型将用户图像视作输入并生成相应输出,输出包括承保单位、计划 ID、成员身份证边界框的坐标位置,以及文本方向。



通过数百万标记过的患者医保卡对这些模型进行训练并将其结合使用后,Zocdoc 几乎可以达到 90% 的准确度。此准确度比患者自己输入数据更高。目前,Zocdoc 已将 Insurance Checker 解决方案投入生产。随着客户数据不断增加以及持续对模型进行训练,准确度会继续提高。


结论


现在,Zocdoc 完全在 AWS 上运行。该公司使用 AWS Deep Learning AMI 运行深度学习框架。每个模型均使用 Python 中的 Keras 库以及 TensorFlow 后端在 8 个 GPU 服务器 (Amazon EC2 p2.8xlarge 实例) 上训练几天。该团队发现,使用深度学习可以快速以迭代方式为客户构建功能原型,为他们提供生产就绪型解决方案。




作者介绍


Cynthya Peranandam 是 AWS 人工智能解决方案的



首席营销经理,帮助客户使用深度学习来实现业务价值。在闲暇时间,她喜欢跑步和音乐。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/zocdoc-builds-patient-confidence-using-tensorflow-on-aws/


2019 年 10 月 31 日 08:00116

欲了解 AWS 的更多信息,请访问【AWS 技术专区】

评论

发布
暂无评论
发现更多内容

Java是不是慢半拍?

范学雷

Java 架构 编程语言

CI/CD - Python Django 项目在 Jenkins 上的实践

meta-algorithmX

Python django TDD CI/CD

撸一串趣图,给晚上加班打个鸡血

码农神说

程序员 加班 段子

游戏夜读 | 什么是黑色一分钟?

game1night

Vue生成AST算法的解析

djknight

JavaScript Vue AST

学习没进步?也许反馈有问题

KAMI

学习 学习方法 认知提升

美国黑客曝出政府惊天内幕,看区块链如何解决!

CECBC区块链专委会

CECBC 区块链技术 民生 不可篡改 信息公开

一文入门JVM虚拟机

Simon郎

深入理解JVM

深入理解JVM内存管理 - 方法区

NORTH

深入理解JVM 方法区 老年代

CEO或业务负责人应该具备的数据分析能力

花生

工具 数据 CEO

Docker 搭建 Postgres + pgAdmin 环境

姜雨生

Docker DevOps postgres

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十四)编写测试-显示名

编程道与术

Java 编程 TDD 单元测试 JUnit

Hive底层执行引擎的深度剖析(免费)

奈学教育

大数据 hive

【译】业务转型是什么?

涛哥

业务中台 数字化转型

安全做到首位 统信UOS后激勃发

统小信uos

网络安全 操作系统

我们是活着,而不是活过

小天同学

个人感想 生活,随想 随笔杂谈 日常思考

Vim使用总结

JDoe

vim

霸榜18年,作者连续20年获得微软MVP,这本SQL书凭什么成为畅销经典

图灵社区

数据库 SQL语法 sql查询

redis持久化RDB与AOF

wjchenge

redis

收藏!如何有效实施devops?

DevOps 运维 持续集成 开发 自动化测试

运维日志里隐藏的安全危机,你知道怎么挖吗?听听专家怎么说

secisland

态势感知 关联分析 SOC

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十五)编写测试-断言\假设\使测试失效

编程道与术

Java 编程 TDD 单元测试 JUnit

ARTS-week one

Jokky💫

ARTS 打卡计划

『PyTorch』使用指定GPU的方法

kraken0

人工智能 深度学习 图像识别

动态检核销售、库存Top款重合度

wujunmin

数据分析 Power BI

面试题:教你如何吃透RocketMQ

奈学教育

架构 RocketMQ 架构设计

奈学大数据开发工程师分享787个技术,快来收割

奈学教育

大数据

手机是21世纪最成功的毒品

Neco.W

学习 提升效率 工作

SpringBatch系列入门之Tasklet

稻草鸟人

spring SpringBatch 批处理

产品周刊 | 第 17 期(20200531)

Herbert

产品 设计 产品经理 产品设计 产品推荐

GcExcel:比 Apache POI 速度更快、性能更高

Geek_Willie

Apache POI GCExcel

Zocdoc 在 AWS 上使用 TensorFlow 帮助患者安心看病-InfoQ