【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

一年追回超 200 亿, 打击医保欺诈骗保行为,有了 AI 新“武器”

  • 2021-03-31
  • 本文字数:3282 字

    阅读完需:约 11 分钟

一年追回超200亿, 打击医保欺诈骗保行为,有了AI新“武器”

医保智能监控正在成为打击欺诈骗保战役中的有力“武器”。


AI 大数据风控:打击欺诈骗保战役的“利剑”


3 月 7 日,全国政协委员,济南市副市长王桂英在其一份名为“关于推进‘互联网 +’医保服务提升慢性病管理效能的建议”的提案中建议,加快推动国家医保信息平台建设,同时强化政策指导,完善医保支付模式。此外还要强化监管效能,构建智能监控体系。加快完善统一的智能监控系统,通过生物认证、大数据风控、进销存监管等手段,实现事前提醒、事中预警、事后审核全链条监管,有效规范互联网慢病服务医疗行为,维护医保基金安全。


据官方披露数据,2020 年全国医保基金收入 2.4 万亿,支出 2.1 万亿,收支平衡压力不断增大。另一方面,欺诈骗保行为持续高发频发。有数据统计,2020 年共检查定点医药机构 62.9 万家,占全国所有定点医药机构数量的 99.8%,处理违法违规医药机构 39 万家,追回医保资金 219.2 亿元。


但由于传统的医保风控主要是基于现行制度的规则引擎,如限定使用人群、限定诊疗范围、限定报销上限等,制度标准通常只能从一个视角描述当前医疗行为的适用范围,不能对有计划有目的的欺诈医疗欺诈行为起到很好的拦截作用。


因此,加强医保基金的监管,必须借助信息化、智能化的力量。


作为平安集团旗下大医疗健康生态成员之一,平安医保科技“大数据 AI 风控系统”研发团队负责人在接受 InfoQ 采访时表示,智能风控与传统风控最大的区别在于对数据的利用效率上,基于大数据技术和 AI 算法,可高效地以多种时间尺度和空间尺度对海量数据进行定量的风险评估和筛选。


医保智能监控正在成为打击欺诈骗保战役中的重要“武器”。据悉,平安医保科技研发了“AI 大数据风控系统”,为各省 / 市医保局提供医保风控的大数据采集、存储、处理、分析和服务的整体解决方案。


骗保行为难逃 AI 算法“火眼金睛”


据介绍,该司基于数据挖掘、自然语言处理、深度学习、图计算等 AI 技术,结合平安的医疗、医保行业经验和知识库,打造了具备“策略 + 模型”双轮驱动引擎的“医保鹰眼”系统,解决方案考虑到各地医保局信息化成熟度和监管需求,从底层数据治理,到风控特征构建,再到针对具体场景策略和模型,逐层完成了整个风控体系的框架搭建。


“大数据 AI 风控系统”架构基于 Lambda 架构,设计了 AI 大数据共享模型架构。系统在所有的运算过程分散在数据产生、计算和查询过程当中,以统一的数据模型贯穿始终,从而提高整体的预算效率,满足即时计算的需求。


该负责人告诉 InfoQ,平安医保科技 AI 大数据风控系统在构建的过程中,克服了不少技术挑战。


医保支付风控具有事后、反馈周期长、业务耦合度深等特点,目前处于初步建设和方法论探索阶段,对底层数据质量依赖性强,是我国医保治理中的一大难题。


此外,政府端的数据基建还不成熟,数据管制严格,很难建立针对医保支付风控场景的完整的研发框架并长期对医保支付数据特性进行研究。


“风控是业务属性极强的数据挖掘场景,受政策、事件影响极强,各地市数据分布、质量都有较大的差异,因此模型不用真实数据优化,无法达到理想的效果。所以要解决的实际问题是,如何在一个没有标注数据的地方医保局,建立、运行、并逐步优化支付风控系统”,该负责人表示。


据了解,平安医保科技基于迁移学习技术和专家经验,实现了在无标注数据的情况下,建立并冷启动风控模型。在减轻对数据依赖的同时,建立了准确的风控模型。随着系统运行后逐步积累标注数据,模型会定期优化更新,和当地数据的适配度会越来越好。


医保领域的数据对用户隐私要求高,数据越多模型识别越准确,但风控往往会与个人的隐私保护相冲突。


在隐私保护方面,平安医保科技该负责人介绍到,公司针对各地市信息安全管理要求,并结合业务目标复杂度,采用了上云、远程、数据加密计算等技术方案 ,确保个人身份信息不参与到建模中,支付明细和诊断数据不出政府环境,甚至在不使用明文数据的前提下,完成风控模型的本地实施和优化。


“在数据标准化方面,还引入人工智能技术,对数据进行提取和结构化,再通过智能分类和映射等算法,配合少量人工核验,高效实现数据治理工作”。值得一提的是,数据标准化问题受到了两会代表的关注。全国人大代表、湖南大学风险管理与保险精算研究所所长张琳提出加速医疗数据标准化,建立医保数据与商业保险的数据共享机制,合理控费。建立数据安全使用标准以及数据共享机制能够加快医疗系统信息化建设进度,让数据在更加安全的范围内被使用。


无处遁形!360 度精准智能监管


“欺诈与反欺诈,表面上是技术的博弈,本质上其实是人性善恶的博弈,有利益的地方就有违法犯罪动力”,该负责人说,“医保基金体量巨大,信息化系统还在建设完善中,无法支持精细化、数字化、实时化的支付风险监管,势必就有人动歪脑筋,钻政策和法律的空子,从中套利 ”。


这也是为什么骗保行为屡禁不止的根源。


且近年来,新型欺诈骗保手段层出不穷,骗保违规行为越来越隐蔽。例如,一些违法分子常采用“成群结队门诊”的骗保方法。


这一般是几个或者十几个参保人(医保卡)多次发生的群体行为,主要是为了开取市面上易销售的药品进行倒卖,成员往往具备一定的反侦查技巧,如自己的确患有某种慢性疾病,单次判断所开药品数量、种类等均符合要求,不违规。他们也很少会短期频繁去一个医院开药,从频次上也不会异常。这样从药品适应症、药量、频次等一般的监控规则上均难以发现违规。


这样隐蔽的违规行为就可以通过“大数据 AI 风控系统”来识别发现。从算法角度,首先会利用各种关联特征(骗保分子可能与药贩子认识,骗保分子可能互相认识等)建立患者与患者、患者与医疗机构的同构和异构关系网络,再利用稠密子集检测算法抽取异常群体,协同医疗稽核岗最终认定出欺诈群体。


平安医保科技 AI 大数据风控系统的智能监控针对全流程、全环节,其服务于医疗服务事前、事中和事后全过程,实施 360 度精准智能监管,发现隐匿的疑似违规案例,识别欺诈骗保行为。


平安医保科技相关负责人表示,“不同于以往从业务经验开始,找医保骗保、作弊、违规等行为的业务驱动模式,平安‘AI 大数据风控系统’是从数据入手,利用 AI 技术识别数据异常,在数据异常中识别骗保、作弊、违规等行为。其中,AI 支持的异常识别,AI 支持的数据治理,对码工作的自动化,表对齐的自动化等是该系统的核心竞争力”。


除打击欺诈骗保行为外,平安医保科技的风控系统针对医保项目的浪费、违规、滥用等行为也建立了相应的监控模型,如对滥用、浪费等行为设定的不合理检查、不合理治疗、不合理用药等模型,通过大数据分析,寻找疾病的治疗、检查、用药的常见行为特征,然后针对明显超过常见行为特征的行为进行监控分析,发掘异常之处。


当下 AI 大数据风控技术在实际应用于医保监管的过程中,存在一些待解决的难点,如风控模型可解释性较差,缺少从模型的输出到业务的使用的解决方案,如何指导医保局在资源限制的条件下,最大程度的利用模型结果提升业务效果是一个难点。


此外,还存在医保风控效果难量化的问题。最重要的一个评估指标是——业务目标是否达成,即检出欺诈案件数和案件金额。此外,还有时效性、复审准确率等指标。


“风控效果评估需要算法、医疗、稽核、医保局工作人员共同协作进行验证。不过现阶段,业内风控效果的评估方法、流程、标准还未建立起来。” 该负责人向 InfoQ 表示,平安医保科技希望通过在重点地市与医保局进行深入合作,来验证技术的价值,基于业务需求定义出一套可量化的评价标准。


结语


打击欺诈骗保是国家医保局成立后开展的一项重头工作,自 2018 年以来已在全国范围内开展多次打击欺诈骗取医疗保障基金专向行动。在顶层设计上,多项政策大力支持医保信息化建设,提倡推进医保智能监控。


去年 10 月,国家医疗保障局医保信息平台项目主体建设完成。目前,全国各地正在推进医保信息平台建设,预计 2021 年底在全国范围内投入使用。


伴随着各地医保信息化平台落成,医保智能监控水平也会再上新台阶。医保信息化厂商将帮助医保监管部门打击欺诈骗保行为,促进医保资金合理利用。可以预见的是,作为不可或缺的第三方力量,医保信息化厂商未来将在医保基金监管中发挥越来越重要的作用。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-03-31 09:522267
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 493.0 次阅读, 收获喜欢 1966 次。

关注

评论

发布
暂无评论
发现更多内容

软件测试 | 测试开发 | Lambda表达式介绍和底层实现分析

测吧(北京)科技有限公司

测试

字节跳动基于Doris的湖仓分析探索实践

字节跳动数据平台

数据仓库 数据湖 Doris Hudi 湖仓一体

我与CI流水线的羁绊,任谁也无法斩断!

极狐GitLab

DevOps 持续集成 jenkins CI/CD 极狐GitLab

软件测试 | 测试开发 | 堆排序原理及实现

测吧(北京)科技有限公司

测试

IDC发布《中国边缘云市场解读(2022)》:阿里云蝉联中国公有云市场第一

阿里云视频云

边缘计算 公有云 边缘云

一文读懂TDengine的三种查询功能

TDengine

数据库 tdengine 时序数据库 企业号九月金秋榜

开发者有话说|刚毕业的“00后”,歪打误撞进入了SAP行业

暮春零贰

个人成长 9月月更

借助iMazing工具重新安装或升级 iOS系统

淋雨

ios iphone

喜迎华诞!10月月更伴随着国之盛庆向你走来!

InfoQ写作社区官方

热门活动 10月月更

软件测试 | 测试开发 | Thinkphp5 集成 Swoole

测吧(北京)科技有限公司

测试

ESP32-C3 学习测试 蓝牙 篇(二、蓝牙调试APP、开发板手机连接初体验)

矜辰所致

ESP32-C3 9月月更 蓝牙APP

ESP32-C3 学习测试 蓝牙 篇(三、认识蓝牙 GATT 协议)

矜辰所致

蓝牙 ESP32-C3 9月月更 GATT

Java岗史上最全八股文面试真题汇总,堪称2022年面试天花板

Geek_0c76c3

Java 数据库 开源 程序员 开发

软件测试 | 测试开发 | ThinkPHP 接口开发过程

测吧(北京)科技有限公司

测试

Vue3入门指北(五)条件渲染

Augus

Vue 3 9月月更

软件测试 | 测试开发 | 用模拟器实现视频流的音画分离

测吧(北京)科技有限公司

测试

禅道的工时管理

禅道项目管理

项目管理 工时 禅道

软件测试 | 测试开发 | Tornado 异步性能分析

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 提高Android云真机稳定性的方法

测吧(北京)科技有限公司

测试

全方位助力数据科学组织协同&个人研究:ModelWhale 产品功能介绍与版本选择指引

ModelWhale

云计算 科技 数据科学 编程建模 组织协同

软件测试 | 测试开发 | 相似图像的检测方法

测吧(北京)科技有限公司

测试

全网首发!马士兵内部共享—1658页《Java面试突击核心讲》

Geek_0c76c3

Java 数据库 开源 程序员 开发

Trending热榜关闭前,我把Github今年最火Java面试题汇总扒下来了

Geek_0c76c3

Java 数据库 开源 程序员 开发

软件测试 | 测试开发 | 一种基于视频帧差异视频卡顿检测方案

测吧(北京)科技有限公司

测试

哪7个场景影响研发效能?

LigaAI

敏捷 LigaAI 企业号九月金秋榜 #敏捷开发 #程序

一加是OPPO的子品牌?我来说说我的看法

Geek_8a195c

华为应用市场审核指南解读课程上线,面向开发者讲解应用审核2022年更新要点

最新动态

为了进大厂!吃透了各大厂最新 3000+Java 面试题啃完面试肯定妥了

Geek_0c76c3

Java 开源 程序员 架构 开发

软件测试 | 测试开发 | Android App 保活服务的配置与禁用

测吧(北京)科技有限公司

测试

史上最全499道Java面试题:JVM+分布式+算法+锁+MQ+微服务+数据库

Geek_0c76c3

Java 数据库 开源 架构 面试

当下企业数字化转型,PaaS是基础解

ToB行业头条

一年追回超200亿, 打击医保欺诈骗保行为,有了AI新“武器”_AI&大模型_刘燕_InfoQ精选文章