阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

Document AI 平台简介 —— 统一的文档处理控制台

Lewis Liu & Yang Liang

  • 2020-12-10
  • 本文字数:1096 字

    阅读完需:约 4 分钟

Document AI 平台简介 —— 统一的文档处理控制台

我们相信,任何不得不以人工方式从复杂文档中大规模提取数据的企业都能够显著受益于 Google Cloud AI。将文档转换为结构化数据可以为企业加快决策速度、释放显著的业务价值并且有助于为客户营造更好的体验。


以往,大规模地这样做并不高效。而这是 Google Cloud 努力帮助企业利用人工智能 (AI) 和机器学习技术来实现这些流程自动化的原因所在,并且正因为如此,我们高兴地宣布推出新的 Document AI (DocAI) 平台 —— 统一的文档处理控制台。

DocAI 平台的预览版现已发布,该平台使您能够:


  • 确保数据准确并且合规:自动处理并验证所有文档,以简化合规工作流、减少猜测,并且确保数据准确和合规。

  • 制定更好的业务决策:通过从非结构化文档提取结构化数据并且使其可用于您的业务应用程序和用户,进而提升效率。

  • 使用您的数据满足客户预期:利用洞见来满足客户预期并且提升 CSAT、客户宣传、终生价值和支出。


借助新的 DocAI 平台,您可以通过统一的 API 快速访问所有解析器、工具和解决方案(例如,Lending DocAI、Procurement DocAI),实现一款端到端的文档解决方案 —— 从评估到部署。它使您能够轻松创建和自定义文档处理工作流。由于平台中的专用解析器是使用 GoogleCloud 预定义分类法构建而成,无需进行额外的数据映射和训练,因此,数据提取现在更加简便。


我们的客户之一 Unifiedpost —— 一家比利时金融科技公司,通过使用 Procurement DocAI 将其数据采集准确率提高 250%,将其从采购到付款的处理 TCO 最高降低 60%。


 如何使用新的 DocAI 平台


为了说明 DocAI 平台的工作方式,我们首先提供一个所有解析器的主选择屏幕的示例,接下来是 W9 和发票的两个示例。首先,您需要创建一个文档处理器。您既可以使用我们的通用处理器之一(例如,FormParser),也可使用专用处理器(例如,W9 Parser)处理特定领域的文档。


一旦创建了处理器,可以在统一的仪表板中查看它们。您也可以通过在控制台中直接上传自己的文档来对您的处理器进行测试。在下例中,您会看到 W9 解析器已经准确地对文档中的信息进行了分类(例如,地址、账号和签名)。

您也可以尝试对发票文件进行采购单据处理。在下例中,发票解析器能够从文档提取适当的数据(例如,供应商名称、发票日期和支付条款)。


我们正在为 DocAI 平台开发更多功能,以快速增强其核心能力并支持更多的解析器。其所有专用解析器都经过精心创建和微调,可实现行业领先的准确率,借助机器学习帮助企业自信地从文档获得洞见。OCR(光学字符识别)、FormParser(表单解析器)以及 Document Splitter(文档拆分器)之类的通用解析器是可公开获取的。您也可以申请访问专用解析器,例如,W9、1040、W2、1099-MISC、1003、发票和收据。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-12-10 00:201729

评论

发布
暂无评论
发现更多内容

优化JAVA代码总结

跳蚤

join为啥会阻塞主线程?

叫练

join

Elasticsearch Query Phase

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

秒杀系统的难点在哪?如何突破?

跳蚤

APP启动流程图

林亚超

网络故障的排错思路指南

《函数式编程精粹》(2) 热身:A STACK BASED CALCULATOR

陈皓07

《DDD with TLA+》(1) 建模思考

陈皓07

不写代码可以写爬虫程序吗?老师说可以,无编码学爬虫之一。

梦想橡皮擦

Python 28天写作 2月春节不断更

《函数式编程精粹》(3) Functional Design

陈皓07

为何要构建团队契约

Bruce Talk

敏捷 Agile

架构师训练营第八周作业 - 命题作业

阿德儿

【答疑点评必看】如何从「数据范围」中找到解题「突破口」...

宫水三叶的刷题日记

面试 LeetCode 数据结构与算法

《函数式编程精粹》(1) 函数式思考

陈皓07

Java 并发系列(一):多线程三大特性

TroyLiu

Java 多线程 原子性 可见性 有序性

与前端训练营的日子 -- Week17

SamGo

学习

数据库规范设计说明书 整理

edd

翻译:《实用的Python编程》03_01_Script

codists

Python

博文推荐 | Apache Pulsar 延迟消息投递解析

Apache Pulsar

kafka 开源 RocketMQ pulsar Apache Pulsar

架构师训练营课程纲要

陈皓07

《DDD with TLA+》(2) 系统行为

陈皓07

《DDD with TLA+》(3) DEBUG & MODELING

陈皓07

《DDD with TLA+》(4) Transaction Commit

陈皓07

第十三周作业&总结

胡益

并发与并行

ES_her0

28天写作

第8周课后练习-性能优化二

潘涛

架构师训练营 4 期

架构师进阶之《Your Mouse is a Database》

陈皓07

递归的人生哲学

Nick

数据结构 算法 递归

译文 | 深度剖析 Pulsar Functions

Apache Pulsar

大数据 kafka 开源 pulsar Apache Pulsar

微服务架构设计与最佳实践

万俊峰Kevin

微服务 go-zero Go 语言

架构师进阶之《做踏实的架构》

陈皓07

Document AI 平台简介 —— 统一的文档处理控制台_架构_InfoQ精选文章