写点什么

Document AI 平台简介 —— 统一的文档处理控制台

Lewis Liu & Yang Liang

  • 2020-12-10
  • 本文字数:1096 字

    阅读完需:约 4 分钟

Document AI 平台简介 —— 统一的文档处理控制台

我们相信,任何不得不以人工方式从复杂文档中大规模提取数据的企业都能够显著受益于 Google Cloud AI。将文档转换为结构化数据可以为企业加快决策速度、释放显著的业务价值并且有助于为客户营造更好的体验。


以往,大规模地这样做并不高效。而这是 Google Cloud 努力帮助企业利用人工智能 (AI) 和机器学习技术来实现这些流程自动化的原因所在,并且正因为如此,我们高兴地宣布推出新的 Document AI (DocAI) 平台 —— 统一的文档处理控制台。

DocAI 平台的预览版现已发布,该平台使您能够:


  • 确保数据准确并且合规:自动处理并验证所有文档,以简化合规工作流、减少猜测,并且确保数据准确和合规。

  • 制定更好的业务决策:通过从非结构化文档提取结构化数据并且使其可用于您的业务应用程序和用户,进而提升效率。

  • 使用您的数据满足客户预期:利用洞见来满足客户预期并且提升 CSAT、客户宣传、终生价值和支出。


借助新的 DocAI 平台,您可以通过统一的 API 快速访问所有解析器、工具和解决方案(例如,Lending DocAI、Procurement DocAI),实现一款端到端的文档解决方案 —— 从评估到部署。它使您能够轻松创建和自定义文档处理工作流。由于平台中的专用解析器是使用 GoogleCloud 预定义分类法构建而成,无需进行额外的数据映射和训练,因此,数据提取现在更加简便。


我们的客户之一 Unifiedpost —— 一家比利时金融科技公司,通过使用 Procurement DocAI 将其数据采集准确率提高 250%,将其从采购到付款的处理 TCO 最高降低 60%。


 如何使用新的 DocAI 平台


为了说明 DocAI 平台的工作方式,我们首先提供一个所有解析器的主选择屏幕的示例,接下来是 W9 和发票的两个示例。首先,您需要创建一个文档处理器。您既可以使用我们的通用处理器之一(例如,FormParser),也可使用专用处理器(例如,W9 Parser)处理特定领域的文档。


一旦创建了处理器,可以在统一的仪表板中查看它们。您也可以通过在控制台中直接上传自己的文档来对您的处理器进行测试。在下例中,您会看到 W9 解析器已经准确地对文档中的信息进行了分类(例如,地址、账号和签名)。

您也可以尝试对发票文件进行采购单据处理。在下例中,发票解析器能够从文档提取适当的数据(例如,供应商名称、发票日期和支付条款)。


我们正在为 DocAI 平台开发更多功能,以快速增强其核心能力并支持更多的解析器。其所有专用解析器都经过精心创建和微调,可实现行业领先的准确率,借助机器学习帮助企业自信地从文档获得洞见。OCR(光学字符识别)、FormParser(表单解析器)以及 Document Splitter(文档拆分器)之类的通用解析器是可公开获取的。您也可以申请访问专用解析器,例如,W9、1040、W2、1099-MISC、1003、发票和收据。


2020-12-10 00:202743

评论

发布
暂无评论
发现更多内容

知识点梳理:聊聊iOS SDK数据采集那点事儿

易观大数据

企业应用开发或迎新趋势 “低代码平台”备受追捧

爱极客侠

Apache 顶级项目 Apache Pulsar 成长回顾

Apache Pulsar

kafka 云原生 中间件 Apache Pulsar 消息系统

法定数字人民币将成中国金融新名片

CECBC

数字货币 人民币

微服务架构的整套解决方案

xcbeyond

架构 微服务 IT建设

SpringMVC-技术专题-支持可版本管理的Restful接口

码界西柚

springmvc

奈学:Executor框架的概述

古月木易

Executor Executor框架

认识分布式系统

多颗糖

分布式 分布式系统 分布式存储

奈学:reaseShared共享式释放锁

古月木易

reaseShared 共享锁

核查框架新的选择

柿子

jsr-303 核查框架 butterfly

进击谷歌:多线程下程序顺序怎么稳定不乱?

架构师修行之路

数据结构与算法

9大训练营免费开营!阿里云大数据团队的独门绝学全在这了

Apache Flink

大数据 训练营

56张图入门操作系统——内功心法,适合所有程序员

执鸢者

大前端 操作系统

区块链技术与福彩事业结合的变革

CECBC

区块链技术 福彩平台

开发一款视频直播有多吃香?

anyRTC开发者

华为:新政务风口下加宽“护城河”

脑极体

微服务-技术专题-设计原则AFK

码界西柚

Pulsar 联合 TiDB 推出大数据场景数据应用分析解决方案

Apache Pulsar

大数据 InfoQ Apache Pulsar #TiDB

浅谈如何做好软件研发团队的盘点

Geek_37rwst

团队管理 技术管理

优雅快速的统计千万级别uv

架构师修行之路

哈希表 数据结构与算法

奈学:reaseShared共享式释放锁

奈学教育

共享锁

浅谈技术管理之团队管理

Geek_37rwst

团队管理 技术管理

微服务-技术专题-使用 API 网关构建微服务

码界西柚

微服务

实用心理学之识人篇

代码制造者

低代码 零代码 职场成长 编程开发 职场搞笑

奈学:Executor框架的概述

奈学教育

Executor Executor框架

为什么 Bash 脚本总是不稳定?

柴锋

bash Linux DevOps 运维 Shell

LeetCode题解:66. 加一,新数组求和再翻转,JavaScript,详细注释

Lee Chen

大前端 LeetCode

跟我一起基于Karma搭建一个测试环境(下)

Jack Q

大前端 测试框架 Karma

架构师训练营 - 第十周 - 总结

Anrika

极客大学架构师训练营

区块链技术助力基础建设

CECBC

新基建 区块链技术 国家电力

Week11

一叶知秋

Document AI 平台简介 —— 统一的文档处理控制台_架构_InfoQ精选文章