Chrome开始集成图形识别 API（Shape Detection API）_Chrome_Miguel Casas-Sanchez_InfoQ精选文章

ArchSummit全球架构师峰会门票9折倒计时中~ 了解详情 



 写点什么

登录/注册

最近，Chrome 团队尝试在 Chrome 中集成了一套与图形识别相关的 API，使得图形识别这种以前只在原生应用中存在，或者在浏览器上，要借助其他难用的外部库才能实现的功能，现在只要少量代码即可实现。这些 API 包括人脸识别，条形码 / 二维码识别和文本识别，基本上覆盖了当前互联网应用的大部分场景。

现状

图形识别这种对系统资源和设备的计算能力要求颇高的功能，通常只有底层的原生 API 能驾驭，流行的框架主要是开源的 Open CV 和各大移动平台的图形识别服务：

而 Chrome 的这些 API，当前还处于实验阶段，只集成在 Chrome Canary 版本中，特别是 Android 版更新较快。使用前还需要通过把“实验性网络平台功能”chrome://flags/#enable-experimental-web-platform-features设置为Enable来激活。

激活后，在 Console 控制台输入以下 JavaScript 代码，就能验证你的浏览器是否支持相应的 API 了：

window.FaceDetector
window.BarcodeDetector
window.TextDetector

如果支持，就会返回如function FaceDetector() { [native code] }的信息。

Chrome Canary 是 Chrome 的一条与其他项目并行的实验性分支，是许多前卫激进的特性的试验场，而且迭代很快，有时甚至是每日一更新，所以不出所料，也不太稳定。和其他 Chrome 版本一样，也可以在 Chrome Release Channels 上下载。

从现在公布的信息来看，以下这些场景可能得以轻松实现：

人脸识别：

自动框选你家庭聚会照片里的亲戚朋友们，然后你就可以给每个人都贴标签了，不用自己逐个框选。
在社交网站上注册的时候，你上传了一张照片，浏览器可以帮你裁剪好最佳尺寸。

条形码识别：

识别网页中的条形码 / 二维码，并作相应的动作，比如链接跳转，支付等等。

文本识别：

OCR
配合语音接口，朗读图片中的文字

除此之外，开发者大可以尽情发挥想象，创造更多独一无二有趣的应用。

社区反映

图形识别虽然是刚需，但自去年底公布消息以来，可能是由于这些 API 尚处于实验阶段，尚待打磨，在开发社区内还未形成大范围的讨论，目前能收集到的主要是以下资料供开发者参考。

不过正因为进化迅速，这套图形识别 API 从去年的 M57 版本发展至今，已经发生了不小的变化，也许在不久的将来，就会合并到稳定版中，真正为广大开发者所用，构建更多有趣的应用。

感谢韩婷对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作，请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博（ @InfoQ ， @丁晓昀），微信（微信号： InfoQChina ）关注我们。

评论

发布

暂无评论

阿里架构师478页Java工程师面试知识解析笔记pdf,一份2021年通往阿里的面试指南

Java架构之路

Java 程序员架构面试编程语言

必须清除互联网世界的毒瘤：网络谣言背后存在病态心理

源码解析Synchronized同步方法的八种使用场景，收藏

Java 学习架构面试多线程

倍频程与钢琴调式的距离

阿里云视频云

音频技术音频

App性能测试揭秘（Android篇）

移动研发平台EMAS

阿里云软件测试测试性能测试云性能测试

PostgreSQL：您可能需要增加MAX_LOCKS_PER_TRANSACTION

PostgreSQLChina

数据库 postgresql 开源

OPPO小布助手正在改变普罗米修斯的世界

BitQy交易所软件系统开发|BitQy交易所APP开发

带宽、延时、吞吐率、PPS 这些都是啥？

Linux 操作系统网络

软件测试（功能、接口、性能、自动化）详解

测试人生路

被阿里、腾讯、华为追捧为最牛逼的 Java 框架你知道是什么吗？

Java架构师迁哥

源码解析Synchronized同步方法的八种使用场景，收藏

Java 源码架构面试 synchronized

阿里技术官亲荐“998页的应届生面试手册”看完才发现，原来求职也没那么难！

Java 程序员面试编程语言计算机

【Java入门】流

干货时间：聊聊DevOps下的技术系列之契约测试

华为云开发者联盟

DevOps 测试交互

测开之函数进阶· 第2篇《纯函数》

清菡软件测试

SQL：我为什么慢你心里没数吗？

Java架构师迁哥

5. 穿过拥挤的人潮，Spring已为你制作好高级赛道

Spring Framework 类型转换 Converter

等不到明年金三银四了！五面滴滴之路，爆砍37K+16薪Offer

Java架构追梦

Java 学习架构面试滴滴

架构师训练营W10作业

堪称完美！阿里架构师亲自手撕”Spring Boot实战笔记“用60个案例给你整的明明白白

Java 编程程序员架构技术宅

anyRTC加持AI，打造下一代实时音视频引擎

anyRTC开发者

人工智能 android 音视频 WebRTC RTC

大作业1

架构师一期

KKR四币连发挖矿系统软件APP开发

物联网打工人必备：LiteOS Studio图形化调测能力

华为云开发者联盟

互联网 LiteOS 打工人

一文带你了解传统手工特征的骨龄评估方法的发展历史

华为云开发者联盟

方法骨龄评估

GitHub上3天1W赞的程序员学习路线！入门进阶都非常实用

Java架构之路

Java 程序员架构面试编程语言

秒杀系统设计的挑战和问题（转载）

iOS 崩溃分析

ios 崩溃分析

基于App SDK和API搭建无人自习室等无人场景

物联网智慧琴房 24小时无人自习室 24小时自助游戏厅共享办公室

AI在游戏反外挂中的应用与实践

AI在游戏反外挂中的应用与实践