Chrome开始集成图形识别 API(Shape Detection API)

2017 年 3 月 12 日

最近,Chrome 团队尝试在 Chrome 中集成了一套与图形识别相关的 API,使得图形识别这种以前只在原生应用中存在,或者在浏览器上,要借助其他难用的外部库才能实现的功能,现在只要少量代码即可实现。这些 API 包括人脸识别条形码 / 二维码识别文本识别,基本上覆盖了当前互联网应用的大部分场景。

现状

图形识别这种对系统资源和设备的计算能力要求颇高的功能,通常只有底层的原生 API 能驾驭,流行的框架主要是开源的 Open CV 和各大移动平台的图形识别服务:

而 Chrome 的这些 API,当前还处于实验阶段,集成在 Chrome Canary 版本中,特别是 Android 版更新较快。使用前还需要通过把“实验性网络平台功能”chrome://flags/#enable-experimental-web-platform-features设置为Enable来激活。

激活后,在 Console 控制台输入以下 JavaScript 代码,就能验证你的浏览器是否支持相应的 API 了:

  • window.FaceDetector
  • window.BarcodeDetector
  • window.TextDetector

如果支持,就会返回如function FaceDetector() { [native code] }的信息。

Chrome Canary 是 Chrome 的一条与其他项目并行的实验性分支,是许多前卫激进的特性的试验场,而且迭代很快,有时甚至是每日一更新,所以不出所料,也不太稳定。和其他 Chrome 版本一样,也可以在 Chrome Release Channels 上下载。

从现在公布的信息来看,以下这些场景可能得以轻松实现:

  1. 人脸识别:
  • 自动框选你家庭聚会照片里的亲戚朋友们,然后你就可以给每个人都贴标签了,不用自己逐个框选。
  • 在社交网站上注册的时候,你上传了一张照片,浏览器可以帮你裁剪好最佳尺寸。
  1. 条形码识别:
  • 识别网页中的条形码 / 二维码,并作相应的动作,比如链接跳转,支付等等。
  1. 文本识别:
  • OCR
  • 配合语音接口,朗读图片中的文字

除此之外,开发者大可以尽情发挥想象,创造更多独一无二有趣的应用。

社区反映

图形识别虽然是刚需,但自去年底公布消息以来,可能是由于这些 API 尚处于实验阶段,尚待打磨,在开发社区内还未形成大范围的讨论,目前能收集到的主要是以下资料供开发者参考。

不过正因为进化迅速,这套图形识别 API 从去年的 M57 版本发展至今,已经发生了不小的变化,也许在不久的将来,就会合并到稳定版中,真正为广大开发者所用,构建更多有趣的应用。


感谢韩婷对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017 年 3 月 12 日 18:00 2109

评论

发布
暂无评论
发现更多内容

Cassandra可调一致性的使用及原理

老任物联网杂谈

大数据 分布式 Cassandra 可调一致性

「首度揭秘」大规模HPC生产环境 IO 特征

焱融科技

sds io 高性能 存储 焱融科技

Nginx 入门及命令行操作

子杨

nginx 运维

Nginx 基础原理和命令行的真相

子杨

nginx 运维

用户故事为什么要关联开发数据?

Worktile

敏捷开发 开发数据

架构师训练营0期开营

刁架构

架构师

工厂模式(三)泛型工厂的概念以及示例代码

LSJ

我们可能都误解了什么是情商

七镜花园-董一凡

情绪

Weex开发:页面跳转以及Android端多应用选择窗口的处理

brave heart

android Vue 大前端 跨平台 Weex

你有信息焦虑症吗?

Neco.W

创业 学习方法 知识体系

2020智源-京东多模态对话挑战赛开战 产学研联合推动AI技术发展

DT极客

奈学干货分享:分布式CAP实践分析

奈学教育

分布式

阿里巴巴为什么让初始化集合时必须指定大小?

王磊

Java 性能

卧槽,接到一个阎王的需求

码农神说

程序员

Android 通过opencv实现人脸识别,追踪

sar

android OpenCV 人脸识别

幂等问题及解决方案

Joker

幂等 解决方案

Mysql常用删除方式比较

云也退

MySQL

图片与标题的Ken Burns动效

寇云

CSS css3

GrowingIO 大数据多维分析自动化测试实践

GrowingIO技术专栏

大数据 自动化测试 parewise

从位图到布隆过滤器

王坤祥

位图 布隆过滤器

备案问题汇总

云也退

网站 备案

为什么你要学习 Go?

司徒公子

go golang 编程语言 谷歌Google

终于找到了一篇文章!通俗地讲解计算机工作原理

图灵社区

cpu 存储器 编译器 计算机工作原理

Spring源码-BeanFactory创建Bean

云淡风轻

spring 源码

10分钟了解Flink

代码诗人

kudmp介绍和安装

唯爱

Go netpoll I/O 多路复用构建原生网络模型之源码深度解析

潘建锋

go 源码分析 网络编程 多路复用 开源项目

基于 Markdown 的中文文档排版规范

Murphy

markdown 排版规范 GitHub GFM 物联网学前班

ARTS_20200529

凌轩

Java ARTS 打卡计划

“Plus Token”传销主犯被公诉!警惕,区块链不是“取款链”!

CECBC区块链专委会

1024讲话 CECBC 区块链技术 人才发展 培训

神经网络中为什么不能将权重初始值设置为一样的值

王坤祥

神经网络 机器学习

Milvus Community Conf 2020

Milvus Community Conf 2020

Chrome开始集成图形识别 API(Shape Detection API)-InfoQ