写点什么

谷歌开源 Quick Draw 数据集上线谷歌云,内含 5000 万涂鸦图像数据

  • 2018-11-19
  • 本文字数:1212 字

    阅读完需:约 4 分钟

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据


将 QuickDraw 数据汇总排列成字母形状(来源:Deborah Schmidt)


你可以通过涂鸦的方式了解一个人的很多东西。这是交互式网络实验Quick Draw背后的目的,它由 Google 创意实验室于 2016 年 11 月推出。Quick Draw 招募大胆的互联网用户来绘制草图,同时利用人工智能(AI)来尝试识别网友绘制的内容 ——有点像 Pictionary 的高科技版本。


Quick Draw 一共收集了超过 345 种类别的 10 亿张图画,谷歌在去年开源了其中 5000 万张图画,开源数据为完整的元数据,包括提示和用户地理位置。近日,谷歌将该开源数据集以 API 和 Polymer 组件的形式上线谷歌云平台。(给初学者的提示:Polymer 指的是一个用于构建 Web 应用程序的开源 JavaScript 库)


从本周开始,加入公共Google群组的任何谷歌云平台客户都可以通过搜索并添加到项目来把 Quick Draw API 添加到自己的库中。 使用 Polymer 组件,只需要使用一行代码就能在基于 Web 的应用程序中显示涂鸦。


谷歌创意实验室的创意技术专家 Nick Jonas 在接受电话采访时表示:“当我们一开始发布数据集时,它基本上是 345 个类别中每张图对应一个文件,并且使用起来有点麻烦。过去一年中进行的大量研究都是对整个数据集的大规模分析。 我们从开发人员那里得到了一些反馈,他们表示希望能有一种更简单的方法来对数据做快速建模。”



Jonas 解释说,通过 Quick Draw API(使用 Google Cloud Endpoints 来托管 Node.js API)可以直接访问原始数据集中包含的 5000 万个文件,但不需要把所有文件全部下载下来。 它为每一个涂鸦图案返回一个 JSON 对象或 HTML 画布渲染。


“通过这种方式,用户不需要下载一堆又一堆的数据就可以玩转这些图案了。”Jonas 表示。


从这些数据中总结出了一些令人惊讶的见解。Quartz 在 6 月份进行的一项研究发现,86%的美国玩家喜欢逆时针画圆圈,而 80%的日本玩家则喜欢顺时针画圆圈。(该研究发现的差异可归因于日语书写中一般采用从左上到右下的笔划顺序。)同时,Google Research 的一项内部调查发现,来自西方国家的用户涂鸦画出来的鱼的朝向与亚洲用户画出来鱼的方向相反。


Quick Draw 数据集也被创造性地用在了其他地方。 英国艺术家Neil Mendoza使用面部跟踪算法在人头上应用 Quick Draw 草图,德国计算机科学家Deborah Schmidt使用 30 万个随机涂鸦的子集来填充拼贴的字母模板。



Nelil Mendoza 将 Quick Draw 的脸部特征应用到真正的人脸上


未来,Quick Draw 的研究团队将考虑把这些涂鸦迁移到数据库中,以提供细粒度的访问控制。 理论上,到时候用户可以执行诸如“给我一张中国用户在 2017 年 3 月画的、能被认出来的图”这样的查询。


“我希望能够鼓励人们以新的方式使用数据集并做出贡献,看这个数据集最终可能扩展到多大,”Jonas 说, “我只是想鼓励更多开发者来玩转这个数据集。”




会议推荐:12 月 20-21,AICon 将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


2018-11-19 15:241400
用户头像
蔡芳芳 InfoQ 总编辑

发布了 813 篇内容, 共 590.2 次阅读, 收获喜欢 2808 次。

关注

评论

发布
暂无评论
发现更多内容

B站713事故后的多活容灾建设|TakinTalks大咖分享

TakinTalks稳定性社区

故障 稳定性保障

RocketMQ—(总结)一篇就搞懂RocketMQ

IT巅峰技术

客户案例 | 聚焦流程体验,助银行企业APP迭代

易观分析

银行 客户 银行app

【刷题记录】22. 括号生成

WangNing

7月月更

SpringBoot应用使用Docker实现远程部署(保姆教程)

技术小生

Docker 7月月更

低代码工具有哪些特色?明眼人都能看出来的低代码两大发展轨迹!

优秀

低代码 低代码平台

Web3.0 时代,基于P2PDB实现一款Dapp的技术理论

Rock-李益

dapp 去中心化 去中心化数据库 p2pdb

Docker 安装 Minio 搭建属于自己的文件服务器

宁在春

Docker Minio 7月月更

如何组装一个注册中心

捉虫大师

注册中心 7月月更 后端启示录

洋葱集团携手OceanBase实现分布式升级,全球数据首次实现跨云融合

OceanBase 数据库

企业数字化转型成大趋势,选对在线协作工具很重要

Baklib

OPPO 自研大规模知识图谱及其在数智工程中的应用

NebulaGraph

知识图谱 NebulaGraph

工赋开发者社区 | 定了!就在7月30日!

工赋开发者社区

技术分享 工业 峰会

人工智能助力复工复产,模版 OCR 轻松搞定健康码识别

亚马逊云科技 (Amazon Web Services)

人工智能 Lambda

基础+框架+数据库+系统设计+算法,2022阿里最新Java面试突击手册我粉了

Java永远的神

Java 数据库 spring 面试 JVM

发评测赢好礼 | Serverless 函数计算征集令

阿里巴巴云原生

阿里云 Serverless 云原生

唠唠python的作用域,看看每个变量都为自己打下了多少江山

迷彩

Python 函数 作用域 7月月更

《TiDB 6.x in Action》发布,凝聚社区集体智慧的 6.x 实践汇总!

TiDB 社区干货传送门

数据库 分布式数据库 TiDB

ES6 类聊 JavaScript 设计模式之行为型(一)

devpoint

JavaScript 设计模式 ECMAScript 6 7月月更

3分钟创建Serverless Job 定时获取新闻热搜

云端explorer

Serverless Job 新闻热搜 场景搭建

知识管理系统是什么?你需要知道这些

Geek_da0866

企业内部信息碎片化该怎么办?不妨试试这样做

Baklib

中天钢铁在 GPS、 AIS 调度中使用 TDengine

TDengine

数据库 tdengine 时序数据库

客户案例|生学教育依托观测云打造可观测智慧教育新生态

观测云

面试OPPO,16道题甩过来,我人傻了

Java永远的神

Java 程序员 面试 分布式 项目

模块八作业 - 消息数据 MySQL 表设计

Elvis FAN

聊聊css中文字的换行问题

南极一块修炼千年的大冰块

7月月更

如何在github的pages部署hexo实现代码提交到仓库自动部署

娃娃菜

GitHub Pages 签约计划第三季

阿里云消息队列 Kafka-消息检索实践

阿里巴巴云原生

kafka 阿里云 云原生 检索 消息

MPLS基础知识概述

穿过生命散发芬芳

MPLS 7月月更

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据_AI&大模型_KYLE WIGGERS_InfoQ精选文章