写点什么

谷歌开源 Quick Draw 数据集上线谷歌云,内含 5000 万涂鸦图像数据

  • 2018-11-19
  • 本文字数:1212 字

    阅读完需:约 4 分钟

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据


将 QuickDraw 数据汇总排列成字母形状(来源:Deborah Schmidt)


你可以通过涂鸦的方式了解一个人的很多东西。这是交互式网络实验Quick Draw背后的目的,它由 Google 创意实验室于 2016 年 11 月推出。Quick Draw 招募大胆的互联网用户来绘制草图,同时利用人工智能(AI)来尝试识别网友绘制的内容 ——有点像 Pictionary 的高科技版本。


Quick Draw 一共收集了超过 345 种类别的 10 亿张图画,谷歌在去年开源了其中 5000 万张图画,开源数据为完整的元数据,包括提示和用户地理位置。近日,谷歌将该开源数据集以 API 和 Polymer 组件的形式上线谷歌云平台。(给初学者的提示:Polymer 指的是一个用于构建 Web 应用程序的开源 JavaScript 库)


从本周开始,加入公共Google群组的任何谷歌云平台客户都可以通过搜索并添加到项目来把 Quick Draw API 添加到自己的库中。 使用 Polymer 组件,只需要使用一行代码就能在基于 Web 的应用程序中显示涂鸦。


谷歌创意实验室的创意技术专家 Nick Jonas 在接受电话采访时表示:“当我们一开始发布数据集时,它基本上是 345 个类别中每张图对应一个文件,并且使用起来有点麻烦。过去一年中进行的大量研究都是对整个数据集的大规模分析。 我们从开发人员那里得到了一些反馈,他们表示希望能有一种更简单的方法来对数据做快速建模。”



Jonas 解释说,通过 Quick Draw API(使用 Google Cloud Endpoints 来托管 Node.js API)可以直接访问原始数据集中包含的 5000 万个文件,但不需要把所有文件全部下载下来。 它为每一个涂鸦图案返回一个 JSON 对象或 HTML 画布渲染。


“通过这种方式,用户不需要下载一堆又一堆的数据就可以玩转这些图案了。”Jonas 表示。


从这些数据中总结出了一些令人惊讶的见解。Quartz 在 6 月份进行的一项研究发现,86%的美国玩家喜欢逆时针画圆圈,而 80%的日本玩家则喜欢顺时针画圆圈。(该研究发现的差异可归因于日语书写中一般采用从左上到右下的笔划顺序。)同时,Google Research 的一项内部调查发现,来自西方国家的用户涂鸦画出来的鱼的朝向与亚洲用户画出来鱼的方向相反。


Quick Draw 数据集也被创造性地用在了其他地方。 英国艺术家Neil Mendoza使用面部跟踪算法在人头上应用 Quick Draw 草图,德国计算机科学家Deborah Schmidt使用 30 万个随机涂鸦的子集来填充拼贴的字母模板。



Nelil Mendoza 将 Quick Draw 的脸部特征应用到真正的人脸上


未来,Quick Draw 的研究团队将考虑把这些涂鸦迁移到数据库中,以提供细粒度的访问控制。 理论上,到时候用户可以执行诸如“给我一张中国用户在 2017 年 3 月画的、能被认出来的图”这样的查询。


“我希望能够鼓励人们以新的方式使用数据集并做出贡献,看这个数据集最终可能扩展到多大,”Jonas 说, “我只是想鼓励更多开发者来玩转这个数据集。”




会议推荐:12 月 20-21,AICon 将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


2018-11-19 15:241584
用户头像
蔡芳芳 InfoQ 总编辑

发布了 851 篇内容, 共 630.2 次阅读, 收获喜欢 2826 次。

关注

评论

发布
暂无评论
发现更多内容

针对各种指标数据如何选择合适的算法?

云智慧AIOps社区

技术 算法 数据 智能运维 指标

WEB全屏API简介及示例

devpoint

web api 9月日更

在线JSON转sarcastic工具

入门小站

工具

还重构?就你那代码只能铲了重写!

小傅哥

Java 小傅哥 代码优化 代码重构 开发标准

手撸二叉树之翻转二叉树

HelloWorld杰少

9月日更

GaussDB(for MySQL)如何快速创建索引?华为云数据库资深架构师为您揭秘

华为云开发者联盟

数据库 算法 索引 GaussDB(for MySQL) MySQL索引

网络攻防学习笔记 Day136

穿过生命散发芬芳

vpn 9月日更 恶意代码

聊一聊芯片上电复位和掉电检测

不脱发的程序猿

嵌入式 硬件开发 芯片上电 上电复位 掉电检测

“妈我不想去上课!”“不行你是老师!”

梦想橡皮擦

9月日更

hutool如何实现数据导出到Excel

卢卡多多

hutool 数据导出 9月日更

Sentinel 常用流控算法

Z

sentinel 流控算法 服务监控 服务降级 流控

17. 关于超人工智能来临,霍金的忧虑

Databri_AI

人工智能

深入剖析 | XLSX海量数据复杂填充解决方案

九叔(高翔龙)

中间件 EasyExcel Apache POI java核心

linux之iconv命令

入门小站

Linux

怎样才能写好前端页面,css书写顺序和布局真的有那么重要吗

你好bk

CSS html 大前端 结构

linux系列之:告诉他,他根本不懂kill

程序那些事

Linux 命令 程序那些事 kill

架构实战营模块三作业

michael

#架构实战营

Supervisor 基础配置

耳东@Erdong

Supervisor 9月日更

【Flutter 专题】46 图解新的状态管理 Provider (一)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 9月日更

命令行如何执行jar包里面的方法

FunTester

性能测试 反射 接口测试 测试框架 FunTester

Python——绑定与方法调用

在即

9月日更

DBA:介里有你没有用过的“CHUAN”新社区版本Redis6.0

华为云开发者联盟

redis 开源 多线程 Redis 6.0 华为云DCS

MySQL事务学习笔记

风翱

MySQL 9月日更

产品设计的几个原则

石云升

产品思维 产品思考 9月日更

图计算的应用

6979阿强

【LeetCode】寻找峰值Java题解

Albert

算法 LeetCode 9月日更

乘着汽车智能化的浪潮,“汽车人”的职业方向选择(二)

SOA开发者

程序员 软件 汽车 职业发展

雪花算法,什么情况下发生 ID 冲突?

马丁玩编程

Java lua redis 雪花算法

图遍历算法

6979阿强

图遍历 GraphScope

JavaScript 进阶(下)

Augus

JavaScript 9月日更

枚举在 Golang 中的实现

baiyutang

Go 语言 9月日更

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据_AI&大模型_KYLE WIGGERS_InfoQ精选文章