最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

谷歌开源 Quick Draw 数据集上线谷歌云,内含 5000 万涂鸦图像数据

  • 2018-11-19
  • 本文字数:1212 字

    阅读完需:约 4 分钟

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据


将 QuickDraw 数据汇总排列成字母形状(来源:Deborah Schmidt)


你可以通过涂鸦的方式了解一个人的很多东西。这是交互式网络实验Quick Draw背后的目的,它由 Google 创意实验室于 2016 年 11 月推出。Quick Draw 招募大胆的互联网用户来绘制草图,同时利用人工智能(AI)来尝试识别网友绘制的内容 ——有点像 Pictionary 的高科技版本。


Quick Draw 一共收集了超过 345 种类别的 10 亿张图画,谷歌在去年开源了其中 5000 万张图画,开源数据为完整的元数据,包括提示和用户地理位置。近日,谷歌将该开源数据集以 API 和 Polymer 组件的形式上线谷歌云平台。(给初学者的提示:Polymer 指的是一个用于构建 Web 应用程序的开源 JavaScript 库)


从本周开始,加入公共Google群组的任何谷歌云平台客户都可以通过搜索并添加到项目来把 Quick Draw API 添加到自己的库中。 使用 Polymer 组件,只需要使用一行代码就能在基于 Web 的应用程序中显示涂鸦。


谷歌创意实验室的创意技术专家 Nick Jonas 在接受电话采访时表示:“当我们一开始发布数据集时,它基本上是 345 个类别中每张图对应一个文件,并且使用起来有点麻烦。过去一年中进行的大量研究都是对整个数据集的大规模分析。 我们从开发人员那里得到了一些反馈,他们表示希望能有一种更简单的方法来对数据做快速建模。”



Jonas 解释说,通过 Quick Draw API(使用 Google Cloud Endpoints 来托管 Node.js API)可以直接访问原始数据集中包含的 5000 万个文件,但不需要把所有文件全部下载下来。 它为每一个涂鸦图案返回一个 JSON 对象或 HTML 画布渲染。


“通过这种方式,用户不需要下载一堆又一堆的数据就可以玩转这些图案了。”Jonas 表示。


从这些数据中总结出了一些令人惊讶的见解。Quartz 在 6 月份进行的一项研究发现,86%的美国玩家喜欢逆时针画圆圈,而 80%的日本玩家则喜欢顺时针画圆圈。(该研究发现的差异可归因于日语书写中一般采用从左上到右下的笔划顺序。)同时,Google Research 的一项内部调查发现,来自西方国家的用户涂鸦画出来的鱼的朝向与亚洲用户画出来鱼的方向相反。


Quick Draw 数据集也被创造性地用在了其他地方。 英国艺术家Neil Mendoza使用面部跟踪算法在人头上应用 Quick Draw 草图,德国计算机科学家Deborah Schmidt使用 30 万个随机涂鸦的子集来填充拼贴的字母模板。



Nelil Mendoza 将 Quick Draw 的脸部特征应用到真正的人脸上


未来,Quick Draw 的研究团队将考虑把这些涂鸦迁移到数据库中,以提供细粒度的访问控制。 理论上,到时候用户可以执行诸如“给我一张中国用户在 2017 年 3 月画的、能被认出来的图”这样的查询。


“我希望能够鼓励人们以新的方式使用数据集并做出贡献,看这个数据集最终可能扩展到多大,”Jonas 说, “我只是想鼓励更多开发者来玩转这个数据集。”




会议推荐:12 月 20-21,AICon 将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-11-19 15:241047
用户头像
蔡芳芳 InfoQ主编

发布了 781 篇内容, 共 494.5 次阅读, 收获喜欢 2748 次。

关注

评论

发布
暂无评论
发现更多内容

对mysql事务的认识,再不懂我就捶死我自己!

你是人间四月天

MySQL 面试 mysql事务

架构师训练营第五周 - 总结

Eric

极客大学架构师训练营

熟悉JVM吗?为什么新生代内存需要有两个Survivor区?

南南

Java 面试 深入理解JVM JVM原理

面试官80%会问的分布式事务中的“最大努力通知”事务

无予且行

Java MySQL 面试 事务

Java程序员的必修课之Spring理解透彻了吗?不会还咋去面试?

犬来八荒

Java spring 面试 后端 框架

k6简单入门

风中之心

性能测试

hash一致性算法与优化

Mr.Monkey

你那么追捧的 SpringBoot,到底替你做了什么?

爱java爱自己

spring

计算机操作系统基础(十三)---线程同步之读写锁

书旅

php laravel 线程 操作系统 进程

老是自以为JVM懂了,那你知道 i = i++和 i = ++i 的区别吗?

小谈

Java 面试 编程语言 JVM 程序

「架构师训练营」第 5 周作业 - 一致性哈希算法

guoguo 👻

极客大学架构师训练营

深入理解ThreadLocal:拨开迷雾,探究本质

itlemon

源码分析 ThreadLocal

一致性哈希 -- java 实现

lei Shi

游戏夜读 | 跟风说一说爬虫

game1night

解决死锁的4种基本方法(建议收藏)

小吴选手

Java 死锁

JVM中的双亲委派机制你还没懂吗?

阿文

Java JVMTI JVM 深入理解JVM JVM原理

工业4.0|振动分析能做到预防性维护吗?

清水河路人甲

Cordova项目使用Android Studio真机调试

麦洛

android Android Studio 真机调试

公司一直用Mybatis的原因原来在这!不得不竖起我的大拇指

小闫

Java mybatis mybatis-config.xml mybatis缓存

【Python】 any() 和 or 区别你真的知道吗?

Leetao

Python 数据结构 Python基础知识

碎片化学习行不行

封不羁

道路千万条,安全只三条

石君

安全评估 安全设计

Hexo blog 创建指导手册

想飞的鱼

GitHub Hexo GitHub Pages Blog

IDEA 不为人知的 5 个骚技巧!真香!

王磊

Java 工具 IDEA

如果张东升是个程序员

程序员生活志

程序员 张东升

Hash一致性算法的Java实现

wei

架构师训练营第 5 周——学习总结

在野

极客大学架构师训练营

Java线程池最细的解释,看完后彻底征服面试官

小新

Java 架构 面试 线程 线程池

如何通过调试学习 nginx ?

张小方

c++ nginx 后端 高性能 服务器端开发

这是什么神仙面试宝典?半月看完25大专题,居然斩获阿里P7offer

码哥小胖

Java spring 面试

面试官:反射都不会,还敢说自己会Java?

码农月半

Java 面试 反射 java反射

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据_AI&大模型_KYLE WIGGERS_InfoQ精选文章