2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

谷歌开源 Quick Draw 数据集上线谷歌云,内含 5000 万涂鸦图像数据

  • 2018-11-19
  • 本文字数:1212 字

    阅读完需:约 4 分钟

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据


将 QuickDraw 数据汇总排列成字母形状(来源:Deborah Schmidt)


你可以通过涂鸦的方式了解一个人的很多东西。这是交互式网络实验Quick Draw背后的目的,它由 Google 创意实验室于 2016 年 11 月推出。Quick Draw 招募大胆的互联网用户来绘制草图,同时利用人工智能(AI)来尝试识别网友绘制的内容 ——有点像 Pictionary 的高科技版本。


Quick Draw 一共收集了超过 345 种类别的 10 亿张图画,谷歌在去年开源了其中 5000 万张图画,开源数据为完整的元数据,包括提示和用户地理位置。近日,谷歌将该开源数据集以 API 和 Polymer 组件的形式上线谷歌云平台。(给初学者的提示:Polymer 指的是一个用于构建 Web 应用程序的开源 JavaScript 库)


从本周开始,加入公共Google群组的任何谷歌云平台客户都可以通过搜索并添加到项目来把 Quick Draw API 添加到自己的库中。 使用 Polymer 组件,只需要使用一行代码就能在基于 Web 的应用程序中显示涂鸦。


谷歌创意实验室的创意技术专家 Nick Jonas 在接受电话采访时表示:“当我们一开始发布数据集时,它基本上是 345 个类别中每张图对应一个文件,并且使用起来有点麻烦。过去一年中进行的大量研究都是对整个数据集的大规模分析。 我们从开发人员那里得到了一些反馈,他们表示希望能有一种更简单的方法来对数据做快速建模。”



Jonas 解释说,通过 Quick Draw API(使用 Google Cloud Endpoints 来托管 Node.js API)可以直接访问原始数据集中包含的 5000 万个文件,但不需要把所有文件全部下载下来。 它为每一个涂鸦图案返回一个 JSON 对象或 HTML 画布渲染。


“通过这种方式,用户不需要下载一堆又一堆的数据就可以玩转这些图案了。”Jonas 表示。


从这些数据中总结出了一些令人惊讶的见解。Quartz 在 6 月份进行的一项研究发现,86%的美国玩家喜欢逆时针画圆圈,而 80%的日本玩家则喜欢顺时针画圆圈。(该研究发现的差异可归因于日语书写中一般采用从左上到右下的笔划顺序。)同时,Google Research 的一项内部调查发现,来自西方国家的用户涂鸦画出来的鱼的朝向与亚洲用户画出来鱼的方向相反。


Quick Draw 数据集也被创造性地用在了其他地方。 英国艺术家Neil Mendoza使用面部跟踪算法在人头上应用 Quick Draw 草图,德国计算机科学家Deborah Schmidt使用 30 万个随机涂鸦的子集来填充拼贴的字母模板。



Nelil Mendoza 将 Quick Draw 的脸部特征应用到真正的人脸上


未来,Quick Draw 的研究团队将考虑把这些涂鸦迁移到数据库中,以提供细粒度的访问控制。 理论上,到时候用户可以执行诸如“给我一张中国用户在 2017 年 3 月画的、能被认出来的图”这样的查询。


“我希望能够鼓励人们以新的方式使用数据集并做出贡献,看这个数据集最终可能扩展到多大,”Jonas 说, “我只是想鼓励更多开发者来玩转这个数据集。”




会议推荐:12 月 20-21,AICon 将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


2018-11-19 15:241534
用户头像
蔡芳芳 InfoQ 总编辑

发布了 819 篇内容, 共 621.3 次阅读, 收获喜欢 2823 次。

关注

评论

发布
暂无评论
发现更多内容

Spark性能调优-RDD算子调优篇(深度好文,面试常问,建议收藏)

五分钟学大数据

大数据 spark 28天写作 3月日更

程序员之禅(四)

每天读本书

读书笔记 每天读本书

互联网信贷风险与大数据 风险管理&信贷准入

张老蔫

28天写作

区块链电子合同应用平台-助力企业数字化转型

13530558032

正则表达式.01 - 元字符

insight

正则表达式 3月日更

【金三银四】这才是打开Java面试的正确方式,吃透这份【Java面试手册】offer稳了

Java 编程 面试

说完列表说字典,说完字典说集合,滚雪球学 Python

梦想橡皮擦

28天写作 3月日更

两会热词“区块链”,打开传统溯源的一扇大门!

源中瑞-龙先生

区块链 两会

Elasticsearch Index Types and Mappings

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 3月日更

如何写 Go 代码

Rayjun

Go 语言

5个身份和访问管理的最佳实践

龙归科技

数字身份 身份认证 身份安全 统一身份认证

Git 常用记录

Leo

git 大前端

LARAVEL SMTP 服务泄露,laravel env暴露

kaer

laravel 信息安全 漏洞 ENV SMTP

智慧党建系统开发,智慧组工平台建设

13530558032

【回溯算法】借助最后一道「组合总和」问题来总结一下回溯算法 ...

宫水三叶的刷题日记

面试 LeetCode 数据结构与算法

阿里面经最新分享:Java面试指南/成长笔记(金三银四程序员必备)

比伯

Java 编程 程序员 架构 面试

微信团队分享:微信直播聊天室单房间1500万在线的消息架构演进之路

JackJiang

微信 架构设计 即时通讯

【LeetCode】下一个更大元素 II Java题解

Albert

算法 LeetCode 28天写作

区块链药品溯源解决方案-区块链技术监管医药溯源

13530558032

饿了么刚给我确认了p7的职位,对自己的经历,做一个面试总结。

Java架构之路

Java 程序员 架构 面试 编程语言

该死的端口占用!教你用 Shell 脚本一键干掉它!

星安果

Shell 脚本 shell脚本编写 端口 端口占用

聊聊交易中台系统设计与思考

架构精进之路

中台 七日更

2021年阿里巴巴Java百亿级并发系统设计笔记(全彩版)

Java架构追梦

Java 阿里巴巴 面试 架构师 百亿级并发

总结近期腾讯+阿里+百度Java岗高频面试题,提问率高达98%,看到这篇文章基本offer稳了

Java架构之路

Java 程序员 架构 面试 编程语言

mock 请求分发

blueju

JavaScript React Mock umi umijs

架构大作业1

J

进程调度算法

鲁米

算法

该不该签竞业协议?

石云升

程序员 话题讨论 28天写作 职场经验 3月日更

架构大作业2

J

《不看后悔》38个JVM精选问答,让你变成专家

Java 架构 面试 JVM虚拟机原理

Flutter 2 来了

SamGo

flutter

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据_AI&大模型_KYLE WIGGERS_InfoQ精选文章