写点什么

谷歌开源 Quick Draw 数据集上线谷歌云,内含 5000 万涂鸦图像数据

  • 2018-11-19
  • 本文字数:1212 字

    阅读完需:约 4 分钟

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据


将 QuickDraw 数据汇总排列成字母形状(来源:Deborah Schmidt)


你可以通过涂鸦的方式了解一个人的很多东西。这是交互式网络实验Quick Draw背后的目的,它由 Google 创意实验室于 2016 年 11 月推出。Quick Draw 招募大胆的互联网用户来绘制草图,同时利用人工智能(AI)来尝试识别网友绘制的内容 ——有点像 Pictionary 的高科技版本。


Quick Draw 一共收集了超过 345 种类别的 10 亿张图画,谷歌在去年开源了其中 5000 万张图画,开源数据为完整的元数据,包括提示和用户地理位置。近日,谷歌将该开源数据集以 API 和 Polymer 组件的形式上线谷歌云平台。(给初学者的提示:Polymer 指的是一个用于构建 Web 应用程序的开源 JavaScript 库)


从本周开始,加入公共Google群组的任何谷歌云平台客户都可以通过搜索并添加到项目来把 Quick Draw API 添加到自己的库中。 使用 Polymer 组件,只需要使用一行代码就能在基于 Web 的应用程序中显示涂鸦。


谷歌创意实验室的创意技术专家 Nick Jonas 在接受电话采访时表示:“当我们一开始发布数据集时,它基本上是 345 个类别中每张图对应一个文件,并且使用起来有点麻烦。过去一年中进行的大量研究都是对整个数据集的大规模分析。 我们从开发人员那里得到了一些反馈,他们表示希望能有一种更简单的方法来对数据做快速建模。”



Jonas 解释说,通过 Quick Draw API(使用 Google Cloud Endpoints 来托管 Node.js API)可以直接访问原始数据集中包含的 5000 万个文件,但不需要把所有文件全部下载下来。 它为每一个涂鸦图案返回一个 JSON 对象或 HTML 画布渲染。


“通过这种方式,用户不需要下载一堆又一堆的数据就可以玩转这些图案了。”Jonas 表示。


从这些数据中总结出了一些令人惊讶的见解。Quartz 在 6 月份进行的一项研究发现,86%的美国玩家喜欢逆时针画圆圈,而 80%的日本玩家则喜欢顺时针画圆圈。(该研究发现的差异可归因于日语书写中一般采用从左上到右下的笔划顺序。)同时,Google Research 的一项内部调查发现,来自西方国家的用户涂鸦画出来的鱼的朝向与亚洲用户画出来鱼的方向相反。


Quick Draw 数据集也被创造性地用在了其他地方。 英国艺术家Neil Mendoza使用面部跟踪算法在人头上应用 Quick Draw 草图,德国计算机科学家Deborah Schmidt使用 30 万个随机涂鸦的子集来填充拼贴的字母模板。



Nelil Mendoza 将 Quick Draw 的脸部特征应用到真正的人脸上


未来,Quick Draw 的研究团队将考虑把这些涂鸦迁移到数据库中,以提供细粒度的访问控制。 理论上,到时候用户可以执行诸如“给我一张中国用户在 2017 年 3 月画的、能被认出来的图”这样的查询。


“我希望能够鼓励人们以新的方式使用数据集并做出贡献,看这个数据集最终可能扩展到多大,”Jonas 说, “我只是想鼓励更多开发者来玩转这个数据集。”




会议推荐:12 月 20-21,AICon 将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


2018-11-19 15:241543
用户头像
蔡芳芳 InfoQ 总编辑

发布了 820 篇内容, 共 622.9 次阅读, 收获喜欢 2823 次。

关注

评论

发布
暂无评论
发现更多内容

基于Flexus X实例安装YesPlayMusic在线音乐播放器

平平无奇爱好科技

API对于程序员的多元用法:从基础到实战

科普小能手

学习 编程语言 编程学习 API 接口 Python API

Three.js 开发框架的主要特点

北京木奇移动技术有限公司

three.js 软件外包公司 webgl开发

车联网服务平台的数据安全监测、共享、流通

芯盾时代

车联网 物联网 智能汽车

在Flexus X实例上安装JDK和Tomcat保姆教学

平平无奇爱好科技

WordPress部署

平平无奇爱好科技

部署个人知识管理系统SiyuanNote

平平无奇爱好科技

2024 京东零售技术年度总结

京东科技开发者

前端怎么做好稳定性保障体系建设?精准搞定“白虎”,不用叫“广智”!

京东科技开发者

基于华为云Flexus X实例部署Uptime-Kuma服务器监控面板

平平无奇爱好科技

广州11号线地铁智慧公厕案例:光明源智能科技的智慧创新实践

光明源智慧厕所

智慧厕所 智慧公厕

基于Flexus X实例搭建Nginx网站服务

平平无奇爱好科技

阿里云 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%

阿里云大数据AI技术

大数据 阿里云 弹性伸缩 EMR

稳定性方法论:可灰度 & 可监控 & 可回滚

京东科技开发者

0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS

百度Geek说

百度云 大模型、 #GPU

COB LED屏幕在小间距显示时代的机遇与挑战

Dylan

cobra LED显示屏 全彩LED显示屏 led显示屏厂家 市场

Flexus云服务器X实例实践:安装SimpleMindMap思维导图工具

平平无奇爱好科技

使用sysbench对Flexus X实例对mysql进行性能测评

平平无奇爱好科技

《CPython Internals》阅读笔记:p152-p176

codists

CPython Internals

华为云弹性云服务器FlexusX实例下的Nginx性能测试

平平无奇爱好科技

电商平台API与ERP的无缝对接:策略与实践探索

代码忍者

ERP系统 API 策略

WebGL 开发框架及其分析

北京木奇移动技术有限公司

数字孪生 软件外包公司 webgl开发

解锁电商新境界,在华为云Flexus上快速部署并运行Magento电商系统

平平无奇爱好科技

部署在线文档应用程序CodeX Docs

平平无奇爱好科技

酒店有数,人间有味,伙伴有华为

脑极体

AI

爆肝整理!一文带你吃透软件测试

测试人

软件测试

华为云Flexus X实例性能实测:速度与稳定性的完美结合

平平无奇爱好科技

NocoBase 本周更新汇总:详情区块联动规则

NocoBase

开源 低代码 零代码 无代码 版本更新

如何通过物化视图加速数据湖查询?

镜舟科技

sql 数据湖 数据分析 StarRocks 物化视图

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据_AI&大模型_KYLE WIGGERS_InfoQ精选文章