写点什么

谷歌 BigQuery 增加了新的公开数据集

  • 2017-01-09
  • 本文字数:624 字

    阅读完需:约 2 分钟

Stack Overflow近日宣布,通过谷歌 BigQuery 提供它的数据集。开发人员可以使用平常的 SQL 语句查询完整的 Stack Overflow 数据集,包括帖子、投票、标签和徽章。使用 BigQuery 的 REST API ,开发人员可以根据需要使用他们自选的工具导出数据。BigQuery 上的数据集支持联合查询,开发人员使用普通的 SQL 就可以跨领域获得有用的见解。

除了 Stack Overflow 的数据集以外,BigQuery 还支持对 Hacker News 数据集 GitHub 数据集的访问,这两个数据集连同 Stack Overflow 数据集可以提供有用的见解。BigQuery 近日还围绕纽约市的数据增加了三个数据集,分别是关于机动车碰撞城市自行车旅行及311 非紧急市政服务电话请求。BigQuery 之前已经有一个数据集,其中包含2009 年到2015 年纽约市的每一次出租车和豪华轿车旅行,上述三个数据集对此是一个补充。

当前,BigQuery 还有其他可用的数据集,其中包括气象信息部分数据远至1763 年)、医疗数据、350 万数字化图书、一个包含元数据并标注了900 万URL 的图像数据集、美国国税局及美国职棒大联盟的数据。还有一个数据集包含了世界各地的新闻和事件,每15 分钟更新一次。该数据集是由 GDELT 项目提供的。此外,BigQuery 还包含 Personal Genome 项目提供的 Genomics 数据集 Wikipedia 页面访问量数据以及将近 20 亿条 Reddit 评论

感兴趣的读者可以通过 BigQuery 控制台获取 Stack Overflow 数据集,也可以通过 reddit 社区参与进一步的讨论。

查看英文原文 Google BigQuery Adds New Public Datasets

2017-01-09 18:003057
用户头像

发布了 1008 篇内容, 共 442.4 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

有一说一,阿里内部SpringBoot王者晋级之路全彩小册开源,让我开了眼

热爱java的分享家

Java 架构 面试 程序人生 编程语言

HBase shell get命令从二进制还原真实值

WindFlying

dart系列之:元世界pubspec.yaml文件详解

程序那些事

flutter dart 程序那些事 11月日更

这个无敌设计,可以解析并运算任意数学表达式

Tom弹架构

Java 架构 设计模式

一网打尽!音乐高手都在使用的打谱软件不藏私推荐!

懒得勤快

ABAP 和 Java 的单元测试 Unit Test

汪子熙

Java abap 11月日更 JavaSAP

987页的Java面试宝典,看完才发现,应届生求职也没那么难

热爱java的分享家

Java 架构 面试 程序人生 编程语言

关于openGauss账本数据库:你想知道的这里都有

CSS奇技淫巧之滤镜(二)drop-shadow

Augus

CSS 11月日更

“太白”团队加入OpenInfra Labs,联合社区成员共同完善多云管理技术

Hadoop实战篇-集群版(2)

进击的梦清

大数据 hadoop zookeeper

解决文件存储难题 openGauss隆重推出段页式特性

Ustore在openGauss闪亮登场,重构openGauss数据存储的灵魂

Python代码阅读(第59篇):根据value查询字典key值

Felix

Python 编程 阅读代码 字典 Python初学者

轻松搞懂MySQL的执行计划,再也不怕SQL优化了

华为云开发者联盟

MySQL 数据库 sql 执行计划 检索

制作 Flask 程序容器镜像

wong

Python flask k8s Dockerfile

基于MySQL binlog日志,实现Elasticsearch近实时同步实践

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

快速剪辑-助力度咔智能剪辑提效实践

百度Geek说

架构 后端

如何用EasyRecovery恢复中毒U盘中丢失的文件

淋雨

EasyRecovery

“阿里巴巴”再次出手,这份Github新开源303页Spring全家桶高级笔记,让你打开眼界

热爱java的分享家

Java 架构 面试 程序人生 编程语言

问题也许没有看上去那么简单

神策技术社区

神策数据

低代码——不应该只是玩具

行云创新

云原生 低代码 开发 高效

为何飞书成了先进企业的标配?

ToB行业头条

从0到10彻底搞懂信息流【投放系统】

水泽山林

系统架构 推荐系统 智能投放 内容平台

45岁程序员发求职贴:精通各种技术体系,却连个面试机会都没有…

Java高级开发

Java 程序员 面试 职场

AI界的革命!终于可以自动标注了!

百度开发者中心

AI 自动标注工具

论文解读丨LayoutLM: 面向文档理解的文本与版面预训练

华为云开发者联盟

CV 预训练 LayoutLM模型 无标注 文档理解

肝!Spring JDBC持久化层框架“全家桶”教程

热爱java的分享家

Java 架构 程序人生 编程语言 架构师

使用 Node.js 消费SAP Cloud for Customer上的Web service

汪子熙

node.js SAP C4C 11月日更

SOLID原则之 单一职责原则

面向对象的猫

SOLID

华为云GaussDB NoSQL云原生多模数据库的超融合实践

华为云数据库小助手

GaussDB 华为云数据库 GaussDB NoSQL

谷歌BigQuery增加了新的公开数据集_Google_Alex Giamas_InfoQ精选文章