写点什么

谷歌 BigQuery 增加了新的公开数据集

  • 2017-01-09
  • 本文字数:624 字

    阅读完需:约 2 分钟

Stack Overflow近日宣布,通过谷歌 BigQuery 提供它的数据集。开发人员可以使用平常的 SQL 语句查询完整的 Stack Overflow 数据集,包括帖子、投票、标签和徽章。使用 BigQuery 的 REST API ,开发人员可以根据需要使用他们自选的工具导出数据。BigQuery 上的数据集支持联合查询,开发人员使用普通的 SQL 就可以跨领域获得有用的见解。

除了 Stack Overflow 的数据集以外,BigQuery 还支持对 Hacker News 数据集 GitHub 数据集的访问,这两个数据集连同 Stack Overflow 数据集可以提供有用的见解。BigQuery 近日还围绕纽约市的数据增加了三个数据集,分别是关于机动车碰撞城市自行车旅行及311 非紧急市政服务电话请求。BigQuery 之前已经有一个数据集,其中包含2009 年到2015 年纽约市的每一次出租车和豪华轿车旅行,上述三个数据集对此是一个补充。

当前,BigQuery 还有其他可用的数据集,其中包括气象信息部分数据远至1763 年)、医疗数据、350 万数字化图书、一个包含元数据并标注了900 万URL 的图像数据集、美国国税局及美国职棒大联盟的数据。还有一个数据集包含了世界各地的新闻和事件,每15 分钟更新一次。该数据集是由 GDELT 项目提供的。此外,BigQuery 还包含 Personal Genome 项目提供的 Genomics 数据集 Wikipedia 页面访问量数据以及将近 20 亿条 Reddit 评论

感兴趣的读者可以通过 BigQuery 控制台获取 Stack Overflow 数据集,也可以通过 reddit 社区参与进一步的讨论。

查看英文原文 Google BigQuery Adds New Public Datasets

2017-01-09 18:002845
用户头像

发布了 1008 篇内容, 共 419.7 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

Golang Gin 框架之分组路由(五)

liuzhen007

11月日更

《深入理解JVM虚拟机》读书笔记:第一章

Joseph295

netty系列之:在http2中使用framecodec

程序那些事

Java java 并发 程序那些事 11月日更

Windows 11再出杀手锏....

Jackpop

SAP CRM Survey调查问卷的模型设计原理解析

汪子熙

中间件 CRM SAP C4C 11月日更

图论算法:稳定婚姻问题,如何找到最适合自己的另一半

博文视点Broadview

分析23个赛季NBA数据,我发现10条难以置信的信息!

Jackpop

Prometheus Exporter (八)kube-state-metrics

耳东@Erdong

Kubernetes Prometheus exporter 11月日更 kube-state-metrics

java语言前景怎么样,到底需不需要参加培训

@零度

Java JAVA开发

一起来写 VS Code 插件:VS Code 版 CNode 已上线

狂奔滴小马

JavaScript vscode 大前端

使用 Omnibus 安装极狐GitLab

极狐GitLab

极狐GitLab 安装使用

使用 ABAP 代码提交 SAP CRM Survey 调查问卷

汪子熙

CRM SAP abap 11月日更 问卷模型

人脸检测实战:使用opencv加载深度学习模型实现人脸检测

AI浩

一起来写 VS Code 插件:实现一个翻译插件

狂奔滴小马

JavaScript vscode 大前端 vs

Android C++系列:Linux进程间通信(一)

轻口味

c++ android 11月日更

2018年世界杯德国竟然输给韩国?终于找到原因了!

Jackpop

被Chrome坑惨了!

Jackpop

使用 NextJS 和 TailwindCSS 重构我的个人博客

狂奔滴小马

大前端 Blog nextjs

StarRocks Hacker Meetup 小记 Part 2|实时更新场

StarRocks

大数据 Meetup StarRocks

“2021ISIG中国产业智能大会低代码峰会”即将开幕,钉钉宜搭叶周全受邀出席

一只大光圈

阿里巴巴 互联网 钉钉 低代码 钉钉宜搭

今日谈:BoltDB数据库,一款纯Go实现的KV数据库

恒生LIGHT云社区

数据库 Go 语言 BoltDB

用 NodeJS 开发一版在线流程图网站

狂奔滴小马

JavaScript 大前端 Node

管理纪要

KoLee

[Pulsar] 消息生命历程(三)——客户端发送消息

Zike Yang

Apache Pulsar 11月日更

入驻快讯|欢迎ShowMeBug正式入驻 InfoQ 写作平台!

InfoQ写作社区官方

【高并发】由InterruptedException异常引发的思考

冰河

Java 并发编程 多线程 高并发 异步编程

模块四作业:设计千万级学生系统的试卷存储方案

Geek_99eefd

模块四 「架构实战营」

🏆【Alibaba中间件技术系列】「RocketMQ技术专题」让我们一起探索一下DefaultMQPullConsumer的实现原理及源码分析

码界西柚

阿里巴巴 RocketMQ 消息队列 11月日更 Apache RocketMQ

Flutter设置App的应用名字和应用logo图标的方法

坚果

flutter 11月日更

一文讲透如何用明道云构建物料需求计划系统

明道云

一起来写 VS Code 插件:为你的团队提供常用代码片段

狂奔滴小马

vscode 大前端

谷歌BigQuery增加了新的公开数据集_Google_Alex Giamas_InfoQ精选文章