NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

谷歌 BigQuery 增加了新的公开数据集

  • 2017-01-09
  • 本文字数:624 字

    阅读完需:约 2 分钟

Stack Overflow近日宣布,通过谷歌 BigQuery 提供它的数据集。开发人员可以使用平常的 SQL 语句查询完整的 Stack Overflow 数据集,包括帖子、投票、标签和徽章。使用 BigQuery 的 REST API ,开发人员可以根据需要使用他们自选的工具导出数据。BigQuery 上的数据集支持联合查询,开发人员使用普通的 SQL 就可以跨领域获得有用的见解。

除了 Stack Overflow 的数据集以外,BigQuery 还支持对 Hacker News 数据集 GitHub 数据集的访问,这两个数据集连同 Stack Overflow 数据集可以提供有用的见解。BigQuery 近日还围绕纽约市的数据增加了三个数据集,分别是关于机动车碰撞城市自行车旅行及311 非紧急市政服务电话请求。BigQuery 之前已经有一个数据集,其中包含2009 年到2015 年纽约市的每一次出租车和豪华轿车旅行,上述三个数据集对此是一个补充。

当前,BigQuery 还有其他可用的数据集,其中包括气象信息部分数据远至1763 年)、医疗数据、350 万数字化图书、一个包含元数据并标注了900 万URL 的图像数据集、美国国税局及美国职棒大联盟的数据。还有一个数据集包含了世界各地的新闻和事件,每15 分钟更新一次。该数据集是由 GDELT 项目提供的。此外,BigQuery 还包含 Personal Genome 项目提供的 Genomics 数据集 Wikipedia 页面访问量数据以及将近 20 亿条 Reddit 评论

感兴趣的读者可以通过 BigQuery 控制台获取 Stack Overflow 数据集,也可以通过 reddit 社区参与进一步的讨论。

查看英文原文 Google BigQuery Adds New Public Datasets

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2017-01-09 18:002444
用户头像

发布了 1008 篇内容, 共 374.5 次阅读, 收获喜欢 341 次。

关注

评论

发布
暂无评论
发现更多内容

你真的会 i++吗

爱笑的小雨

Web 键盘输入法应用开发指南 (5) —— 实战技巧

天择

JavaScript 键盘 实战 输入法 3月月更

推荐学java——SpringMVC第一课

逆锋起笔

springmvc java框架 Spring Java 3月月更

VuePress 博客如何开启本地 HTTPS 访问

冴羽

JavaScript Vue 前端 vuepress 博客搭建

运维接受新挑战!网易云原生运维体系建设之路

网易数帆

Kubernetes 云原生 运维自动化

群晖 NAS 安装的 Docker MySQL 数据库没有办法通过局域网连接

HoneyMoose

注入语句详解(get注入,cookie注入,搜索型注入等)

喀拉峻

网络安全

深入分析沙箱逃逸漏洞

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞

编程术语的类比(二)

北极的大企鹅

学习 思维转换 编程思想

客户之声|客如云上线 OceanBase 小记

OceanBase 数据库

数据库 oceanbase 客户实践 客如云

TCP协议:如何保证页面文件能被完整送达浏览器?

Tristan

前端 网络层 TCP协议

OCR产业应用实战,多类别电表读数识别方案详解

百度大脑

在数字化与绿色的双轮之间,华为为全球企业搭建一道“车轴”

脑极体

ICLR 2022|唯快不破!北航、NTU、百度飞桨提出面向极限压缩的全二值化BiBERT

百度大脑

性能测试中过滤异常的响应时间

FunTester

性能测试 HTTP 接口测试 响应时间 FunTester

如何避免黑客攻击?国内首个云端加密代码库来帮忙

阿里云云效

阿里云 云原生 云效 代码安全 代码加密

烂书!《气候经济与人类未来》

懒时小窝

烂书

Curve 加入 PolarDB 开源数据库社区,强化分布式共享存储

网易数帆

数据库 postgresql 云原生 分布式存储 polarDB

演讲实录|云原生时代,OAM模型加持下的应用交付与管理实践

York

运维 云原生 OAM 应用开发

不联网的情况下,使用 electron-builder 快速打包全平台应用

编程三昧

Electron 3月月更 electron-builder

千万级学生管理系统的考试试卷存储方案

阿卷

架构实战营

教你3种Kafka的指定副本作为Leader的实现方式

华为云开发者联盟

Leader Kafk 副本 AR顺序

FinClip首届黑客马拉松 "快码加编”招募中,邀你挥洒创意赢万元现金大奖

FinClip

小程序 移动开发 APP开发 小程序插件

详解Swin Transformer核心实现,经典模型也能快速调优

百度大脑

Android编译优化系列-kapt篇

字节跳动终端技术

android 字节跳动 编译优化 火山引擎 火山引擎MARS

编程和英语,数学到底什么关系

北极的大企鹅

思维转换 编程思想

编程术语的类比(一)

北极的大企鹅

思维转换 编程思想

北京大学拔山讲坛 | OceanBase 阳振坤:特斯拉电动汽车的发展对分布式数据库的启示

OceanBase 数据库

数据库 oceanbase 北京大学 线上讲座

CPU占用率爆满,服务器遭遇挖矿如何排查

山河已无恙

Linux 3月月更

推荐 10 本 Go 经典书籍,从入门到进阶(含下载方式)

AlwaysBeta

Go golang 编程语言 书单推荐 Go 语言

java培训:多个线程同时访问一个类是否有问题方法

@零度

JAVA开发

谷歌BigQuery增加了新的公开数据集_Google_Alex Giamas_InfoQ精选文章