2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Registry of Open Data on AWS (RODA)

  • 2019-10-25
  • 本文字数:545 字

    阅读完需:约 2 分钟

Registry of Open Data on AWS (RODA)

将近十年前,我的同事 Deepak Singh 在为研究、分析和开发人员分页一文中介绍了 AWS 公用数据集的概念。我很高兴地告诉大家 Deepak 仍然是 AWS 团队的重要成员,公用数据集项目仍在不断发展壮大!


而今天我们宣布推出新的开放和公用数据利器,这就是 Registry of Open Data on AWS,简称 RODA。此注册表包含现有的公用数据集,任何人都可添加自己的数据集,从而在 AWS 上访问和分析。


注册表探秘


首页列举了注册表中的所有数据集:



输入搜索词以仅显示匹配的数据集,从而缩小列表:



每个数据集都有关联的详情页,包括使用情况举例、许可证信息以及在 AWS 上找到和访问数据集所需的信息:



在此例中,我可以使用简单的 CLI 命令访问数据:



此外我还可以通过编程访问数据,或将数据下载到我的 EC2 实例。


将数据添加到存储库


如果您拥有可供公开访问的数据集,并且希望将它添加到 RODA,您只需向我们发送一条 Pull 请求。转至 open-data-registry 存储库,读取 CONTRIBUTING 文档,然后使用 datasets 目录中的一个现有文件为模型,创建描述您的数据集的 YAML 文件:



我们会定期审核 Pull 请求;您可以“添加星标”或关注存储库以跟踪添加和更改。


欢迎让我震撼


我欢迎新数据集的蜂拥而入,也欢迎展示如何以强大而有意思的方式使用数据的博客和应用程序。立即尝试,将您的收获分享给我吧!


2019-10-25 08:00896

评论

发布
暂无评论
发现更多内容

微服务从代码到k8s部署应有尽有系列(一)

万俊峰Kevin

Go 微服务 web开发 go-zero RPC框架

虎年开工大吉|Hoo研究院2022年0207期区块链简报

区块链前沿News

Hoo 虎符交易所 虎符研究院 虎年

Linux之free命令

入门小站

Linux

Apache Druid 在 Shopee 的工程实践

Shopee技术团队

数据库 后端 Apache Druid

(2-2|27)🤗Huggingface.Transformers是什么?

mtfelix

300天创作

在线标准程序员计算器

入门小站

工具

Hadoop运行环境搭建

编程江湖

hadoop

云效交付篇:流水线持续交付 | 云效快速入门

阿里云云效

阿里云 DevOps 云原生 持续交付 研发

容器编排技术 Kubernetes 学习总结|社区征文

架构精进之路

云原生 新春征文 2月日更

春节消费观察:四种愉悦感,抓住女人心

脑极体

模块七作业

whoami

「架构实战营」

为什么你辛苦肝的博客没人看?搭框架、排版、画图技巧这些你真的懂么?

码哥字节

排版规范 写作技巧 2月月更

暂时不在更新

你?

Python代码阅读(第74篇):单词首字母转换成大写

Felix

Python 编程 字符串 阅读代码 Python初学者

人人都是 Serverless 架构师 | 弹幕应用开发实战

Serverless Devs

Serverless 弹幕 应用开发

Milvus 2.0 正式 GA

Zilliz

数据库 AI

【架构实战营】模块七:命题作业

wgl

「架构实战营」

Serverless 年终技术盘点 :工业、学术、社区遍地开花

Serverless Devs

云计算 阿里云 Serverless

Apache Pulsar 2021 年度盘点(结尾有惊喜)

Apache Pulsar

开源 云原生 中间件 社区 Apachepulsar

架构实战营模块七 作业

Jude

架构实战营

7

Geek_59dec2

预约小程序开发笔记一:背景与技术方案的选型

CC同学

Serverless 应用优化四则秘诀

Serverless Devs

Serverless

Apache POI详解及Word文档读取示例

程序员架构进阶

Java Apache POI 2月月更

盘点下近几年退役的顶级 Apache 大数据项目 - 继 Sentry,Sqoop 之后,Ambari 正式退役

明哥的IT随笔

大数据 ambari sqoop sentry

职场焦虑之我对35岁危机的看法

老张

35岁危机 职场发展

低代码实现探索(三十一)管好你的组件--元信息

零道云-混合式低代码平台

Go 学习路线(2022)

AlwaysBeta

Go golang Go 语言

2021 Apache Pulsar 中文社区先锋奖与年度优秀案例奖出炉!

Apache Pulsar

开源 云原生 中间件 Apache Pulsar 社区

抽奖| Apache Pulsar 社区新年福袋来啦

Apache Pulsar

开源 云原生 中间件 Apache Pulsar 社区

腾讯员工怒怼加班文化事件:大厂的内卷,小厂有什么资格?

菜根老谭

Registry of Open Data on AWS (RODA)_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章