写点什么

Registry of Open Data on AWS (RODA)

  • 2019-10-25
  • 本文字数:545 字

    阅读完需:约 2 分钟

Registry of Open Data on AWS (RODA)

将近十年前,我的同事 Deepak Singh 在为研究、分析和开发人员分页一文中介绍了 AWS 公用数据集的概念。我很高兴地告诉大家 Deepak 仍然是 AWS 团队的重要成员,公用数据集项目仍在不断发展壮大!


而今天我们宣布推出新的开放和公用数据利器,这就是 Registry of Open Data on AWS,简称 RODA。此注册表包含现有的公用数据集,任何人都可添加自己的数据集,从而在 AWS 上访问和分析。


注册表探秘


首页列举了注册表中的所有数据集:



输入搜索词以仅显示匹配的数据集,从而缩小列表:



每个数据集都有关联的详情页,包括使用情况举例、许可证信息以及在 AWS 上找到和访问数据集所需的信息:



在此例中,我可以使用简单的 CLI 命令访问数据:



此外我还可以通过编程访问数据,或将数据下载到我的 EC2 实例。


将数据添加到存储库


如果您拥有可供公开访问的数据集,并且希望将它添加到 RODA,您只需向我们发送一条 Pull 请求。转至 open-data-registry 存储库,读取 CONTRIBUTING 文档,然后使用 datasets 目录中的一个现有文件为模型,创建描述您的数据集的 YAML 文件:



我们会定期审核 Pull 请求;您可以“添加星标”或关注存储库以跟踪添加和更改。


欢迎让我震撼


我欢迎新数据集的蜂拥而入,也欢迎展示如何以强大而有意思的方式使用数据的博客和应用程序。立即尝试,将您的收获分享给我吧!


2019-10-25 08:00822

评论

发布
暂无评论
发现更多内容

AI加持的修图革命!Lightroom 2024 智能调色一键惊艳

Rose

Microchip推出面向边缘人工智能应用的新型高密度电源模块MCPF1412

新消费日报

阿里巴巴十亿级并发系统设计:实现高并发场景下的稳定性和高性能

程序员高级码农

Java 程序员 高并发‘’

华为音乐走进西安交大“白鸽音乐节”,一起“碰”进春日音浪

最新动态

一家家具厂,如何用零代码搭建自己的 ERP ?

NocoBase

开源 低代码 零代码 ERP 家具行业

Go Context 最佳实践

俞凡

golang 最佳实践

(JS实现编辑DWG)AI实现网页CAD多行文本开发

WEB CAD SDK

AI编程 网页CAD 在线CAD AI协助CAD二次开发

PingCAP“一号员工”唐刘:回顾我与 TiDB 的十年成长之旅

PingCAP

数据库 TiDB

时序数据库 TDengine 助力石油石化业务, 平滑接替 Oracle 数据库

TDengine

数据库 tdengine 时序数据库

火山引擎✖️希沃:助力1000万教师用上AI助手

新消费日报

云上玩转DeepSeek系列之六:DeepSeek云端加速版发布,具备超高推理性能

阿里云大数据AI技术

人工智能 阿里云 模型部署 PAI DeepSeek

APTSell x TiDB AutoFlow:AI 数字员工,助力销售业绩持续增长

PingCAP

数据库 TiDB

MCP Server 实践之旅第 1 站:MCP 协议解析与云上适配

阿里巴巴云原生

阿里云 Serverless 云原生 MCP

Redis可视化神器!Redis Desktop Manager 让数据库管理如此简单

Rose

苹果电脑免费截图工具:iShot for Mac

Rose

Web3项目开发框架及性能

北京木奇移动技术有限公司

软件外包公司 web3开发 web3外包公司

企业AI落地指南系列文章:AI应用开发平台选型六大核心评估维度

UniverAI智宇苍穹

评估标准 开发平台 AI工程化 企业 AI 应用 AI落地

演讲实录:中小企业如何快速构建AI应用?

阿里云大数据AI技术

人工智能 云计算 大数据 阿里云

Dify+DeepSeek实战教程!企业级 AI 文档库本地化部署,数据安全与智能检索我都要

北京好雨科技有限公司

知识库 rainbond 企业号 4 月 PK 榜 dify DeepSeek

HarmonyOS SDK助力鸿蒙版今日水印相机,真实地址防护再升级

HarmonyOS SDK

harmoyos

数据分析与AI|面对 RapidMiner 一万多行汉化翻译难题:中国工程师如何直接实现自动翻译?

Altair RapidMiner

AI 数据分析 RapidMiner 人工智能平台

当东哥开始卷外卖:奶茶砍半价比拼多多还狠!附京东面试题

王中阳Go

面经 京东

5 分钟搞定防御性编程:打造稳健的软件

俞凡

架构 最佳实践

智象未来x商汤大装置:全栈赋能全球首个开放使用视频生成DiT模型

Lily

从企业数智化四阶段解读 TiDB 场景价值

PingCAP

数据库 #TiDB

区块链ETF的功能及开发

北京木奇移动技术有限公司

区块链技术 软件外包公司 区块链ETF

开发者的终极选择!为什么顶级公司都在用DBeaver EE?

Rose

案例分享|基于 Altair SimSolid 的大型通用工装结构力学仿真分析及试验对标

Altair RapidMiner

仿真 CAE 有限元仿真 SimSolid 无网格技术

从边缘到云端,如何通过时序数据库 TDengine 实现数据的全局洞

TDengine

数据库 tdengine 时序数据库

AI 乱写代码怎么破?使用 Context7 MCP Server 让 AI 写出靠谱代码!

Se7en

UX设计神器,Axure RP 9 让交互设计如此简单!

Rose

Registry of Open Data on AWS (RODA)_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章