2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Registry of Open Data on AWS (RODA)

  • 2019-10-25
  • 本文字数:545 字

    阅读完需:约 2 分钟

Registry of Open Data on AWS (RODA)

将近十年前,我的同事 Deepak Singh 在为研究、分析和开发人员分页一文中介绍了 AWS 公用数据集的概念。我很高兴地告诉大家 Deepak 仍然是 AWS 团队的重要成员,公用数据集项目仍在不断发展壮大!


而今天我们宣布推出新的开放和公用数据利器,这就是 Registry of Open Data on AWS,简称 RODA。此注册表包含现有的公用数据集,任何人都可添加自己的数据集,从而在 AWS 上访问和分析。


注册表探秘


首页列举了注册表中的所有数据集:



输入搜索词以仅显示匹配的数据集,从而缩小列表:



每个数据集都有关联的详情页,包括使用情况举例、许可证信息以及在 AWS 上找到和访问数据集所需的信息:



在此例中,我可以使用简单的 CLI 命令访问数据:



此外我还可以通过编程访问数据,或将数据下载到我的 EC2 实例。


将数据添加到存储库


如果您拥有可供公开访问的数据集,并且希望将它添加到 RODA,您只需向我们发送一条 Pull 请求。转至 open-data-registry 存储库,读取 CONTRIBUTING 文档,然后使用 datasets 目录中的一个现有文件为模型,创建描述您的数据集的 YAML 文件:



我们会定期审核 Pull 请求;您可以“添加星标”或关注存储库以跟踪添加和更改。


欢迎让我震撼


我欢迎新数据集的蜂拥而入,也欢迎展示如何以强大而有意思的方式使用数据的博客和应用程序。立即尝试,将您的收获分享给我吧!


2019-10-25 08:00875

评论

发布
暂无评论
发现更多内容

LoongCollector:构建智能时代的数据采集新范式

阿里巴巴云原生

阿里云 云原生 AI Agent

五年磨一剑:Agent 时代追风不如造风

阿里巴巴云原生

阿里云 云原生 AI Agent

龙蜥受邀参加2025开放计算技术大会,解码基础模型驱动下的系统创新与生态共建

OpenAnolis小助手

开源 AI 操作系统 龙蜥社区

聚焦大模型训练效率提升 北大依托昇腾突破细粒度混合并行技术

极客天地

深度拆解LLM的核心技术栈,助您掌握从模型选型到部署优化的全流程

聚客AI学院

人工智能 agent 大模型落地 AI 智能体 RAG应用

55款主流认证类SDK适配鸿蒙5,让数字签名、身份认证更安全更高效

新消费日报

助推宝:一站式营销拓客解决方案

微擎应用市场

365 步数运动宝:创新运动营销解决方案

微擎应用市场

【线程池饱和策略】线程池饱和策略及自定义方法

不在线第一只蜗牛

Java

Django模型迁移指南:从命令用法到最佳实践

电子尖叫食人鱼

Agentic AI, 基于 Dify x OceanBase 的实践

老纪的技术唠嗑局

OceanBase 社区版 dify #工作流

【MySQL索引失效场景】索引失效原因及最左前缀原则详解

不在线第一只蜗牛

MySQL 数据库

全新 MQTT 订阅、BLOB 类型、多级存储支持:TDengine 时序数据库最新版本亮点速览

TDengine

tdengine 时序数据库 tsdb 国产时序数据库

京东零售在智能供应链领域的前沿探索与技术实践

京东零售技术

sql优化谓词下推在join场景中的应用

天翼云开发者社区

数据库 sql

Vibecoding 新体验:实测 Qwen3 Coder 代码生成效果

阿里巴巴云原生

阿里云 云原生 agent Function AI

朋友圈广告助手:高效流量变现工具

微擎应用市场

YashanDB STDDEV_SAMP函数

YashanDB

数据库

【跨国数仓迁移最佳实践4】MaxCompute 企业级能力升级:跨域访问控制与数据安全特性增强

阿里云大数据AI技术

人工智能 云计算 大数据 数据安全 数据迁移

HGDD 荣耀开发者日丨荣耀小游戏线下沙龙圆满收官

荣耀开发者服务平台

荣耀开发者服务平台 荣耀HONOR 荣耀远航计划 HGDD 荣耀开发者日 荣耀小游戏

企业私有化即时通讯工具如何选?

BeeWorks

即时通讯 IM 私有化部署

为什么上了ERP系统后,员工效率反而变得更低了呢?

优秀

ERP ERP系统

JUC并发—并发安全集合二

量贩潮汐·WholesaleTide

安全 JUC

where 1 = 1的作用?会影响性能吗?count(*) 和 count(1)哪个快?

电子尖叫食人鱼

数据库 sql

高德开放平台全球LBS服务,MCP Server正式登陆阿里云云市场

高德开放平台

2025 WAIC 世界人工智能大会有哪些亮点?

GPU算力

为什么选择 BeeWorks Meet?企业会议系统的私有化必要性

BeeWorks

即时通讯 IM 私有化部署

Vercel 发布 AI SDK 5,引入语音 API;Ollama 新版本支持多模态交互 丨日报

声网

100%开源!行业首个企业级智能体

京东零售技术

WAIC现场速递:AI热浪扑面而来|小奇说

奇点云

Registry of Open Data on AWS (RODA)_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章