2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Registry of Open Data on AWS (RODA)

  • 2019-10-25
  • 本文字数:545 字

    阅读完需:约 2 分钟

Registry of Open Data on AWS (RODA)

将近十年前,我的同事 Deepak Singh 在为研究、分析和开发人员分页一文中介绍了 AWS 公用数据集的概念。我很高兴地告诉大家 Deepak 仍然是 AWS 团队的重要成员,公用数据集项目仍在不断发展壮大!


而今天我们宣布推出新的开放和公用数据利器,这就是 Registry of Open Data on AWS,简称 RODA。此注册表包含现有的公用数据集,任何人都可添加自己的数据集,从而在 AWS 上访问和分析。


注册表探秘


首页列举了注册表中的所有数据集:



输入搜索词以仅显示匹配的数据集,从而缩小列表:



每个数据集都有关联的详情页,包括使用情况举例、许可证信息以及在 AWS 上找到和访问数据集所需的信息:



在此例中,我可以使用简单的 CLI 命令访问数据:



此外我还可以通过编程访问数据,或将数据下载到我的 EC2 实例。


将数据添加到存储库


如果您拥有可供公开访问的数据集,并且希望将它添加到 RODA,您只需向我们发送一条 Pull 请求。转至 open-data-registry 存储库,读取 CONTRIBUTING 文档,然后使用 datasets 目录中的一个现有文件为模型,创建描述您的数据集的 YAML 文件:



我们会定期审核 Pull 请求;您可以“添加星标”或关注存储库以跟踪添加和更改。


欢迎让我震撼


我欢迎新数据集的蜂拥而入,也欢迎展示如何以强大而有意思的方式使用数据的博客和应用程序。立即尝试,将您的收获分享给我吧!


2019-10-25 08:00871

评论

发布
暂无评论
发现更多内容

软件测试/测试开发丨人工智能的与软件测试完美结合

测试人

人工智能 软件测试

打造自己的3D模型AI 自动纹理工具

3D建模设计

Stable Diffusion 3D纹理

3D 纹理渲染如何帮助设计师有效、清晰地表达设计理念

3D建模设计

3D渲染 Stable Diffusion 3D纹理

大数据云原生能力成熟度模型,重磅发布!

腾讯云大数据

云原生

DTSE Tech Talk | 3招解决时序数据高基数难题,性能多维度提升!

华为云开源

时序数据库 高基数 华为云开源

人工智能 | 企业智能化升级:大语言模型、知识图谱与微信机器人的完美结合

测吧(北京)科技有限公司

测试

电影:从微缩模型到AI纹理

3D建模设计

3D模型 模型纹理

软件测试 | ChatGPT:个性定制的人工智能助手

测吧(北京)科技有限公司

测试

软件测试/测试开发/人工智能丨Python类型转换

测试人

人工智能 软件测试

数据集成实施过程注意点总结

谷云科技RestCloud

ETL 数据集成

seller_info-获得淘宝店铺详情api接口有什么作用?

技术冰糖葫芦

API 文档

万字长文讲解调用第三方接口,RestTemplate,urlConnection使用详解,java代码模拟postman发送请求

javaNice

Java

Sam Altman 或回归 OpenAI;格力 1.3 万研发人员没有海归派 & 外国人丨 RTE 开发者日报 Vol.86

声网

一书了解国产操作系统openEuler

博文视点Broadview

如何消除excel保存密码?

尚思卓越

网络安全 运维管理 密码保存

人工智能助力测试领域:智能化测试框架与平台的崭新未来

测吧(北京)科技有限公司

测试

建筑可视化中的 3D 纹理

3D建模设计

渲染 3D纹理 建模模型

AdaBoost算法解密:从基础到应用的全面解析

不在线第一只蜗牛

机器学习 算法 集成学习

TDengine Contributor 钟宇讲述 TSZ 压缩算法优化背后的故事

TDengine

tdengine 时序数据库

Registry of Open Data on AWS (RODA)_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章