2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Amazon 发布可持续性数据集,可用于多个领域的数据分析

  • 2019-02-12
  • 本文字数:1155 字

    阅读完需:约 4 分钟

Amazon发布可持续性数据集,可用于多个领域的数据分析

Amazon Web Services Open Data(AWSOD)和 Amazon Sustainability(AS)正在合作,为 AWS Simple Storage Service(S3)提供可持续性的数据集,并通过预处理数据集来实现最佳的数据检索,从而消除无差异的繁重工作。可持续性数据集通常来自卫星、地质研究、气象雷达、地图、农业研究、大气研究、政府和很多其他来源。


Amazon Web Services Open Data(AWSOD)和 Amazon Sustainability(AS)正在合作,为 AWS Simple Storage Service(S3)提供可持续性的数据集,并通过预处理数据集来实现最佳的数据检索,从而消除无差异的繁重工作。可持续性数据集通常来自卫星、地质研究、气象雷达、地图、农业研究、大气研究、政府和很多其他来源。


2018 年 12 月 10 日,AWSOD 和 AS 团队发布了第一组数据集。这些数据集向现有的 AWS Open Data 数据集种添加了一种新数据类别。这些可持续性数据集之前已经被公开,AWS 现在正在改进数据集的访问便利性,例如,将大型存档文件分成可以独立检索的较小的可寻址块。AWS 使用 Simple Storage Service(S3)存储数据,并将存储桶设置为公开可访问。Simple Notification Services(SNS)用于向消费者发起新数据通知,并且在少数情况下使用 CloudFront 通过应用程序编程接口提供数据,以便加快检索速度。


为了进一步促进新数据集的使用,AWS 正在与 Group on Earth Observations(GEO)合作,拨出 150 万美元的 AWS Cloud Credits,以获得有关地球的见解。


AWS 提供了如何使用可持续性开放数据集的文档以及用于搜索数据集的标签。“非洲土壤信息服务(AfSIS)土壤化学”数据集可以用来学习如何将机器学习应用于开放数据。使用开放数据集的社区第三方贡献者发布了一些博文,介绍了如何使用公共数据集:



此外,AWS 的一些客户成功地在云端使用可持续性数据:



负责农业数据分析的 Sebastian Fritsch 参与了 AWS 有关卫星数据集使用的问答,他被问道:“在你看来有什么亮点吗”?他回答说:“只需要修改几行代码就可以将数据产品从相对较小的试点区域扩展到全局,对我们来说,这是一个亮点”。


在可持续性数据集发布之前,AWS Global Open Data 主管 Jed Sundwall 谈到了如何不断改进 AWS 传输 PB 级开放数据的能力。AWS 正在向开放数据集中添加各种索引(包括外部索引、文件命名和内部索引),以增加访问便利性。AWS 的工作人员正在观察社区的情况,并意识到他们可以通过社区构建的数据集处理机制来衡量数据集的成功程度。最后,AWS 提供了一个明确定义的程序,用于支付成本,并让新的贡献者通过AWS提供公共数据集。


查看英文原文:https://www.infoq.com/news/2019/01/amazon-sustainability-datasets


2019-02-12 14:513682
用户头像

发布了 731 篇内容, 共 481.1 次阅读, 收获喜欢 2008 次。

关注

评论

发布
暂无评论
发现更多内容

OpenTiny CCF开源创新大赛赛事指南来啦,助力你赢取10W赛事奖金

华为云开发者联盟

开源 低代码 OpenTiny 企业号 8 月 PK 榜 2024企业号8月pk

铁人三项、乒乓战将、夺冠现场被求婚,关于巴黎奥运会,网友都在搜什么?

极客天地

面试官:说说读写锁的实现原理?

王磊

云高性能计算平台 CHPC 让企业的传统 HPC 玩出新花样

Baidu AICLOUD

HPC 高性能计算

观测云对接 OpenTelemetry 最佳实践

观测云

OpenTelemetry

AI驱动SEO排名优化使工作更省力

幂简集成

API SEO SEO工具

晨曦抵校,夜幕归家:边缘AI守护,全程体验无忧

E科讯

【YashanDB数据库】YAS-02032 column type is incompatible with referenced column type

YashanDB

yashandb 崖山数据库 崖山DB

事业-最佳实践-个人-心态调整

南山

Vue Vine:带给你全新的 Vue 书写体验!

OpenTiny社区

开源 Vue 前端 TinyVue

【YashanDB数据库】YAS-02079 archive log mode must be enabled when database is in replication mode

YashanDB

yashandb 崖山数据库

使用电子签名,法院会认可嘛?电子合同会有法律效力吗?使用开源技术受影响吗?

开放签开源电子签章

电子合同 电子签名 电子签章

事业-最佳实践-个人-高强度调节

南山

高强度调节 调整

Web3 游戏周报(8.04 - 8.10)

Footprint Analytics

链游

极狐GitLab 17.2 重点功能解读

极狐GitLab

DevOps CI/CD 极狐GitLab 版本发布

【活动预告】第四届西门子工业边缘生态大会,Apache IoTDB 来啦!

Apache IoTDB

【YashanDB数据库】YAS-02143 invalid username/password, login denied

YashanDB

yashandb 崖山数据库 崖山DB

事业-最佳实践-个人-人际关系维护

南山

人际关系 维护关系

EZ先享官海外溯源之旅让马粉再一次为马自达着迷

极客天地

天下拍-为您提供拍卖业务的一揽子解决方案

至存网络

竞价实例 拍卖 国有企业增资

Amazon发布可持续性数据集,可用于多个领域的数据分析_数据库_Aslan Brooke_InfoQ精选文章