Amazon Redshift Spectrum 将数据仓库扩展到 EB 级别且无需加载(二)

阅读数:5 2020 年 1 月 16 日 10:07

Amazon Redshift Spectrum 将数据仓库扩展到 EB 级别且无需加载(二)
## 专为提高性能和节约成本而设计
复制代码
利用 Amazon Redshift Spectrum,您只需为对您实际扫描的数据所运行的查询付费。我们建议您利用文件分区、列数据格式和数据压缩来最大程度降低在 Amazon S3 中扫描的数据量。这对于数据仓库非常重要,因为它可以显著提高查询性能和降低成本。通过按日期、时间或任何其他自定义键对 Amazon S3 中的数据进行分区,Redshift Spectrum 可以动态修剪不相关的分区以最大程度降低要处理的数据量。如果您以列格式(例如 Parquet)存储数据,Redshift Spectrum 将仅扫描查询所需的列,而不会处理整个行。同样,如果使用 Redshift Spectrum 支持的一种压缩算法来压缩数据,则可以减少扫描的数据量。
Amazon Redshift Redshift Spectrum 提供各自同类产品中更好的功能。如果需要对相同的数据频繁运行查询,您可以将其标准化并存储到 Amazon Redshift 中,然后利用功能完备的数据仓库的所有优势来以固定费率存储和查询结构化数据。同时,您可以将其他数据(无论是历史数据还是最新数据)继续以多种开放格式保留在 Amazon S3 中,并将 Amazon Redshift 查询扩展到 Amazon S3 数据湖中。
这就是 Amazon Redshift Spectrum 将数据仓库扩展到 EB 级别且无需加载的方法。Redshift 将终结“‘或’暴政”,使您可随时在所需位置、按所需格式存储数据,并在需要时使这些数据可供使用标准 SQL 进行快速处理。
---
### 其他阅读资源
!
---

作者介绍:

复制代码
**! Maor Kleider** 是快速、简单、经济高效的数据仓库 Amazon Redshift 的高级产品经理。Maor 热衷于与客户和合作伙伴之间的合作,了解他们独特的大数据用例并进一步改善其体验。在空闲时间,Maor 喜欢与家人一起旅行和探索新美食。

本文转载自 AWS 技术博客。

原文链接: https://amazonaws-china.com/cn/blogs/china/amazon-redshift-spectrum-extends-data-warehousing-out-to-exabytes-no-loading-required/

评论

发布