Amazon Redshift 并发扩展，始终保持巅峰性能_语言 & 开发_亚马逊云科技 (Amazon Web Services）

【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升？>>> 了解详情 



 写点什么

Amazon Redshift 是一款可以扩展到 EB 级的数据仓库。如今，数以万计的 AWS 客户（包括 NTT DOCOMO、Finra 和强生）使用 Redshift 来运行任务关键性的商业智能 (BI) 控制面板、分析实时流式处理数据以及运行预测性的分析作业。

但在高峰时刻，并发查询数量猛增，这时出现了一个问题。当许多业务分析师全部打开他们的 BI 控制面板，或者长时间运行的数据学工作负载与其他工作负载竞争资源时，Redshift 将会排队执行查询，直到集群中有足够的计算资源可用。这确保了所有工作都能够完成，但也可能意味着高峰时刻的性能会受到影响。系统本身提供了两种应对方案：

超额预置集群以满足高峰需求。这种方案虽然解决了眼前的问题，但使用的资源和成本超过所需，形成了浪费。
针对典型的工作负载优化集群。采用这种方案，您在高峰时刻必须花更长的时间等待结果，可能会延误重要的商业决策。

新推出并发扩展功能

今天，我想向大家介绍第三种方案。现在，您可以配置 Redshift 以根据需要增加查询处理能力。其过程十分透明并且可在几秒钟内完成，即使工作负载增加到数百条并发查询时，也能为您提供快速、稳定的性能。增加的处理能力可以在几秒钟内准备就绪，无需预热或提前预置。您只需为实际使用的处理能力付费，账单精确至秒，并且您的主集群每运行 24 小时还将赠送一小时的并发扩展集群抵扣时间。额外的处理能力将在不再需要时取消，这种方式非常适合解决我在上文描述的突增性使用案例。

您可以将突增处理能力分配给特定的用户或队列，并且可以继续使用现有的 BI 和 ETL 应用程序。并发扩展集群用于处理多种形式的只读请求，并且在工作负载上还有更多的灵活性，请参阅并发扩展以了解更多信息。

并发扩展功能的使用

您可以在几分钟内为现有的集群启用此功能！我们建议首先使用全新的 Redshift 参数组来进行测试，因此我首先创建了一个参数组：

然后我编辑集群的工作负载管理配置，选中该新参数组，将 Concurrency Scaling Mode (并发扩展模式) 设置为自动，然后单击保存：

我将衍生自 TPC-DS 的云数据仓库基准作为测试数据和测试队列的源。我下载了 DDL 并使用我的 AWS 凭证进行自定义，然后使用 psql 来连接到我的集群并创建测试数据：

sample=# create database sample;CREATE DATABASEsample=# \connect sample;psql (9.2.24, server 8.0.2)WARNING: psql version 9.2, server version 8.0.         Some psql features might not work.SSL connection (cipher: ECDHE-RSA-AES256-GCM-SHA384, bits: 256)You are now connected to database "sample" as user "awsuser".sample=# \i ddl.sql

复制代码

DDL 会创建表和负载，然后使用存储在 S3 存储桶中的数据进行填充：

sample=# \dt                 List of relations schema |          name          | type  |  owner--------+------------------------+-------+--------- public | call_center            | table | awsuser public | catalog_page           | table | awsuser public | catalog_returns        | table | awsuser public | catalog_sales          | table | awsuser public | customer               | table | awsuser public | customer_address       | table | awsuser public | customer_demographics  | table | awsuser public | date_dim               | table | awsuser public | dbgen_version          | table | awsuser public | household_demographics | table | awsuser public | income_band            | table | awsuser public | inventory              | table | awsuser public | item                   | table | awsuser public | promotion              | table | awsuser public | reason                 | table | awsuser public | ship_mode              | table | awsuser public | store                  | table | awsuser public | store_returns          | table | awsuser public | store_sales            | table | awsuser public | time_dim               | table | awsuser public | warehouse              | table | awsuser public | web_page               | table | awsuser public | web_returns            | table | awsuser public | web_sales              | table | awsuser public | web_site               | table | awsuser(25 rows)

复制代码

然后我下载了查询并打开了一组 PuTTY 窗口，以便可以为我的 Redshift 集群生成有意义的负载：

我运行了初始的并行查询集，然后逐步增加，我可以在集群的 Cluster Performance (集群性能) 选项卡中看到它们：

我可以在 Database Performance (数据库性能) 选项卡中看到有额外的处理能力在需要时上线，然后在不再需要时下线：

正如您可以看到，我的集群根据需要进行扩展，以尽快处理所有查询。“Concurrency Scaling Usage (并发扩展使用量)”显示了我使用额外处理能力的分钟数（正如我之前所提到，每个集群每 24 小时会累积一小时的并发扩展抵扣时间）。

我可以使用参数 max_concurrency_scaling_clusters 来控制可以使用的并发扩展集群数量（默认限制为 10，但您在需要时可以请求增加限制）。

现已推出

您现在可以立即在美国东部（弗吉尼亚北部）、美国东部（俄亥俄）、美国西部（俄勒冈）、欧洲（爱尔兰）以及亚太地区（东京）等区域使用并发扩展集群，今年还将在更多区域陆续推出。

作者介绍：

Jeff Barr

AWS 首席布道师； 2004 年开始发布博客，此后便笔耕不辍。

本文转载自 AWS 技术博客。

原文链接：

https://amazonaws-china.com/cn/blogs/china/new-concurrency-scaling-for-amazon-redshift-peak-performance-at-all-times/

发布

暂无评论

创作场景

Amazon Redshift 并发扩展，始终保持巅峰性能

新推出并发扩展功能

并发扩展功能的使用

现已推出

评论

react源码中的协调与调度

【LeetCode】水果成篮Java题解

go-zero docker-compose 搭建课件服务（一）：编写服务api和proto

go-zero docker-compose 搭建课件服务（七）：prometheus+grafana服务监控

go-zero docker-compose 搭建课件服务（三）：编写courseware api服务

HashMap源码分析(一)

Linux下RTC驱动开发(硬件采用DS1302)

Java中的接口详解

一种基于柔性事务的分布式事务解决方案设计探究

部署 SAP UI5 应用到 SAP BTP 时遇到的 error retrieving MTA 错误消息

实现etcd服务注册与发现

react源码中的fiber架构

React面试八股文（第二期）

React组件之间的通信方式总结（上）

掌握这个方法，让工作经验配得上工作时间！

CEF | CEF浏览器客户端功能扩展：实现下载列表功能

谈谈spark性能调优的方法

OKR之剑·理念篇03：OKR理念认同

CEF | CEF浏览器客户端功能扩展：实现前进、后退、刷新、调用控制台、设置cookie、网页自适应窗体大小

Linux下驱动开发_块设备驱动开发(内存模拟存储)

数据驱动型企业如何借助「新一代智能协作」提升研发效能？

go-zero docker-compose 搭建课件服务（二）：编写courseware rpc服务

无法吃午餐的学生数量

Redis是如何保证数据一致性的

Lerna最佳实践（内含大量代码）

react源码分析：组件的创建和更新

Linux下IIC驱动编写，介绍IIC子系统框架的使用

你知道Redis为什么要设计成单线程吗

C++中变化布局实现思路

react源码分析：babel如何解析jsx

Linux下驱动开发_块设备驱动开发(硬件上采用SD卡+SPI协议)

创作场景

Amazon Redshift 并发扩展，始终保持巅峰性能

新推出并发扩展功能

并发扩展功能的使用

现已推出

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载