2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

Pinterest 应对 AWS EC2 网络限流问题以提升服务可靠性

作者:Craig Risi

  • 2025-06-07
    北京
  • 本文字数:696 字

    阅读完需:约 2 分钟

大小:357.16K时长:02:01
Pinterest 应对 AWS EC2 网络限流问题以提升服务可靠性

Pinterest 近期发布技术博客,详解其工程团队处理亚马逊 EC2 实例网络带宽限制问题的方案。该平台月活用户超 5.5 亿,维持稳定性能对其 KVStore 机器学习特征库等核心服务尤为关键。

 

Pinterest 的工程团队发现 KVStore 在流量高峰期间频繁出现延迟激增和间歇性服务中断,导致首页推荐流(Homefeed)等功能出现应用超时和级联故障。根本原因在于部分 EC2 实例类型的网络性能存在固有局限。举例来说,标称“最高 12.5 Gbps”实例的实际基准带宽可能远低于此,且依赖非保障的突发带宽。当网络用量超过基准值时,便会造成数据包的延迟和丢失。

 

2024 年,Pinterest 启动向 AWS Nitro 架构实例(如 i3 到 i4i 机型)的迁移计划,却在从 Amazon S3 批量导入宽列数据库时暴露出严重性能衰减,读取延迟导致应用超时,最终迫使其 2 万余个实例的迁移计划暂缓。

 

在获得更精确的网络性能可视化能力后,Pinterest 实施了多项关键策略来缓解 EC2 网络限流问题。首要措施之一是选用具有更高基准网络带宽的 EC2 实例,逐步淘汰仅提供突发性能承诺的实例类型,以更好地支撑工作负载。同时引入流量整形技术,通过精确调控数据流确保网络使用率始终处于最优阈值范围内。

 

此外,Pinterest 将工作负载更均衡地分配到多个实例上,有效降低了单点资源过载风险。这些综合改进措施显著提升了系统可靠性和稳定性,不仅大幅减少了延迟峰值现象,更彻底消除了此前影响用户体验的服务中断问题。

 

Pinterest 这一实践案例突显了深入理解云基础设施细节的重要性,尤其是 EC2 实例网络带宽限制可能带来的连锁影响。通过主动监控和持续优化基础设施架构,他们成功克服了网络限流挑战,为数亿用户提供了更加流畅稳定的服务体验。

2025-06-07 10:001

评论

发布
暂无评论

Apache Dubbo 3.3 全新发布:Triple X 领衔,开启微服务通信新时代

Apache Dubbo

微服务 dubbo RPC 中间件 Java.

从专家系统到机器学习:人工智能核心概念的历史演进与发展脉络

测吧(北京)科技有限公司

测试

鸿蒙网络编程系列4-实现Smtp邮件发送客户端

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙网络编程系列10-使用HttpRequest下载文件到本地示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙网络编程系列7-TLS安全数据传输单向认证示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙网络编程系列8-TLS安全数据传输双向认证示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙网络编程系列9-使用HttpRequest模拟登录示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

MySQL性能优化浅析及线上案例

京东科技开发者

鸿蒙网络编程系列5-TCP连接超时分析

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙网络编程系列6-TCP数据粘包表现及原因分析

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

帝心个人介绍

帝心

HarmonyOS HarmonyOS NEXT

大数据实时链路备战——数据双流高保真压测

京东科技开发者

探索Playwright:前端自动化测试的新纪元

京东科技开发者

ITIL运维管理体系是什么?怎样选择合适的方案?

ServiceDesk_Plus

ITIL

Tritonserver 在得物的最佳实践

得物技术

GPU推理 KubeAI平台部署 KubeAI

如何配置 GreptimeDB 作为 Prometheus 的长期存储

Greptime 格睿科技

时序数据库 技术分享

Amazon Q Developer 实践:零基础创建贪吃蛇游戏

亚马逊云科技 (Amazon Web Services)

人工智能 生成式人工智能 Amaozn Q

鸿蒙网络编程系列3-TCP客户端通讯示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙网络编程系列11-使用HttpRequest上传文件到服务端示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

Pinterest 应对 AWS EC2 网络限流问题以提升服务可靠性_云计算_InfoQ精选文章