9 月 13 日,2025 Inclusion・外滩大会「开源嘉年华」正在限量报名中! 了解详情
写点什么

Pinterest 应对 AWS EC2 网络限流问题以提升服务可靠性

作者:Craig Risi

  • 2025-06-07
    北京
  • 本文字数:696 字

    阅读完需:约 2 分钟

大小:357.16K时长:02:01
Pinterest 应对 AWS EC2 网络限流问题以提升服务可靠性

Pinterest 近期发布技术博客,详解其工程团队处理亚马逊 EC2 实例网络带宽限制问题的方案。该平台月活用户超 5.5 亿,维持稳定性能对其 KVStore 机器学习特征库等核心服务尤为关键。

 

Pinterest 的工程团队发现 KVStore 在流量高峰期间频繁出现延迟激增和间歇性服务中断,导致首页推荐流(Homefeed)等功能出现应用超时和级联故障。根本原因在于部分 EC2 实例类型的网络性能存在固有局限。举例来说,标称“最高 12.5 Gbps”实例的实际基准带宽可能远低于此,且依赖非保障的突发带宽。当网络用量超过基准值时,便会造成数据包的延迟和丢失。

 

2024 年,Pinterest 启动向 AWS Nitro 架构实例(如 i3 到 i4i 机型)的迁移计划,却在从 Amazon S3 批量导入宽列数据库时暴露出严重性能衰减,读取延迟导致应用超时,最终迫使其 2 万余个实例的迁移计划暂缓。

 

在获得更精确的网络性能可视化能力后,Pinterest 实施了多项关键策略来缓解 EC2 网络限流问题。首要措施之一是选用具有更高基准网络带宽的 EC2 实例,逐步淘汰仅提供突发性能承诺的实例类型,以更好地支撑工作负载。同时引入流量整形技术,通过精确调控数据流确保网络使用率始终处于最优阈值范围内。

 

此外,Pinterest 将工作负载更均衡地分配到多个实例上,有效降低了单点资源过载风险。这些综合改进措施显著提升了系统可靠性和稳定性,不仅大幅减少了延迟峰值现象,更彻底消除了此前影响用户体验的服务中断问题。

 

Pinterest 这一实践案例突显了深入理解云基础设施细节的重要性,尤其是 EC2 实例网络带宽限制可能带来的连锁影响。通过主动监控和持续优化基础设施架构,他们成功克服了网络限流挑战,为数亿用户提供了更加流畅稳定的服务体验。

2025-06-07 10:005276

评论

发布
暂无评论

2023金融科技四大机遇与挑战

易观分析

金融科技 金融 经济

2022 IoTDB Summit:华为王超《Apache IoTDB 在华为云的实践》

Apache IoTDB

大数据 开源 时序数据库 IoTDB

ChatGPT 是真的银弹吗? | 社区征文

宇宙之一粟

Go 思考 后端 征文投稿 ChatGPT

王者荣耀商城异地多活架构设计

Geek_e5f2e5

低代码生成器 | 放开双手,专注业务,一键生成项目基础结构 + 重复代码

IT学习日记

开源项目 脚手架 代码自动生成 自动搭建项目

三天吃透mybatis面试八股文

程序员大彬

Java mybatis

WindowsGUI自动化测试框架搭建之需求整理、详细设计和框架设计

Python 自动化测试 测试框架 WindowsGUI UIaotumation

RISC-V SIG 创建专属邮件列表和论坛板块

openEuler

Linux 操作系统 openEuler risc-v

瓴羊Quick BI和Tableau哪个更适合复杂表格呢?

夏日星河

BI工具数据看板对比:瓴羊Quick BI与Smart BI

流量猫猫头

设计消息队列存储消息数据的 MySQL 表格

Geek_e5f2e5

我,30岁程序员被裁员了,千万别干全栈

程序员晚枫

程序员 裁员 大龄求职

Matlab实现图像压缩

timerring

图像处理 图像压缩

OpenHarmony技术峰会举办“编程语言及应用框架分论坛” ,探讨应用开发新技术

极客天地

中国特供版也残了!AMD 3GHz最强核显梦碎

科技之家

使用 Pulumi 打造自己的多云管理平台

亚马逊云科技 (Amazon Web Services)

Amazon S3

BaseAdapter优化

芯动大师

ConversionService baseadapter viewholder

拆分电商系统为微服务

Geek_e5f2e5

浅谈基于Web的跨平台桌面应用开发

京东科技开发者

Web 跨平台 nodejs 桌面端 企业号 3 月 PK 榜

2022 IoTDB Summit:东方国信王超《Apache IoTDB 在东方国信的商业化及应用》

Apache IoTDB

大数据 开源 时序数据库 IoTDB

Caffeine高性能本地缓存框架初探

FunTester

架构训练营-模块六作业

Sam

架构实战营

SkyWalking实现 Dubbo 微服务实现链路跟踪案例以及对接钉钉告警

忙着长大#

极客时间

淘宝 APP 网络架构演进与弱网破障实践

阿里技术

架构 网络

2022年证券行业年度专题分析

易观分析

金融 证券 经济

旺链科技荣获科创中国数字经济技术创新峰会多个奖项

旺链科技

区块链+ 区块链、

瓴羊Quick BI和Power BI哪个比较好呢?

巷子

「Go框架」平滑关闭:要关闭服务,未处理完的请求怎么办?

Go学堂

golang 个人提升 平滑重启 程序员、 gin框架

「Go工具箱」Pie :一个高性能、类型安全的slice操作库

Go学堂

golang 开源 程序员 个人成长

DevOps 与平台工程:企业该如何选择?

SEAL安全

DevOps IdP 平台工程 企业号 3 月 PK 榜

Pinterest 应对 AWS EC2 网络限流问题以提升服务可靠性_云计算_InfoQ精选文章