2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Pinterest 应对 AWS EC2 网络限流问题以提升服务可靠性

作者:Craig Risi

  • 2025-06-07
    北京
  • 本文字数:696 字

    阅读完需:约 2 分钟

大小:357.16K时长:02:01
Pinterest 应对 AWS EC2 网络限流问题以提升服务可靠性

Pinterest 近期发布技术博客,详解其工程团队处理亚马逊 EC2 实例网络带宽限制问题的方案。该平台月活用户超 5.5 亿,维持稳定性能对其 KVStore 机器学习特征库等核心服务尤为关键。

 

Pinterest 的工程团队发现 KVStore 在流量高峰期间频繁出现延迟激增和间歇性服务中断,导致首页推荐流(Homefeed)等功能出现应用超时和级联故障。根本原因在于部分 EC2 实例类型的网络性能存在固有局限。举例来说,标称“最高 12.5 Gbps”实例的实际基准带宽可能远低于此,且依赖非保障的突发带宽。当网络用量超过基准值时,便会造成数据包的延迟和丢失。

 

2024 年,Pinterest 启动向 AWS Nitro 架构实例(如 i3 到 i4i 机型)的迁移计划,却在从 Amazon S3 批量导入宽列数据库时暴露出严重性能衰减,读取延迟导致应用超时,最终迫使其 2 万余个实例的迁移计划暂缓。

 

在获得更精确的网络性能可视化能力后,Pinterest 实施了多项关键策略来缓解 EC2 网络限流问题。首要措施之一是选用具有更高基准网络带宽的 EC2 实例,逐步淘汰仅提供突发性能承诺的实例类型,以更好地支撑工作负载。同时引入流量整形技术,通过精确调控数据流确保网络使用率始终处于最优阈值范围内。

 

此外,Pinterest 将工作负载更均衡地分配到多个实例上,有效降低了单点资源过载风险。这些综合改进措施显著提升了系统可靠性和稳定性,不仅大幅减少了延迟峰值现象,更彻底消除了此前影响用户体验的服务中断问题。

 

Pinterest 这一实践案例突显了深入理解云基础设施细节的重要性,尤其是 EC2 实例网络带宽限制可能带来的连锁影响。通过主动监控和持续优化基础设施架构,他们成功克服了网络限流挑战,为数亿用户提供了更加流畅稳定的服务体验。

2025-06-07 10:005430

评论

发布
暂无评论

开源进校园,开放原子校源行 Meetup(中南大学站)圆满结束

OpenAnolis小助手

操作系统 龙蜥高校行

京东电商搜索:大模型生成式检索优化实践

京东零售技术

大模型

35 位委员参会,龙蜥社区 11 月技术委员会会议圆满结束

OpenAnolis小助手

操作系统 龙蜥社区 龙蜥技术委员会

淘宝电商API全解析:赋能商家,驱动电商新生态

代码忍者

API 接口 pinduoduo API

DevOps系列之从前线到后勤:制品管理的演变历史

嘉为蓝鲸

DevOps 制品库 制品管理

牛市来啦?交易量大涨!金融机构如何强化应急体系,筑牢运维安全防线?

嘉为蓝鲸

运维 可观测 应急响应 IT运维管理

【DevOps系列】制品库在行动:本地管理与多地同步的实战应用

嘉为蓝鲸

制品库 制品管理

SnippetsLab for Mac(mac代码管理器)v2.6激活版

Rose

Mint Blockchain:用 NFT 链接全球消费者的 Layer2 网络

NFT Research

NFT #Web3 L2

硬核、高能,龙蜥社区走进中科方德 MeetUp 圆满结束(附技术PPT下载)

OpenAnolis小助手

操作系统 龙蜥社区 龙蜥meetup

【DevOps系列】DevOps全过程质量管控

嘉为蓝鲸

DevOps 研发 质量管控

稳!Zilliz助力XTransfer基于RAG打造B2B外贸金融加速器

Zilliz

Milvus zilliz cloud 大模型应用 企业知识库

DocFlow票据AI自动化处理工具:出色的文档解析+抽取能力,提升企业文档数字化管理效能

合合技术团队

人工智能 数字化 文档解析 票据

OASA走进三未信安、奇安信和360,共建龙蜥安全生态

OpenAnolis小助手

操作系统 龙蜥安全联盟

倒计时1天!龙蜥社区可信计算SIG MeetUp即将在北京召开

OpenAnolis小助手

操作系统 可信计算 龙蜥meetup

《Django 5 By Example》阅读笔记:p493-p520

codists

Python django

嘉为蓝鲸受邀参加信通院2024数字化转型发展大会,携手客户斩获多项荣誉!

嘉为蓝鲸

数字化 中国信通院 研运一体化

渠道伙伴业务系统上线!嘉为蓝鲸WeOps渠道战略重要里程碑

嘉为蓝鲸

#WeOps

云起无垠创始人参与模糊测试研究被网络安全四大顶级会议—NDSS2024收录

云起无垠

「百度集团」资深副总裁、原IDG负责人李震宇加入“华为系”具身智能赛道初创公司!

机器人头条

自动驾驶 华为 人形机器人 具身智能

QT软件外包开发流程

北京木奇移动技术有限公司

软件外包公司 QT外包开发 QT开发公司

产品经理如何进行竞品分析

易成研发中心

产品经理 竞品分析

Cocktail for Mac(系统清理)注册激活码

Rose

文献解读-Processing UMI Datasets at High Accuracy and Efficiency with the Sentieon ctDNA Analysis Pipeline

INSVAST

基因测序 液体活检 生信分析 Sentieon 变异检测

webGL开发框架及特点

北京木奇移动技术有限公司

软件外包公司 数字孪生开发 webgl开发

【DevOps系列】赋能开发:理解仓库代理的力量

嘉为蓝鲸

制品库管理 制品库 制品仓库 Packages

边缘计算+人工智能:让设备更聪明的秘密

天津汇柏科技有限公司

边缘计算 AI 人工智能

法国 mixtral一种具有开放权重的高质量稀疏专家混合模型

测吧(北京)科技有限公司

测试

【DevOps系列】升级你的制品:探讨制品晋级的战略

嘉为蓝鲸

制品管理 制品仓库 制品仓库 Packages

如何设置AD域用户仅登录到指定的计算机?AD域管理软件

运维有小邓

AD域 IT自动化运维 AD域管理

Pinterest 应对 AWS EC2 网络限流问题以提升服务可靠性_云计算_InfoQ精选文章