【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

支付宝 CTO 李静明:双 11 是对我们的一次大考

  • 2012-11-19
  • 本文字数:1655 字

    阅读完需:约 5 分钟

双 11 是一个疯狂的日子,不仅仅是消费者和电商行业的盛宴,也是技术领域的一次挑战。第一分钟 13.6 万笔交易,单日交易额达到 191 亿,为了支撑如此庞大的交易,支付宝背后的团队功不可没,在 11 月 11 号下午双 11 还未完全落幕之前,InfoQ 就来到在支付宝大楼采访了支付宝的 CTO 李静明,听他谈支付宝为这次双 11 所做的准备以及现场指挥等情况。

李静明首先从购物前、购物中、购物后三个角度分析了支付宝所起到的作用,用户在天猫或者淘宝所见到的红包都是由支付宝团队负责,并且所有的交易创建、支付、确认完成等交易动作都是由支付宝来支撑,支付宝是整个购物环节完成的最后一环。

从 2005 年开始,支付宝经历了烟囱型、面向服务型和云平台型三个时期。李静明说目前支付宝是第三代系统架构,能够保证 1 亿 + 的交易量、80 亿 + 的数据库事务、1000 亿 + 服务调用和 500+ 个应用协同完成。第三代系统主要在可伸缩性、故障容忍、弹性控制三个方面做出了大的改进。系统方面的改进是支付宝一直都在做的事情,他说:

双 11 是对支付宝的一次大考,准备工作很重要,我们把工作都已经做到了平时。

支付宝是这次双 11 活动的重要环节,其系统面临巨大的压力,在 8 月初旬支付宝就成立了“11.11”项目组,主要负责支付服务的容量指标和扩容计划,整个准备工作是一项复杂的系统工程,牵涉到不同的系统和业务平台,支付宝采用的策略是由各个平台根据自己的系统范围和经验来定义场景以及应对措施,根据搜集上来的反馈建立一整套完善的预案。针对这次双 11 活动,他们制定了两百多个预案,每一个预案都详细列出了问题场景、必要的操作、影响范围以及负责人等,通过这段时间的演练保证在预案被触发的第一时间做出反应。李静明说这次双 11 所有发生的状况都是在预案之内,容灾、降级系统都没有被触发。在故障容忍方面,支付宝通过如下的措施使得系统达到了 4 个 9(99.99%)的稳定性:

  1. 消除数据库单点
  2. 完善的数据库 failover 机制
  3. 控制服务依赖处理服务故障的影响
  4. 通过完全独立的 IDC 解决 IDC 故障

在双 11 之前,支付宝团队根据往年的数据预估了今年的系统容量,2011 年支付宝完成了 3369 万笔交易,他们对今年的预估是去年的 3 倍,事后证明这个预估是正确的(支付宝今年完成了 1 亿零 580 万笔交易)。针对系统将会面临的压力,他们倒推了整个系统流程,在可能出现的环节部署了一些技术措施(如限流等),保证系统稳定。针对于系统中可能出现的资源和计算能力分配不足等问题,支付宝能够通过弹性控制进行秒级的系统监控和资源调度,在网络、数据库和 IDC 等多个层面上满足伸缩性的要求。但是,他还说道,虽然整体趋势的预估不会有太大的出入,但对于刚开始那一瞬间的系统压力是很难估计的,这也造成了今年凌晨过后很多用户出现了排队的现象。李静明说今年整体的运行状况都是在计划内,但还是有一个小遗憾:用户的引导做的不够好,导致一部分用户看到了不一致的文案造成了误解。

双 11 时期支付宝的所有系统监控和调度都是通过“作战指挥室”来统一指挥,通过远程视频的方式和天猫、淘宝等团队进行实时通讯。李静明说他们发现双 11 中支付的瓶颈主要还集中在银行接口方面,为了保证用户的购物能够顺利完成,支付宝采取了一些措施:首先,积极和银行方面沟通,提前做出扩容;其次,引导用户提前在支付宝充值,减少对银行端口的压力;最后,在活动当中通过限流的方式保护银行接口。他提到了一个趣闻,在这次的活动中,有一个银行抱怨他们的量没有上来,要求支付宝不用限流,他们能够抗住所有的交易量。当支付宝停止保护以后,银行的接口立即就陷入瘫痪的状态。

这次的双 11 刷新了国内甚至国际的交易记录,在技术层面上我们也看到了支付宝的表现,当问及是否采用了一些独有的技术时,李静明表示支付宝大部分都是采用的标准技术协议和组件,在使用过程中对其进行了优化。

冰冻三尺非一日之寒,支付宝平时积累的技术力量为这次双 11 大考画上了圆满的句号。

相关阅读

2012-11-19 00:007282
用户头像

发布了 89 篇内容, 共 31.1 次阅读, 收获喜欢 4 次。

关注

评论

发布
暂无评论
发现更多内容

应运而生! 双11当天处理数据5PB—HiStore助力打造全球最大列存储数据库

阿里技术

Rust 元宇宙 3 —— 进入和离开

Miracle

rust 元宇宙

网络监控原理

喀拉峻

网络安全 安全 网络

面试官:说一下final关键字和final的4种用法?

王磊

激发数字新活力 打造发展新优势

CECBC

中国首批区块链订单融资缘何落地雄安?

CECBC

[干货] Weex在双11会场的大规模应用:业务支撑、稳定性保障和秒开实战

阿里技术

阿里巴巴Aliware十年微服务架构演进历程中的挑战与实践

阿里技术

Rust 元宇宙 6 —— 显示世界

Miracle

rust SDL 元宇宙

花了2个钟才搞懂这AOP为啥没生效,水友却睡着了……

4ye

Java spring 程序员 后端 签约计划第二季

【死磕Java并发】-----J.U.C之深入分析CAS

chenssy

11月日更 死磕 Java 死磕 Java 并发

面试官:int和Integer有什么区别?为什么要有包装类?

王磊

微博系统中”微博评论“的高性能高可用计算架构设计

Beyond Ryan

企业决策智能项目的五种失败姿势

脑极体

使用ES6编写一个超简单的搜索算法

DisonTangor

JavaScript 大前端

面试官:final、finally、finalize 有什么区别?

王磊

java面试

Rust 元宇宙 2 — 邻居

Miracle

rust 元宇宙

直播预告丨“Hello ArkUI:初识Slider组件(JS)”周三约起

HarmonyOS开发者

HarmonyOS

超强实时跟踪系统首次开源!支持跨镜头、多类别、小目标跟踪!

百度大脑

人工智能 人工智能摄像头

阿里巴巴服务网格技术三位一体战略背后的思考与实践

阿里巴巴云原生

阿里云 云原生 服务网格 三位一体

阿里研究员毕玄谈应用运维体系的变迁,DevOPS是大势所趋

阿里技术

百度ERNIE新突破!登顶中文医疗信息处理权威榜单CBLUE冠军

百度大脑

人工智能

使用redis生成唯一编号

喵叔

11月日更

29 K8S之ReplicaSet控制器

穿过生命散发芬芳

k8s 11月日更

不会用Camtasia的“库”,你可能错过了一个亿

淋雨

Camtasia

天猫技术全面打造『身临其境』的消费者交互体验

阿里技术

[Pulsar] 消息的消费

Zike Yang

Apache Pulsar 11月日更

Rust 元宇宙 4 —— 让世界动起来

Miracle

rust 元宇宙

Rust 元宇宙 5 —— SDL2.0

Miracle

rust SDL 元宇宙

Apache再次接受阿里开源产品捐赠 移动开发框架Weex进入孵化

阿里技术

你需要用战略耐心实现职业目标

石云升

读书笔记 11月日更

支付宝CTO李静明:双11是对我们的一次大考_语言 & 开发_水羽哲_InfoQ精选文章