【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

阿里云突发全球性严重故障,历经 2.5 小时恢复

  • 2023-11-12
    北京
  • 本文字数:1868 字

    阅读完需:约 6 分钟

大小:939.45K时长:05:20
阿里云突发全球性严重故障,历经2.5小时恢复

11 月 12 日下午,陆续有网友表示阿里旗下多款产品出现访问故障,随后【阿里云全线产品崩了】登上微博实时热搜。




据阿里云健康状态页(https://status.aliyun.com/#/)公告信息,本次故障为阿里云云产品控制台服务异常,开始于 2023-11-12 17:44。


阿里云全线产品均受影响,包括:


企业级分布式应用服务、消息队列 MQ、微服务引擎、链路追踪、应用高可用服务、应用实时监控服务、Prometheus 监控服务、消息服务、消息队列 Kafka 版、机器学习、图像搜索、智能推荐 AIRec、智能开放搜索 OpenSearch、云行情、数据总线 DataHub、检索分析服务 Elasticsearch 版、图计算服务 Graph Compute、实时计算 Flink 版、智能数据建设与治理 Dataphin、开源大数据平台 E-MapReduce、云原生大数据计算服务 MaxCompute、实时数仓 Hologres、大数据开发治理平台 DataWorks、智能媒体服务、媒体处理、视频点播、对象存储、文件存储 NAS、表格存储、日志服务、云存储网关、文件存储 HDFS 版、块存储、混合云备份服务、密钥管理服务、云防火墙、数据库审计、加密服务、运维安全中心(堡垒机)、容器镜像服务、容器服务 Kubernetes 版、API 网关、资源编排、云原生数据仓库 AnalyticDB PostgreSQL 版、图数据库、云原生内存数据库 Tair、云数据库 Redis 版、云原生关系型数据库 PolarDB、云数据库专属集群、云数据库 MySQL 版、云原生数据仓库 AnalyticDB MySQL 版、云原生分布式数据库 PolarDB-X、云数据库 ClickHouse、云原生多模数据库 Lindorm、云数据库 PostgreSQL 版、云数据库 SQL Server 版、云数据库 MongoDB 版、云数据库 HBase 版、数据传输、数据库自治服务、数据库备份、物联网平台、NAT 网关、负载均衡、云解析 PrivateZone、弹性公网 IP、共享带宽、转发路由器、私网连接、高速通道、IPv6 网关、专有网络 VPC、云企业网、VPN 网关、FPGA 云服务器、超级计算集群、批量计算、无影云桌面、弹性伸缩、弹性容器实例、弹性裸金属服务器、云服务器 ECS、轻量应用服务器、函数计算、Serverless 应用引擎、云托付、专有宿主机、GPU 云服务器、弹性高性能计算、操作审计、服务器迁移中心、运维编排、智能计算灵骏、云呼叫中心、交通云控平台、客服工作台、视觉智能开放平台、智能外呼机器人、智能语音交互、智能对话机器人、智能用户增长、运维事件中心、新零售智能助理、智能双录质检、地址标准化、机器翻译、自然语言处理、短信服务、云解析 DNS、域名、号码认证服务、邮件推送、版权与专利服务、语音服务、智能联络中心、工商财税、Salesforce on Alibaba Cloud、智能营销引擎、云采销、能耗宝、阿里邮箱、商标服务、移动研发平台、机器人流程自动化、号码隐私保护、DataV 数据可视化、音视频通信、视频直播、闪电立方、网盘与相册服务、安全、内容安全、安全管家、应用身份服务 (IDaaS)、实人认证、数字证书管理服务(原 SSL 证书)、风险识别、Web 应用防火墙、云安全中心(态势感知)、数据管理、云价签、云投屏、物联网智能视频服务、物联网无线连接服务、CDN、云数据传输、数据语音、智能接入网关、全站加速、ChatAPP 消息、全球加速、安全加速 SCDN、边缘节点服务 ENS、访问控制、资源管理、云监控、配置审计。


同时本次故障并非某一可用区的故障,而是全球大故障。受影响地域包括:


华北 2(北京)、华北 6(乌兰察布)、华北 1(青岛)、华东 2(上海)、华南 2(河源)、华北 3(张家口)、中国香港、印度(孟买)、美国(硅谷)、华南 1(深圳)、英国(伦敦)、韩国(首尔)、日本(东京)、阿联酋(迪拜)、西南 1(成都)、华南 3(广州)、新加坡、澳大利亚(悉尼)、马来西亚(吉隆坡)、华北 5(呼和浩特)、印度尼西亚(雅加达)、美国(弗吉尼亚)、菲律宾(马尼拉)、泰国(曼谷)、华东 1(杭州)、华南 1 金融云、华东 5(南京-本地地域)、华东 6(福州-本地地域)、华北 2 金融云(邀测)、华东 2 金融云、华东 1 金融云、华北 2 阿里政务云 1、非区域性、德国(法兰克福)、沙特(利雅得-合作伙伴运营)


截至发稿时,阿里云健康状态页显示所有地域、所有服务均已恢复正常运行。2023-11-12 21:11,阿里云在的最新公告中称,受影响云产品均已恢复,因故障影响部分云产品的数据(如监控、账单等)可能存在延迟推送情况,不影响业务运行。



阿里云关于此次故障事件的处理公告


关于此次故障的具体原因分析后续处理,阿里云暂未披露,InfoQ 将持续跟进报道。


相关文章推荐:


《B站宕机事故复盘:2021.07.13 我们是这样崩的》

《2022 年了,怎样才能做到真正的“永不宕机”?》

《这十个事件,让“永不宕机”变成了一个笑话》

《2018 年十大云宕机事故盘点:主流无一幸免!》


2023-11-12 21:5513720
用户头像
蔡芳芳 InfoQ主编

发布了 781 篇内容, 共 496.4 次阅读, 收获喜欢 2749 次。

关注

评论 2 条评论

发布
用户头像
天天吹微服务,其实是天大的一个单体
2023-11-15 12:12 · 北京
回复
用户头像
连续几次出现问题,应该好好想想内部到底出了什么问题。
2023-11-14 09:23 · 广东
回复
没有更多了
发现更多内容

如何学习设计模式

elfkingw

极客大学架构师训练营

macOS Big Sur、iOS14测试版描述文件

Winann

iOS14 macOS Big Sur 描述文件

week03 架构师培训营总结

李锦

看完这篇 HashMap,和面试官扯皮就没问题了

cxuan

Java 源码分析

week03 单例作业以及组合模式

李锦

极客大学架构师训练营

Linux性能优化实战-第一天学习

程序员老王

c++ 性能调优

BIGO全球计算平台的技术挑战

DT极客

架构师训练营 - 第三周 - 学习总结

韩挺

读懂一个 demo,入门机器学习

陈东泽 EuryChen

人工智能 tensorflow 学习 AI

设计模式代码实现

dony.zhang

拍一拍,微信史上最短一行代码,是如何被网友玩坏的!

程序员生活志

c++ 微信

第三周作业

王鑫龙

极客大学架构师训练营

架构师训练营 - 第三周 - 作业

韩挺

锦囊篇|一文摸懂Glide

ClericYi

漫画通信:有了它,终于可以放心买买买了

阿里云Edge Plus

云通信 短信 语音 通信云

手写一个单例

Acker飏

极客大学架构师训练营

冒泡排序

wjchenge

冒泡排序

架构师训练营第三周作业

好名字

作业

腾讯健康码16亿亮码背后的Elasticsearch系统调优实践

腾讯云大数据

大数据 elasticsearch

为什么建议你使用枚举?

王磊

Java 枚举

架构师训练营作业 --Week3

吴炳华

极客大学架构师训练营

设计模式与敏捷开发

架构师 架构是训练营

架构师训练营 - 第三课作业 -20200624- 单例及组合模式

👑👑merlan

架构设计 极客大学架构师训练营

是时候扔掉 Postman 了,Apifox 真香!

狐哥说技术

Postman 面向接口编程 Apifox 接口文档 接口测试

【架构师训练营】第三周总结

Mr.hou

极客大学架构师训练营

观察者模式详解

Seven七哥

设计模式 观察者模式

架构师训练营 - 作业 - 第三周

心在飞

极客大学架构师训练营

作业 - 第三周

Happy-Coming

架构师训练营第三周作业

大丁💸💵💴💶🚀🐟

Kotlin实现组合模式

Acker飏

极客大学架构师训练营

架构师训练营第 3 周作业

在野

极客大学架构师训练营

阿里云突发全球性严重故障,历经2.5小时恢复_阿里巴巴_蔡芳芳_InfoQ精选文章