限时领|《AI 百问百答》专栏课+实体书(包邮)! 了解详情
写点什么

阿里云突发全球性严重故障,历经 2.5 小时恢复

  • 2023-11-12
    北京
  • 本文字数:1868 字

    阅读完需:约 6 分钟

大小:939.45K时长:05:20
阿里云突发全球性严重故障,历经2.5小时恢复

11 月 12 日下午,陆续有网友表示阿里旗下多款产品出现访问故障,随后【阿里云全线产品崩了】登上微博实时热搜。




据阿里云健康状态页(https://status.aliyun.com/#/)公告信息,本次故障为阿里云云产品控制台服务异常,开始于 2023-11-12 17:44。


阿里云全线产品均受影响,包括:


企业级分布式应用服务、消息队列 MQ、微服务引擎、链路追踪、应用高可用服务、应用实时监控服务、Prometheus 监控服务、消息服务、消息队列 Kafka 版、机器学习、图像搜索、智能推荐 AIRec、智能开放搜索 OpenSearch、云行情、数据总线 DataHub、检索分析服务 Elasticsearch 版、图计算服务 Graph Compute、实时计算 Flink 版、智能数据建设与治理 Dataphin、开源大数据平台 E-MapReduce、云原生大数据计算服务 MaxCompute、实时数仓 Hologres、大数据开发治理平台 DataWorks、智能媒体服务、媒体处理、视频点播、对象存储、文件存储 NAS、表格存储、日志服务、云存储网关、文件存储 HDFS 版、块存储、混合云备份服务、密钥管理服务、云防火墙、数据库审计、加密服务、运维安全中心(堡垒机)、容器镜像服务、容器服务 Kubernetes 版、API 网关、资源编排、云原生数据仓库 AnalyticDB PostgreSQL 版、图数据库、云原生内存数据库 Tair、云数据库 Redis 版、云原生关系型数据库 PolarDB、云数据库专属集群、云数据库 MySQL 版、云原生数据仓库 AnalyticDB MySQL 版、云原生分布式数据库 PolarDB-X、云数据库 ClickHouse、云原生多模数据库 Lindorm、云数据库 PostgreSQL 版、云数据库 SQL Server 版、云数据库 MongoDB 版、云数据库 HBase 版、数据传输、数据库自治服务、数据库备份、物联网平台、NAT 网关、负载均衡、云解析 PrivateZone、弹性公网 IP、共享带宽、转发路由器、私网连接、高速通道、IPv6 网关、专有网络 VPC、云企业网、VPN 网关、FPGA 云服务器、超级计算集群、批量计算、无影云桌面、弹性伸缩、弹性容器实例、弹性裸金属服务器、云服务器 ECS、轻量应用服务器、函数计算、Serverless 应用引擎、云托付、专有宿主机、GPU 云服务器、弹性高性能计算、操作审计、服务器迁移中心、运维编排、智能计算灵骏、云呼叫中心、交通云控平台、客服工作台、视觉智能开放平台、智能外呼机器人、智能语音交互、智能对话机器人、智能用户增长、运维事件中心、新零售智能助理、智能双录质检、地址标准化、机器翻译、自然语言处理、短信服务、云解析 DNS、域名、号码认证服务、邮件推送、版权与专利服务、语音服务、智能联络中心、工商财税、Salesforce on Alibaba Cloud、智能营销引擎、云采销、能耗宝、阿里邮箱、商标服务、移动研发平台、机器人流程自动化、号码隐私保护、DataV 数据可视化、音视频通信、视频直播、闪电立方、网盘与相册服务、安全、内容安全、安全管家、应用身份服务 (IDaaS)、实人认证、数字证书管理服务(原 SSL 证书)、风险识别、Web 应用防火墙、云安全中心(态势感知)、数据管理、云价签、云投屏、物联网智能视频服务、物联网无线连接服务、CDN、云数据传输、数据语音、智能接入网关、全站加速、ChatAPP 消息、全球加速、安全加速 SCDN、边缘节点服务 ENS、访问控制、资源管理、云监控、配置审计。


同时本次故障并非某一可用区的故障,而是全球大故障。受影响地域包括:


华北 2(北京)、华北 6(乌兰察布)、华北 1(青岛)、华东 2(上海)、华南 2(河源)、华北 3(张家口)、中国香港、印度(孟买)、美国(硅谷)、华南 1(深圳)、英国(伦敦)、韩国(首尔)、日本(东京)、阿联酋(迪拜)、西南 1(成都)、华南 3(广州)、新加坡、澳大利亚(悉尼)、马来西亚(吉隆坡)、华北 5(呼和浩特)、印度尼西亚(雅加达)、美国(弗吉尼亚)、菲律宾(马尼拉)、泰国(曼谷)、华东 1(杭州)、华南 1 金融云、华东 5(南京-本地地域)、华东 6(福州-本地地域)、华北 2 金融云(邀测)、华东 2 金融云、华东 1 金融云、华北 2 阿里政务云 1、非区域性、德国(法兰克福)、沙特(利雅得-合作伙伴运营)


截至发稿时,阿里云健康状态页显示所有地域、所有服务均已恢复正常运行。2023-11-12 21:11,阿里云在的最新公告中称,受影响云产品均已恢复,因故障影响部分云产品的数据(如监控、账单等)可能存在延迟推送情况,不影响业务运行。



阿里云关于此次故障事件的处理公告


关于此次故障的具体原因分析后续处理,阿里云暂未披露,InfoQ 将持续跟进报道。


相关文章推荐:


《B站宕机事故复盘:2021.07.13 我们是这样崩的》

《2022 年了,怎样才能做到真正的“永不宕机”?》

《这十个事件,让“永不宕机”变成了一个笑话》

《2018 年十大云宕机事故盘点:主流无一幸免!》


2023-11-12 21:5516785
用户头像
蔡芳芳 InfoQ 总编辑

发布了 814 篇内容, 共 593.2 次阅读, 收获喜欢 2810 次。

关注

评论 2 条评论

发布
用户头像
天天吹微服务,其实是天大的一个单体
2023-11-15 12:12 · 北京
回复
用户头像
连续几次出现问题,应该好好想想内部到底出了什么问题。
2023-11-14 09:23 · 广东
回复
没有更多了
发现更多内容

模块八-设计消息队列存储消息数据的 MySQL 表格

deng

架构实战营

微服务架构 | 怎样解决超大附件分片上传?

李尚智

微服务架构 springboot 断点续传 SpringCloud 大文件断点续传

在线JSON转Go Struct工具

入门小站

工具

如何设置Fiddler来拦截Java代码发送的HTTP请求,进行各种问题排查

汪子熙

HTTP fiddler 28天写作 网络抓包 12月日更

给弟弟的信第24封|盲目的努力没有用

大菠萝

28天写作

全链路压测系列(二):方案调研和项目立项

老张

性能测试 全链路压测

微服务划分的思考

无心水

微服务 微服务架构 SpringCloud 注册中心 微服务划分

Trino应用Iceberg Catalog写入数据原理分析

漫长的白日梦

数据湖 iceberg trino

DataPipeline正式加入中国信通院数据库应用创新实验室!

DataPipeline数见科技

数据库 中间件 数据融合 数据管理 信通院

学习方法

Tiger

28天写作

Reactor模式和Java NIO

Java·课代表

Java reactor 设计模式 网络编程 nio

🍃【Spring专题】「开发实战」Spring Security与JWT实现权限管控以及登录认证指南

码界西柚

spring spring security springsecurity 12月日更

华为技术专家深度解析Redis惰性删除原理

JavaEdge

12月日更

元宇宙100讲-0x009

hackstoic

元宇宙

区块链在电动车产业中的角色

CECBC

什么是 DID 身份,为什么需要 DID

Rayjun

区块链 did

语音信号的时域分析

轻口味

28天写作 12月日更

Gin-Vue-Admin 使用 gin+vue 进行极速开发的全栈开发基础平台【gva 第二节】

坚果

28天写作 Vue 3 Go 语言 12月日更

Linux 命令 man 全知全会

hedzr

Linux less man man-pages

一文搞懂ReentrantLock的公平锁和非公平锁

Ayue、

ReentrantLock 公平锁 非公平锁

Linux之whereis命令

入门小站

Linux

性能基础之理解Linux系统平均负载和CPU使用率

zuozewei

Linux 性能测试 计算机原理 12月日更

架构训练营 -- 模块四

LJK

#架构训练营

所谓默契,最不靠谱(25/28)

赵新龙

28天写作

MySQL的死锁系列- 锁的类型以及加锁原理

程序员历小冰

MySQL 死锁 28天写作 12月日更

全链路压测系列(一):认识全链路压测

老张

性能测试 全链路压测

全链路压测系列(三):技术改造和测试验证

老张

性能测试 全链路压测

PassJava 开源 (七) :Spring Cloud 整合 OpenFeign 实现声明式远程调用

悟空聊架构

28天写作 passjava 悟空聊架构 12月日更 openfeign

再见 Typora!这个开源的 Markdown 编辑器爱了!

JackTian

程序员 写作 Typora 编辑器 markdown编辑器

[架构实战营]模块4作业

Vincent

「架构实战营」

关于分布式系统共识的思考

yuexin_tech

分布式

阿里云突发全球性严重故障,历经2.5小时恢复_阿里巴巴_蔡芳芳_InfoQ精选文章