大数据和AI不分家,AI助力低代码和智能运维落地,AI智能体的探索实践,本届AS会议一站聚齐!>>> 了解详情
写点什么

阿里云故障

收录了 阿里云故障 频道下的 50 篇内容

阿里云全球宕机:从阿里云故障看企业 IT 挑战

2023年11月12日晚,阿里云遭遇了一场全球性故障,导致其全产品线全部崩溃,包括阿里云盘、钉钉、淘宝、闲鱼等服务。这次故障的规模之巨大、影响之深远,在云计算历史上堪称史诗级事件。作为一名互联网分析师,我将从专业的角度对这次事故进行观察和评论。

阿里云 9 月 1 日安骑士升级故障真相

2015年9月1日,阿里云官方发布公告向用户致歉,称“因云盾安骑士server组件的恶意文件查杀功能升级触发了bug,导致部分服务器的少量可执行文件被误隔离……对于受影响的客户,我们将立即启动百倍时间赔偿”。9月3日,云盾负责人吴瀚清在自己的微信公众号发布了《危机时刻,我只心疼我们的客户》对事故进行总结。InfoQ针对此次事故采访了云盾负责人吴瀚清。

阿里云突发全球性严重故障,历经2.5小时恢复
阿里云突发全球性严重故障,历经 2.5 小时恢复

双十一第二天,阿里云突发全球性严重故障,波及全线产品

阿里云故障洞察提效 50%,全栈可观测建设有哪些技术要点?

本文分享了阿里云可观测平台服务作为全球分布的超大业务系统,同时也作为服务全球企业用户的可观测平台提供方,在故障洞察提效中遇到的业务挑战,以及 6 个关键技术点和 2 个应用案例。

阿里云
云原生
可观测
阿里云故障洞察提效 50%,全栈可观测建设有哪些技术要点?

全栈可观测是一种更全面、更综合和更深入的观测能力,能协助全面了解和监测系统的各个层面和组件,它不仅仅是一个技术上的概念,更多地是技术与业务的结合。在“以业务为导向”的大前提下,全栈可观测正在成为趋势。

2018年十大云宕机事故盘点:主流无一幸免!
2018 年十大云宕机事故盘点:主流无一幸免!

本文总结了2018年前十大云宕机事故,欢迎各位补充经历过的云服务至暗时刻。

阿里云再再遇故障,这次是短信服务......
阿里云再再遇故障,这次是短信服务......

刚刚,有开发者在群里反馈钱丽云短信服务开通异常

阿里云的故障是一次意外还是一次危机?

云计算是当今互联网时代的重要基础设施,它为各行各业提供了弹性、高效、低成本的计算资源和服务。然而,云计算的安全可靠性也是一个不容忽视的问题,一旦发生故障,可能会给用户和社会造成巨大的损失和影响。

什么样的故障让阿里云换了总裁?
什么样的故障让阿里云换了总裁?

2022年12月18日大概是阿里云最黑暗的日子,阿里云香港Region可用区C因为机房水冷装置出现故障导致大规模服务中断,对很多客户业务产生重大影响,包括澳门多家网站及App自当日午时起无法访问使用。

云计算
后端
阿里云香港节点全面故障给我们的启示
阿里云香港节点全面故障给我们的启示

2022年12月18日上午,阿里云发布《阿里云香港可用区C某机房设备异常》公告。“阿里云监控发现香港地域某机房设备异常,影响香港地域可用区C的云服务器ECS、云数据库PolarDB等云产品使用,阿里云工程师已在紧急处理中。”从中我们能有什么启示呢?

DevOps
研发效能
DevOps工具
阿里云全球性故障引发技术圈热议,企业 IT 应急应该怎么办?

11月12日晚,阿里云发生了一起全球性故障,导致其全产品线崩溃,包括阿里云盘、钉钉、淘宝、闲鱼等多个服务都受到影响。这次故障规模之大、影响范围之广令人震惊。

阿里云通过 ISO27001 竖立云计算信息安全行业标杆

近日,阿里云计算有限公司通过了由BSI(英国标准协会)审核的ISO27001:2005(信息安全管理体系)认证,成为BSI在国内审核通过ISO27001的第一家云计算安全服务提供商。

大象无形 阿里云开发者大会诠释云计算服务本质

阿里云总裁王坚在大会上表示:“云计算是一条不归之路,我们唯一的机会是有一天会遇到你们(开发者)!

阿里云OpenSearch-LLM智能问答故障的一天
阿里云 OpenSearch-LLM 智能问答故障的一天

上周五使用阿里云开放搜索问答版时,故障了一整天,可能这个服务使用的人比较少,没有什么消息爆出来,特此记录下这几天的阿里云处理过程,不免让人怀疑阿里云整体都外包出去了,反应迟钝,水平业余,却又很在意KPI。

AIGC
LLM
以阿里云全球故障为例,聊聊如何保障 Auth 服务的 SLA
以阿里云全球故障为例,聊聊如何保障 Auth 服务的 SLA

在刚刚过去的“双十一”购物狂欢季,阿里云经历了一次大规模故障,导致阿里系产品集体中断服务。

阿里云
身份认证
事件驱动
Idaas
Authing
阿里云出现大规模宕机,原因系IO HANG,或将做出赔偿
阿里云出现大规模宕机,原因系 IO HANG,或将做出赔偿

3月2日23:55分左右,阿里云疑似出现大规模故障情况,华北相当多互联网公司都炸了,一众APP和网站陷入瘫痪,一大波程序员、运营和运维人员都赶去公司加班。

阿里云的用户体验和生态圈

今天是阿里云开发者大会的第二天。杭州转塘的一个小镇,汇聚了大江南北的开发者和创业者,以及其它关注云的人们,热闹非凡,正所谓群贤毕至,少长咸集。笔者平日工作与云没有直接关系,因此技术上的评论就不班门弄斧了。不过素来外行可以看热闹,从两日的主题演讲以及参观各个展台,对阿里云的用户体验和生态圈有一些感悟。

阿里云故障专题_资料-InfoQ中文网