收录了 阿里云故障 频道下的 50 篇内容
2015年9月1日,阿里云官方发布公告向用户致歉,称“因云盾安骑士server组件的恶意文件查杀功能升级触发了bug,导致部分服务器的少量可执行文件被误隔离……对于受影响的客户,我们将立即启动百倍时间赔偿”。9月3日,云盾负责人吴瀚清在自己的微信公众号发布了《危机时刻,我只心疼我们的客户》对事故进行总结。InfoQ针对此次事故采访了云盾负责人吴瀚清。
本文总结了2018年前十大云宕机事故,欢迎各位补充经历过的云服务至暗时刻。
本文分享了阿里云可观测平台服务作为全球分布的超大业务系统,同时也作为服务全球企业用户的可观测平台提供方,在故障洞察提效中遇到的业务挑战,以及 6 个关键技术点和 2 个应用案例。
全栈可观测是一种更全面、更综合和更深入的观测能力,能协助全面了解和监测系统的各个层面和组件,它不仅仅是一个技术上的概念,更多地是技术与业务的结合。在“以业务为导向”的大前提下,全栈可观测正在成为趋势。
刚刚,有开发者在群里反馈钱丽云短信服务开通异常
2022年12月18日大概是阿里云最黑暗的日子,阿里云香港Region可用区C因为机房水冷装置出现故障导致大规模服务中断,对很多客户业务产生重大影响,包括澳门多家网站及App自当日午时起无法访问使用。
近日,阿里云计算有限公司通过了由BSI(英国标准协会)审核的ISO27001:2005(信息安全管理体系)认证,成为BSI在国内审核通过ISO27001的第一家云计算安全服务提供商。
2022年12月18日上午,阿里云发布《阿里云香港可用区C某机房设备异常》公告。“阿里云监控发现香港地域某机房设备异常,影响香港地域可用区C的云服务器ECS、云数据库PolarDB等云产品使用,阿里云工程师已在紧急处理中。”从中我们能有什么启示呢?
阿里云总裁王坚在大会上表示:“云计算是一条不归之路,我们唯一的机会是有一天会遇到你们(开发者)!
3月2日23:55分左右,阿里云疑似出现大规模故障情况,华北相当多互联网公司都炸了,一众APP和网站陷入瘫痪,一大波程序员、运营和运维人员都赶去公司加班。
今天是阿里云开发者大会的第二天。杭州转塘的一个小镇,汇聚了大江南北的开发者和创业者,以及其它关注云的人们,热闹非凡,正所谓群贤毕至,少长咸集。笔者平日工作与云没有直接关系,因此技术上的评论就不班门弄斧了。不过素来外行可以看热闹,从两日的主题演讲以及参观各个展台,对阿里云的用户体验和生态圈有一些感悟。
随着数字经济的快速发展和扩张,越来越多的企业开始采用云原生计算的思想和技术,以主导企业的数字化转型架构。
“我们越来越接近于下一个时代。”
近日,阿里巴巴集团CEO张勇的一篇讲话在阿里内网获得较高关注而被媒体曝光,这篇讲话谈到了他对阿里此次组织架构升级的思考,透露了阿里云平台升级后的一些规划。前不久,腾讯CEO马化腾在“云+未来”峰会上同样讲解了腾讯云的后续规划。在云事业部架构调整之后,阿里云和腾讯云作何打算?如何进一步增加云业务部分的营收呢?
阿里云主会场发布的一系列新品引发了业内的广泛关注,云计算的圈子也好久没有这么热闹过了。
CIPU帮CPU减负了。
本次分享对阿里巴巴集团故障治理整体流程及实战中的自动化、智能化体系做以介绍,并对未来故障治理领域智能运维工作进行展望。