写点什么
创作场景
- 记录自己日常工作的实践、心得
- 发表对生活和职场的感悟
- 针对感兴趣的事件发表随笔或者杂谈
- 从 0 到 1 详细介绍你掌握的一门语言、一个技术,或者一个兴趣、爱好
- 或者,就直接把你的个人博客、公众号直接搬到这里
登录/注册
收录了 aws故障 频道下的 50 篇内容

谷歌云专家服务团队发布了一份关于云端分布式系统混沌工程的详细指南。该指南强调,人为制造故障对构建弹性架构至关重要。它为用户在谷歌云环境中实施可控的故障测试提供了开源方案和实用指南。

本文总结了2018年前十大云宕机事故,欢迎各位补充经历过的云服务至暗时刻。
由一次人为失误引发的连锁反应导致了很多S3服务器宕机,其中包括两个影响S3运行的关键子系统。由此导致了S3的故障,影响到了不仅S3本身还有其他一些依赖S3的服务。四个小时后S3才重新恢复正常。

北京时间今日凌晨,AWS多个可用区发生故障,官方发表声明称因多处光缆被挖断。截至今天下午13:48,AWS表示所有故障已经完全恢复。
2月18日,AWS发布了新的云运维产品:AWS OpsWorks。其功能包括:建模和对任何应用的支持、自动化任务、控制访问等等。然而,RightScale CTO Thorsten von Eicken认为该产品无法满足客户“异质性”的要求,是个“时代的错误”。

区块链周报栏目从产业动态、数字货币、权威观点、监管和技术等方面,为您总结了本周区块链领域发生的头条事件,让您更快速了解行业最新动态。

AWS Direct Connect 通过标准的以太网光纤将您的内部网络连接到 AWS Direct Connect 位置。

这个工具使用AWS Systems Manager构建,可以在EC2实例上执行任意命令,团队可以用它缓解与延迟相关的问题。

工业物联网 (IIoT) 为每个行业提供了一个无与伦比的机会来应对核心业务挑战,例如减少停机时间、提高安全性、增加系统输出、降低运营成本,以及创建创新服务和业务模型。
Auth0是一家认证、授权和SSO服务提供商。近期,Auth0完成将自身架构从三家云提供商(即AWS、Azure和Google Cloud)转向AWS一家,这是因为它的服务越来越依赖于AWS服务。现在,Auth0的系统分布在4个AWS域中,其中服务是跨区复制的。

通常SAP系统是企业的关键应用系统,所以在部署SAP生产系统时必须要实现高可用。

根据AWS的推荐设计原则,搭建一个云端应用系统时,需要记住的一个原则是“design for failure”

前段时间,看到一则新闻,一男子智能养鱼遇断网,4万余斤鱼或因缺氧死亡。
近日,Amazon Web Services(AWS)增加了跨多个账户和/或区域聚合由AWS Config Rules生成的合规数据的功能,实现了AWS资源的集中审计和治理。新增的聚合仪表板视图展示了组织中不合规的规则。然后,用户可以下钻,查看有关违反规则的资源的详细信息。

SAP作为企业核心应用系统,业务对于系统的RTO/RPO以及高可用支持的场景通常会有较高的要求。

AWS发布的Outposts相当于云一体机,除了进入混合云领域,亚马逊也要做硬件提供商了。

混合云融合了公有云和私有云,是企业上云的中间之旅,也是云计算发展过程中的一种模式和阶段。
2017年2月28日,云计算鼻祖AWS发生宕机事故。AWS美国东一服务区基础设施的出入流量瞬间消失。那么,AWS是如何解决这次事故?接下来会有哪些优化举措?技术人应该从中学习到什么经验?

AWS提供各种服务和基础架构,以方便客户在云中构建可靠,容错且高度可用的系统。