收录了 cpu故障 频道下的 50 篇内容
通过本文我们将了解如何利用 ChaosBlade 实现 CPU 负载故障的模拟(花式打爆CPU),同时会深入挖掘 ChaosBlade CPU 故障模拟的核心代码,了解其实现机制。
在复杂的分布式系统中,为了验证服务质量、监控告警、流量调度、弹性伸缩等能力,我们需要模拟不同的故障场景。本文将介绍如何使用混沌工具对 Pod/Node 进行 CPU 负载故障注入,以达到指定的 CPU 负载百分比。
来自Gremlin的工程师介绍了混沌工程的历史、原则和实践。
当前很多云服务提供商在其服务中添加了开源容器引擎,但其测试方式往往只是通过devops进行简单的功能测试,甚至未经测试直接使用开源社区的二进制发行版本。这使得很多缺陷遗漏到下游用户手中。开源引擎在商用时如何保障质量呢?本文通过多个类型的测试来系统的阐述容器引擎质量保障方案。
7月2日,全球内容传递网络 CDN 加速服务商 Cloudflare 出现故障,受该故障影响,许多网站出现了宕机,最明显的就是在访问时提示502错误
本文来自微信京东数科技术说公众号。
本次发布会汇聚操作系统产业界顶尖力量,共探openEuler社区技术、生态、国际化发展。
服务器 CPU 负载的异常升高往往会导致服务响应时长增加、任务堆积甚至系统假死、服务中断等问题。因此,稳定和高性能的服务器对于业务的顺利运行至关重要。然而,在日常的服务运维过程中,CPU 高负载却是非常常见的一种故障场景。引起 CPU 高负载的原因也多种
磁盘故障是现实生活中很常见的一种故障,了解如何模拟磁盘故障更方便我们对系统进行演练,从而去验证磁盘故障下服务的稳定性和应急手段,
MySQL 主节点故障是指在 MySQL 主从复制架构中,主数据库服务器(主节点)出现问题,无法正常提供数据库服务的情况。主从复制架构通常用于提高数据库的可用性和性能。在这种架构中,主节点负责处理写操作(如插入、更新和删除),而从节点负责处理读操作(如
自 2021 年初启用 CPU 垂直扩展以来,优步通过该工具减少了超过 12 万个内核分配,节省了数百万美元的硬件开支。
通过混沌工程可以主动发现系统的中的潜在问题,从而对其进行优化,不断的提升系统的稳定性。ChaosBlade是一款遵循混沌工程理念的开源产品,其中主要包含ChaosBlade Tool(提供丰富的故障场景注入能力)以及ChaosBlade Box提供可视化的混沌工程实施平台。
本文讨论了字节跳动引入混沌工程以来的相关实践。
目前,随着金融业的快速发展以及日益新增的需求变化,传统的单体架构已经不能满足需要,分布式系统、微服务架构正在越来越多地应用到业界中。
本文介绍 CPU 的工作原理,如何合理控制负载。
近三年,京东混沌工程作为大促三道防线之一,在促前扮演了非常重要的角色,而Y的混沌实践,也在不断地进行升级,主要从应用覆盖率和场景覆盖率两个方向明确提升方向,并在集团混沌大赛上取得了一系列突破和成绩。
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群
SUSE Labs团队探索了 Kernel CPU 隔离及其核心组件之一:Full Dynticks(或 Nohz Full),并撰写了本系列文章。
讲述Yelp工程师如何协调其流量故障转移流程,并在可靠性、性能和成本效率之间实现微妙平衡的故事。