时隔16年Jeff Barr重返10.23-25 QCon上海站,带你看透AI如何重塑软件开发! 了解详情
写点什么

cpu故障

收录了 cpu故障 频道下的 50 篇内容

揭秘ChaosBlade CPU故障:实现CPU故障的黑科技
揭秘 ChaosBlade CPU 故障:实现 CPU 故障的黑科技

通过本文我们将了解如何利用 ChaosBlade 实现 CPU 负载故障的模拟(花式打爆CPU),同时会深入挖掘 ChaosBlade CPU 故障模拟的核心代码,了解其实现机制。

源码分析
cpu
混沌工程
ChaosBlade
故障模拟
Pod/Node CPU 故障注入
Pod/Node CPU 故障注入

在复杂的分布式系统中,为了验证服务质量、监控告警、流量调度、弹性伸缩等能力,我们需要模拟不同的故障场景。本文将介绍如何使用混沌工具对 Pod/Node 进行 CPU 负载故障注入,以达到指定的 CPU 负载百分比。

k8s
混沌工程
Chaos Engineering 的历史、原则以及实践

来自Gremlin的工程师介绍了混沌工程的历史、原则和实践。

开源容器引擎商业应用质量保障之道

当前很多云服务提供商在其服务中添加了开源容器引擎,但其测试方式往往只是通过devops进行简单的功能测试,甚至未经测试直接使用开源社区的二进制发行版本。这使得很多缺陷遗漏到下游用户手中。开源引擎在商用时如何保障质量呢?本文通过多个类型的测试来系统的阐述容器引擎质量保障方案。

由于软件部署不当,Cloudflare 发生 CPU 耗尽故障
由于软件部署不当,Cloudflare 发生 CPU 耗尽故障

7月2日,全球内容传递网络 CDN 加速服务商 Cloudflare 出现故障,受该故障影响,许多网站出现了宕机,最明显的就是在访问时提示502错误

以「场景」定义算力:AI时代,通用算力不只“通用”
以「场景」定义算力:AI 时代,通用算力不只“通用”

当 AI 狂欢席卷全球,无论是 GPU 还是 CPU,一场静默的场景化算力革命已然发生。阿里云和 AMD 通过“一芯三用”重新定义了 AI 时代的算力选型逻辑。从盲目追随算力参数的提升,到精准匹配业务场景需求,这不仅是单纯的技术路线转型,更是整个行业从“参数崇拜”回归“业务本质”的理性觉醒。

从计算到存储,阿里云打通AI落地的“任督二脉”
从计算到存储,阿里云打通 AI 落地的“任督二脉”

算力竞赛已是刀刀到肉,企业如何破局?

大规模主机监控告警平台的架构演变
大规模主机监控告警平台的架构演变

本文来自微信京东数科技术说公众号。

操作系统与AI融合之路再进一步!首个AI原生开源操作系统,openEuler 24.03 LTS正式发布
操作系统与 AI 融合之路再进一步!首个 AI 原生开源操作系统,openEuler 24.03 LTS 正式发布

本次发布会汇聚操作系统产业界顶尖力量,共探openEuler社区技术、生态、国际化发展。

CPU 高负载故障演练
CPU 高负载故障演练

服务器 CPU 负载的异常升高往往会导致服务响应时长增加、任务堆积甚至系统假死、服务中断等问题。因此,稳定和高性能的服务器对于业务的顺利运行至关重要。然而,在日常的服务运维过程中,CPU 高负载却是非常常见的一种故障场景。引起 CPU 高负载的原因也多种

混沌工程
cpu飙满
故障定位系列-容器CPU问题引起的故障如何快速排查
故障定位系列 - 容器 CPU 问题引起的故障如何快速排查

当生产环境中的容器CPU出现异常时,可能会引发上层业务出现一系列问题,比如业务请求缓慢、网页卡顿甚至崩溃等,如果没有一个有效的故障定位方法,运维人员很难从海量的告警信息中快速找到根本原因并解决问题。

故障定位
SRE
智能运维
故障排查/诊断
强化服务韧性:ChaosBlade磁盘故障模拟的原理与应用
强化服务韧性:ChaosBlade 磁盘故障模拟的原理与应用

磁盘故障是现实生活中很常见的一种故障,了解如何模拟磁盘故障更方便我们对系统进行演练,从而去验证磁盘故障下服务的稳定性和应急手段,

混沌工程
系统调用
磁盘故障
Chaos
故障模拟
云MySQL 主节点故障
云 MySQL 主节点故障

MySQL 主节点故障是指在 MySQL 主从复制架构中,主数据库服务器(主节点)出现问题,无法正常提供数据库服务的情况。主从复制架构通常用于提高数据库的可用性和性能。在这种架构中,主节点负责处理写操作(如插入、更新和删除),而从节点负责处理读操作(如

混沌工程
MySQL主节点故障
减少超十万 CPU 内核,省下数千台主机,Uber 弄了个自动化CPU垂直扩展年省数百万美元
减少超十万 CPU 内核,省下数千台主机,Uber 弄了个自动化 CPU 垂直扩展年省数百万美元

自 2021 年初启用 CPU 垂直扩展以来,优步通过该工具减少了超过 12 万个内核分配,节省了数百万美元的硬件开支。

混沌工程之ChaosBlade利刃出鞘
混沌工程之 ChaosBlade 利刃出鞘

通过混沌工程可以主动发现系统的中的潜在问题,从而对其进行优化,不断的提升系统的稳定性。ChaosBlade是一款遵循混沌工程理念的开源产品,其中主要包含ChaosBlade Tool(提供丰富的故障场景注入能力)以及ChaosBlade Box提供可视化的混沌工程实施平台。

混沌工程
故障注入
ChaosBlade
Chaos Mesh
字节跳动混沌工程实践总结
字节跳动混沌工程实践总结

本文讨论了字节跳动引入混沌工程以来的相关实践。

混沌工程及故障演练组件的应用与实践
混沌工程及故障演练组件的应用与实践

目前,随着金融业的快速发展以及日益新增的需求变化,传统的单体架构已经不能满足需要,分布式系统、微服务架构正在越来越多地应用到业界中。

So Hot ?快给 CPU 降降温!
So Hot ?快给 CPU 降降温!

本文介绍 CPU 的工作原理,如何合理控制负载。

11周命题作业
11 周命题作业

导致系统不可用的原因有哪些?保障系统稳定高可用的方案有哪些?请分别列举并简述。

高可用
极客大学架构师训练营
助力618-Y的混沌实践之路 | 京东云技术团队
助力 618-Y 的混沌实践之路 | 京东云技术团队

近三年,京东混沌工程作为大促三道防线之一,在促前扮演了非常重要的角色,而Y的混沌实践,也在不断地进行升级,主要从应用覆盖率和场景覆盖率两个方向明确提升方向,并在集团混沌大赛上取得了一系列突破和成绩。

测试
混沌工程
系统稳定性
企业号 8 月 PK 榜
cpu故障专题_资料-InfoQ中文网