写点什么

华为云门户的六维系统监控(一)

  • 2020-01-10
  • 本文字数:631 字

    阅读完需:约 2 分钟

华为云门户的六维系统监控(一)

一个产品从雏形到成熟,业务异常会时不时的出现在这个过程中。业务异常可能不可避免,即使成熟的产品也可能由于互联网的攻击而异常,如果能及时发现异常并快速处理,对业务/用户造成的影响就能降到最低。如果某次异常发生后一两个小时或者更长时间业务侧都没有发现,那这种情况就很可怕了。


  华为云门户,包括官网、云市场、云社区(论坛)、用户中心等关键业务,是华为云的门脸。面向互联网,随时可能被攻击,业务异常对用户感知、体验、华为云品牌都会构成严重的威胁。业务的监控和告警显得尤为重要,下面来看看我们门户在这方面做了哪些动作来确保异常能快速的被监控到并产生告警,覆盖了系统可用性和用户体验性两大方面。
复制代码



一、OpsMonitor


  • 介绍:OpsMonitor 是基于 Zabbix 开发的分布式运维监控系统,公有云统一监控平台。可将通用类主机资源使用情况上报到 IES 统一展示。检测到异常时立即告警。

  • 监控点:主机资源如 CPU、内存、磁盘空间、系统启动时长、用户密码过期检测、进程数量监控、* 网卡状态、网络流量、nginx 进程等。

  • 解决问题:服务器资源状态、进程等异常时业务侧无感知。

  • 检测频率:当前配置 5 分钟。

  • 告警阈值:可根据具体监控项进行配置,如 CPU 空闲率 30%。

  • 告警方式:邮件、短信。

  • 实战:2018 年 2 月 28 日 18:17 收到重要告警邮件,紧急连上服务器确认,告警属实,通过确认为后台管理服务器业务正常同步场景,同步完成后告警解除。



监控图:



本文转载自 Think 体验设计公众号。


原文链接:https://mp.weixin.qq.com/s/oZ-VCAXsboTx5cph4oAMVw


2020-01-10 11:51936

评论

发布
暂无评论
发现更多内容

DDD领域驱动设计的概念解析

乌龟哥哥

微服务 10月月更

当我遇到10亿参数组合

FunTester

鸿蒙开发工具 DevEco Studio 3.0 体验与项目介绍

宇宙之一粟

HarmonyOS 鸿蒙应用开发 10月月更

2022-10-24:以下go语言代码输出什么?A:3 3;B:3 4;C:0 0;D:0 1。 package main func main() { m := make(map[int]int

福大大架构师每日一题

golang 福大大 选择题

Spring Boot「13」使用 Actuator

Samson

Java spring 学习笔记 spring-boot 10月月更

有没有完全自主的国产化数据库技术

王磊

【web 开发基础】PHP 快速入门(9)-PHP 运算符之位运算符详解

迷彩

位运算 10月月更 PHP基础 PHP位运算

leetcode 191. Number of 1 Bits 位1的个数(简单)

okokabcd

LeetCode 数据结构与算法

Java之抽象类

魏铁锤

10月月更

【愚公系列】2022年10月 Go教学课程 038-异常处理

愚公搬代码

10月月更

C# 快捷菜单ConTextMenustrip控件学习

IC00

C# 学习 程序员 上位机 10月月更

“程”风破浪的开发者|那些优化奇葩代码的方法

慕枫技术笔记

学习方法 代码 “程”风破浪的开发者

Java领域又一神作!《凤凰架构》仅开源3小时,竟遭受Github万人哄抢

程序员小毕

程序员 架构 分布式 程序人生 系统设计

“程”风破浪的开发者|APP自动化效果测试工具

芯动大师

学习方法 “程”风破浪的开发者 手机APP测试

算法题学习---链表内指定区间反转

桑榆

算法题 10月月更 C++

一个“简单”的面试题:什么是环回地址127.0.0.1?

wljslmz

10月月更 127.0.0.1 环回地址

知识管理是团队的心脏,让企业管理更上一层楼

Baklib

文档 文档协同

Java实现随机人名抽取

魏铁锤

10月月更

Java | if语句和循环结构

陌上

ide Java、 10月月更

【移动应用安全】移动应用安全概述及超级用户权限获取

w010w

android 移动应用安全 root 10月月更

【LeetCode】分割数组Java题解

Albert

算法 LeetCode 10月月更

MapReduce作业生命周期

穿过生命散发芬芳

mapreduce 10月月更

1024里的小温暖,用技术让生活变得更美好!

阿里技术

1024程序员节

C# 线程的优先级

IC00

C# 学习 程序员 上位机 10月月更

OpenCloudOS社区发起的程序员节专属系列活动

B Impact

企业文档过多如何管理?文档协同能够帮到你

Baklib

文档 文档管理

SegmentFault 思否发布开源问答社区软件 Answer

万事ONES

[极客大挑战 2019]Http 题解

w010w

Web HTTP CTF 10月月更

大家都在“卷”的推荐系统还有进步空间吗?看技术大牛们怎么说

小红书技术REDtech

观察者模式的基础原理

阿泽🧸

观察者模式 10月月更

华为云门户的六维系统监控(一)_语言 & 开发_Think体验设计_InfoQ精选文章