写点什么

华为云门户的六维系统监控(一)

  • 2020-01-10
  • 本文字数:631 字

    阅读完需:约 2 分钟

华为云门户的六维系统监控(一)

一个产品从雏形到成熟,业务异常会时不时的出现在这个过程中。业务异常可能不可避免,即使成熟的产品也可能由于互联网的攻击而异常,如果能及时发现异常并快速处理,对业务/用户造成的影响就能降到最低。如果某次异常发生后一两个小时或者更长时间业务侧都没有发现,那这种情况就很可怕了。


  华为云门户,包括官网、云市场、云社区(论坛)、用户中心等关键业务,是华为云的门脸。面向互联网,随时可能被攻击,业务异常对用户感知、体验、华为云品牌都会构成严重的威胁。业务的监控和告警显得尤为重要,下面来看看我们门户在这方面做了哪些动作来确保异常能快速的被监控到并产生告警,覆盖了系统可用性和用户体验性两大方面。
复制代码



一、OpsMonitor


  • 介绍:OpsMonitor 是基于 Zabbix 开发的分布式运维监控系统,公有云统一监控平台。可将通用类主机资源使用情况上报到 IES 统一展示。检测到异常时立即告警。

  • 监控点:主机资源如 CPU、内存、磁盘空间、系统启动时长、用户密码过期检测、进程数量监控、* 网卡状态、网络流量、nginx 进程等。

  • 解决问题:服务器资源状态、进程等异常时业务侧无感知。

  • 检测频率:当前配置 5 分钟。

  • 告警阈值:可根据具体监控项进行配置,如 CPU 空闲率 30%。

  • 告警方式:邮件、短信。

  • 实战:2018 年 2 月 28 日 18:17 收到重要告警邮件,紧急连上服务器确认,告警属实,通过确认为后台管理服务器业务正常同步场景,同步完成后告警解除。



监控图:



本文转载自 Think 体验设计公众号。


原文链接:https://mp.weixin.qq.com/s/oZ-VCAXsboTx5cph4oAMVw


2020-01-10 11:511127

评论

发布
暂无评论
发现更多内容

Flink CDC 2.1 正式发布,稳定性大幅提升,新增 Oracle,MongoDB 支持

Apache Flink

大数据 flink 后端 实时计算 CDC

社科院专家认为元宇宙是双刃剑,将带来五大巨变

CECBC

基于Guava API实现异步通知和事件回调

Tom弹架构

Java 架构 设计模式

盲盒开发源码搭建小程序app

盲盒小程序开发盲盒源码搭建

进击的Java(九)

ES_her0

11月日更

自定义View:多点触摸画笔的实现

Changing Lin

11月日更

17 K8S之容器资源需求与资源限制

穿过生命散发芬芳

k8s 11月日更

盲盒开发盲盒app开发

盲盒开发

【强势推出】专家带你玩,秒懂数据库!官方证书、万元奖品带回家!

华为云数据库小助手

GaussDB GaussDB(for openGauss) 华为云数据库

盲盒开发盲盒小程序开发

盲盒开发小程序app开发源码搭建

以用户体验为抓手,助力券商数字化转型

博睿数据

盲盒小程序开发源码搭建

盲盒开发一番赏盲芒趣蛋趣小程序app开发

Python Qt GUI设计:多线程中信号与槽的使用(基础篇—9)

不脱发的程序猿

Python qt PyQt GUI设计 多线程中信号与槽的使用

HarmonyOS 3.0.0开发者预览版全新发布

HarmonyOS开发者

HarmonyOS ArKUI 3.0 ArkCompiler 3.0

为AI另辟蹊径的“小”数据

澳鹏Appen

人工智能 大数据 小数据 数据标注 训练数据

盲盒开发盲盒小程序系统开发

盲盒app开发

支撑长安链运行,区块链算力平台是什么?

CECBC

明道云商业化成果巡礼|2021年11月

明道云

初识 .NET6

面向对象的猫

.net core .net6

盲盒h5小程序app系统开发

.NET6 内置IOC容器

面向对象的猫

.net core .net6

怎么自学Python,大概要多久?

老表

Python 11月日更 编程入门 思路 如何解决问题

【体验有礼】Serverless 极速搭建 Hexo 博客

阿里巴巴中间件

阿里云 Serverless 云原生 Hexo 中间件

单机训练6000万类视觉分类模型,飞桨大规模分类库PLSC做到了

百度开发者中心

飞桨 视觉分类 plsc

如何在浏览器 console 控制台中播放视频?

CRMEB

华为云门户的六维系统监控(一)_语言 & 开发_Think体验设计_InfoQ精选文章