写点什么

当国内大厂谈论监控的时候,他们在谈论什么

  • 2018-11-08
  • 本文字数:743 字

    阅读完需:约 2 分钟

当国内大厂谈论监控的时候,他们在谈论什么

运维同学最重要的使命就是保证线上业务的稳定运行,但是业务不出问题是不可能的,任你怎么拜服务器都没用。所以出了故障就要及时发现及时处理,监控就成了运维工作中非常重要的环节,有人甚至说监控对于运维来说,犹如眼睛对人来说一样重要。


一个完备的监控系统需要具备的是数据采集、扩展性、告警管理、高可用、历史数据存储与展示、权限管理等几个方面,每个单元可以选择的工具又非常多,正所谓 ends justify means,只要能保证业务稳定,监控工作怎么做大家可以各显身手:


  • 中小型公司业务量和人手都有限,多用开源监控工具。开源工具比较通用,能满足大多数的监控需求,实在不行还可以在它们的基础之上进行改进,国外比较受欢迎的开源监控工具/系统有:Zabbix,CACTI,Nagios 等,随着云原生理念的流行,Prometheus, Zipkin 也得到了越来越多的关注。国内也有开源的监控系统:小米开源的号称互联网企业级监控系统 Open-Falcon,现在已经被 200 多家企业采用;还有大众点评开源的实时应用监控平台 CAT,也比较好用;

  • 对于很多大厂来说,业务量规模庞大且复杂,仅使用开源的监控工具和系统无法满足自己的需求,大家都愿意自研监控系统,比如阿里巴巴的鹰眼,去哪儿网的 Watcher 等等。


所以说具体问题还是要具体分析,适合自己的才是最好的。如何才能找到适合自己的监控系统?要从源头解决这个问题,还是要先了解自己的系统,弄清楚监控的思路是什么,监控的难点在哪里,有哪些坑可以避免。


现在我们聚集了一些国内一线大厂,让你可以了解到国内顶级企业的监控实践:他们在自研监控系统的过程中有哪些考虑,是什么样的设计思路?



11 月 16 日-11 月 17 日,InfoQ 举办的CNUTCon全球运维技术大会,上海,你不可错过的运维技术盛会。咨询大会信息请联系 Joy 小姐姐,电话:13269078023 (微信同号)。



2018-11-08 14:253414
用户头像
张婵 InfoQ 技术编辑

发布了 87 篇内容, 共 52.6 次阅读, 收获喜欢 218 次。

关注

评论

发布
暂无评论
发现更多内容

罗马建立在水渠上:为什么需要优先建设绿色光网?

脑极体

龙蜥下游发行版 Alibaba Cloud Linux 3 安全基线正式通过 CIS 认证,云上企业安全性保障更上层楼

OpenAnolis小助手

Linux 开源 cis

Flink on K8s 企业生产化实践|社区征文

张浩_house

flink 特征平台 新春征文

刷屏的“1620”有多难?3D+AI技术带你一秒看懂

百度开发者中心

学术论坛第七期:基于统计的预测算法

云智慧AIOps社区

统计学 预测模型

百年奥运的凌空之美,AI云智剪背后的新算法

阿里云视频云

大咖说|《商业评论》主编颜杰华:如何看待未来商业的管理趋势?

大咖说

大咖说 财经 数智化 商业评论

OpenHarmony移植案例与原理:startup子系统之syspara_lite系统属性部件

华为云开发者联盟

Token OpenHarmony startup子系统 syspara_lite系统

HTTP流量神器Goreplay核心源码详解

华为云开发者联盟

Go 流量 GOREPLAY TCP/HTTP

自我认为挺全面的【Web Service渗透测试总结】

H

网络安全 渗透测试

注意!这种笔试方式正在逐渐被取代……

ShowMeBug

笔试 在线面试

千万级CPS的开源网络压测软件dperf

百度开发者中心

WeOpen Good 开源公益计划正式启动!聚开源智慧·行科技向善

腾源会

开源 公益 腾源会

Python代码阅读(第75篇):阶乘

Felix

Python 编程 阅读代码 Python初学者 阶乘

iLogtail——一款延迟仅在毫秒级的千万实例可观测采集器利器来了 | 龙蜥技术

OpenAnolis小助手

阿里云 开源 数据采集 技术分享

2021年第4季度中国网络零售B2C市场交易规模达23593.9亿元

易观分析

B2C 网络零售

编译ORB-SLAM 3 出现slots_reference错误

Ayosh

slam

35款FL插件免费下载

懒得勤快

1分钟了解Prometheus的WAL机制

johncming

Prometheus WAL

在线YAML转XML工具

入门小站

工具

美景本天成,妙笔偶得之——“妙笔”是怎样炼成的?

百度开发者中心

3步教你把个人应用服务部署到云服务器ECS上

阿里云弹性计算

Docker 征文投稿 玩转ECS

Geospatial Data 在 Nebula Graph 中的实践

NebulaGraph

图数据库 知识图谱 分布式图数据库

面试突击:说一下线程生命周期,以及转换过程?

CRMEB

图计算 on nLive:Nebula 的图计算实践

NebulaGraph

图数据库 知识图谱 图计算 分布式图数据库

剑指Offer——JVM 这些基础知识点你全掌握了吗

No Silver Bullet

JVM 垃圾回收 offer 2月月更

开源每周问答精选:PolarDB for PostgreSQL 是专门面向 OLAP 场景吗?

阿里云数据库开源

数据库 阿里云 开源 polarDB

网络安全kali渗透学习 web渗透入门 NMAP高级使用技巧和漏洞扫描

学神来啦

政企机构用户注意!蠕虫病毒Prometei正在针对局域网横向渗透传播

火绒安全

局域网共享 渗透 蠕虫 病毒 政企

教你一个快速视频处理的神器:Python moviepy

华为云开发者联盟

Python 视频 音频 视频处理 Moviepy

腾讯音乐知识图谱搜索实践

NebulaGraph

图数据库 知识图谱 分布式图数据库

当国内大厂谈论监控的时候,他们在谈论什么_软件工程_张婵_InfoQ精选文章