写点什么

当国内大厂谈论监控的时候,他们在谈论什么

  • 2018-11-08
  • 本文字数:743 字

    阅读完需:约 2 分钟

当国内大厂谈论监控的时候,他们在谈论什么

运维同学最重要的使命就是保证线上业务的稳定运行,但是业务不出问题是不可能的,任你怎么拜服务器都没用。所以出了故障就要及时发现及时处理,监控就成了运维工作中非常重要的环节,有人甚至说监控对于运维来说,犹如眼睛对人来说一样重要。


一个完备的监控系统需要具备的是数据采集、扩展性、告警管理、高可用、历史数据存储与展示、权限管理等几个方面,每个单元可以选择的工具又非常多,正所谓 ends justify means,只要能保证业务稳定,监控工作怎么做大家可以各显身手:


  • 中小型公司业务量和人手都有限,多用开源监控工具。开源工具比较通用,能满足大多数的监控需求,实在不行还可以在它们的基础之上进行改进,国外比较受欢迎的开源监控工具/系统有:Zabbix,CACTI,Nagios 等,随着云原生理念的流行,Prometheus, Zipkin 也得到了越来越多的关注。国内也有开源的监控系统:小米开源的号称互联网企业级监控系统 Open-Falcon,现在已经被 200 多家企业采用;还有大众点评开源的实时应用监控平台 CAT,也比较好用;

  • 对于很多大厂来说,业务量规模庞大且复杂,仅使用开源的监控工具和系统无法满足自己的需求,大家都愿意自研监控系统,比如阿里巴巴的鹰眼,去哪儿网的 Watcher 等等。


所以说具体问题还是要具体分析,适合自己的才是最好的。如何才能找到适合自己的监控系统?要从源头解决这个问题,还是要先了解自己的系统,弄清楚监控的思路是什么,监控的难点在哪里,有哪些坑可以避免。


现在我们聚集了一些国内一线大厂,让你可以了解到国内顶级企业的监控实践:他们在自研监控系统的过程中有哪些考虑,是什么样的设计思路?



11 月 16 日-11 月 17 日,InfoQ 举办的CNUTCon全球运维技术大会,上海,你不可错过的运维技术盛会。咨询大会信息请联系 Joy 小姐姐,电话:13269078023 (微信同号)。



2018-11-08 14:253658
用户头像
张婵 InfoQ 技术编辑

发布了 87 篇内容, 共 55.4 次阅读, 收获喜欢 218 次。

关注

评论

发布
暂无评论
发现更多内容

电竞玩家的云端盛宴!四大云电脑平台:ToDesk、顺网云、青椒云、极云普惠实测大比拼

小喵子

云电脑 ToDesk ToDesk云电脑

AutoMQ 产品动态 | 发布 1.1.0,兼容至 Apache Kafka 3.7,支持 Kaf

AutoMQ

Java 云计算 kafka AutoMQ

基于Netty的自研流系统缓存实现挑战: 内存碎片与OOM困境

AutoMQ

Java 云原生 Netty AutoMQ

淘宝商品详情API接口:实时追踪商品库存情况,优化供应链管理

技术冰糖葫芦

API Explorer API 调试 API 文档

5 分钟读懂API技术架构

幂简集成

API API架构

行业智能化,让千行万业在珠峰相见

白洞计划

AI

软件测试学习笔记丨Allure2报告中添加附件-图片

测试人

软件测试

AutoMQ vs Kafka: 来自小红书的独立深度评测与对比

AutoMQ

Java kafka 云原生 小红书 AutoMQ

AutoMQ 生态集成 Kafdrop-ui

AutoMQ

Java kafka 云原生 AutoMQ kafdrop

YAML 简介:易懂的配置语言

Liam

程序员 前端 后端 yaml

Nginx性能调优5招35式不可不知的策略实战

不在线第一只蜗牛

nginx 性能优化 运维

AutoMQ 与蚂蚁数科达成战略合作

AutoMQ

Java kafka 云原生 AutoMQ 蚂蚁数科

「布道师系列文章」宝兰德徐清康解析 Kafka 和 AutoMQ 的监控

AutoMQ

云计算 kafka Java’ AutoMQ

Java ZGC 深度剖析及其在构建低延迟流系统中的实践心得

AutoMQ

Java 云计算 AutoMQ

客户在哪儿AI助ToB销售每天都能在活动上遇到目标客户

客户在哪儿AI

ToB营销 活动营销

文献解读-基准与方法研究-第十六期|《GeneMind 公司的 GenoLab M 测序平台 WGS 和 WES 数据基准测试》

INSVAST

基因数据分析 生信服务

当国内大厂谈论监控的时候,他们在谈论什么_软件工程_张婵_InfoQ精选文章