写点什么

好买中间件之监控:基于日志分析的端到端监控系统

  • 2020-04-17
  • 本文字数:717 字

    阅读完需:约 2 分钟

好买中间件之监控:基于日志分析的端到端监控系统

一谈到监控,想必脑袋里面的词会以你从事的岗位为中心轴,喷出不少词语,比如面向系统运维的 zbbix、Cacti、Nagios,比如基于 ELK 的产品系列 - 日志易、袋鼠云,比如…


不多费口舌,自从有 ‘微服务’ 这个名词以来,在架构师、研发的小伙伴大声叫喊着 “微服务架构可以给你带来好处”的同时,运维与测试同学的内心应该是拔凉拔凉的,为啥?因为原本‘IOE 时代’的大集成,突然变成了一堆小碎片,环境怎么搭?出问题怎么排查?链路关系怎么整理?


尤其当产线出现异常或错误时,快速发现、定位、解决就变得尤其重要,相信很多同学都有过“出现问题,老板站在你背后看着你解决问题”的惨痛经历,而且还会问你“为什么我们不能早于客户发现问题呢?”


分久必合,合久必分

还是以微服务作为背景,去中心化变得很重要,但在很多系统的发展史中,基本路径都是“从系统孤岛 ——> 大一统或一大坨 ——>子系统系统拆分 ——> 微服务”


很难找到一套解决方案,伴随着这样一个路径成长或演化(本来监控就不是研发重视的视角),虽然 DevOPS 理念满天飞,而且方式也显得非常合体,但执行中,不是人的问题,就是这样那样的问题,很难短期达到效果


为什么要建这套监控平台,我们现状痛点是什么?


to 运维


  • 系统往分布式系统的方向发展、系统和系统的依赖难以知晓

  • 故障排查成本高

  • 系统的压力和系统的水位分析


to 测试


  • 压力分布测试难


to 开发


  • 系统排查错误成本高


这套监控平台,能为我们提供什么呢?


  • 一张清晰的系统概况 &网络拓扑

  • 系统接口的依赖关系



  • 针对请求的调用链关系


这套监控平台,我们如何实现他呢?


  • 应用埋点



  • 基于谷歌的 Google Dapper 为架构参照物



  • 应用需按照要求输出日志



本文转载自头哥侃码公众号。


原文链接:https://mp.weixin.qq.com/s/NEmgMNfv2ytQGIQg3tY5yw


2020-04-17 15:031316

评论

发布
暂无评论
发现更多内容

火山引擎DataTester:0代码也能实施A/B测试的实验平台

字节跳动数据平台

大数据 AB testing实战 企业号 2 月 PK 榜

代码实例解读如何安全发布对象

华为云开发者联盟

开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

BSN-DDC基础网络详解(一):基础介绍

BSN研习社

一文走进多核架构下的内存模

KaiwuDB

多模数据库 多核编程 内存模

想找个稳定的工作

MavenTalker

职业素养 职业发展 求职面试

windows命令窗口

MEImei

mockito入门

查拉图斯特拉说

后端 单元测试

Databend Roadmap in 2023

Databend

软件测试/测试开发 | app自动化测试(Android)--App 控件交互

测试人

软件测试 自动化测试 测试开发 appium app自动化测试

比亚迪新能源汽车战略布局研究

不脱发的程序猿

汽车电子 比亚迪新能源汽车战略布局 比亚迪新能源汽车

RocketMQ源码-NameServer架构设计及启动流程

小小怪下士

Java 源码 程序员 RocketMQ

全球首个面向遥感任务设计的亿级视觉Transformer大模型

京东科技开发者

CNN 遥感 遥感影像 企业号 2 月 PK 榜 深度视觉

技术管理 之 干系人管理

码猿外

技术管理 干系人管理

坚持技术or转做管理,我们该如何选择?

石云升

极客时间 1月月更 技术领导力实战笔记

分层次的电路设计方法

timerring

FPGA

云时代,好用的数据迁移方案推荐

NineData

数据库迁移 数据校验 数据复制 迁移工具 NineData

手把手教您在PyCharm中连接云端资源进行代码调试

华为云开发者联盟

人工智能 华为云 企业号 2 月 PK 榜 华为云开发者联盟

《欧拉开源操作系统行业应用案例集》2023年案例集征集开始!

openEuler

Linux 操作系统 openEuler

开发互动直播应用很简单:声网 Android Demo保姆级跑通教程

声网

android RTC RTE 教程分享

2K字就能理解的async/await原理,还要拖多久?

梁木由

前端 前端开发 校招 前端入门

1

Doctor Blind

分享一个 HIVE SQL 性能优化点-使用公共表表达式 CTE 替换临时表

明哥的IT随笔

hadoop hive

贴合运维场景的告警聚合实现——以Zabbix为例

北海

运维 zabbix 告警 IT运维

一看就懂!任务提交的资源判断在Taier中的实践

袋鼠云数栈

比亚迪元EV汽车拆解报告

不脱发的程序猿

嵌入式 汽车电子 比亚迪元EV汽车拆解

架构实战营第 10 期 - 模块五:微博评论高性能高可用计算架构设计

kaizen

「架构实战营」

OKR之剑·实战篇04:OKR执行过程优化的那些关键事

vivo互联网技术

团队管理 OKR

应用部署初探:3个主要阶段、4种常见模式

SEAL安全

应用部署

新范式+新标准=世界级产品|StarRocks年度总结

StarRocks

数据库

AIGC的浪潮下,文本生成发展得怎么样了?

澜舟孟子开源社区

人工智能 文本生成 AIGC

好买中间件之监控:基于日志分析的端到端监控系统_行业深度_头哥侃码_InfoQ精选文章