写点什么

可观测性与原生云监控

  • 2017-11-22
  • 本文字数:1299 字

    阅读完需:约 4 分钟

在近日发表的一篇文章中,Cindy Sridharan概括介绍了可观测性及其与原生云应用程序监控的关系。可观测性是一种理念,包括监控、日志聚合、指标和分布式跟踪,可以实时更深入地观察系统。

Sridharan 的文章基于她就同一个主题所做的 Velocity 演讲。随着微服务、云和容器化架构的出现,我们构建系统的方式变了。在后一种情况下,应用程序是分布式的,而且瞬息万变。底层的基础设施和网络服务愈加健壮,应用程序层需要跟上技术的发展步伐。将来,大多数的故障都将来自应用程序层或者是不同应用程序之间的复杂交互。

这种复杂性增加了把系统状态可视化的难度。虽然出现了新的工具,但尚处于发展阶段。Sridharan 探讨了可观测性的概念以及如何选择恰当的工具洞察现如今的系统。

可观测性是一个最近几年开始在监控社区流行的术语,然而,它并不是一个新事物,而且似乎和它真正的意思有些出入。据Sridharan之前的文章,可以将可观测性视为监控的超集。Twitter 工程团队的文章将可观测性总结为监控、预警/ 可视化、分布式系统跟踪、日志聚合和分析。谷歌致力于简化工具,降低数据聚合成本,标准化整个栈的格式和框架,从而便于跟踪。谷歌最上层的抽象是上下文传播,他们针对每一种语言提供了一个库,或者使用该语言的内置特性。上下文用于在整个栈中传播被称为标签的键- 值对,后续可以把它们用于过滤特定的请求。

预警和统一管理面板是监控的组成部分。按照Sridharan 的说法,可观测性是所有这些再加上(应用程序)性能分析、调试和依赖分析。与监控不同,可观测性和数据挖掘有关,是为了寻找问题的答案,简化信息的访问。监控和故障检测有关,有定义好的故障路径。随着故障模式的增加,确定真正的原因变得非常困难,这是由日益复杂的架构所导致的。而后者已成常态。定义可观测性有不同的方法。例如,白盒监控是指,有一个数据源,可观测性可以视为从数据中挖掘相关信息的能力。

日志、指标和请求跟踪是可观测性的基础。日志为数据(如指标)提供额外的上下文。不过,日志对性能的影响也很大。相比之下,指标的开销是不变的,而且有利于预警。总而言之,日志和指标可以为观察单独的系统提供方便,但是对于穿过多个系统的请求,很难提供其生命周期的信息。跟踪提供了跟踪在各个系统之间传递的请求的能力。后者很难实施,一个原因是应用程序使用的第三方库也需要检测。抽样被用于减少跟踪的开销和存储成本。这里的抽样是指减少收集的信息的数量。其中,磁盘配额及动态调整日志生成速度就是日志记录的一些最佳实践。

关于跟踪技术的发展近况。谷歌发布了 Dapper 论文, Open Zipkin 是以此为基础的开源实现,并导致 OpenTracing 标准的产生。如果应用程序使用了类似 Envoy 项目这样的网格技术,跟踪就简单些。服务网格是一个位于TCP/IP 层之上的网络基础设施层,可以处理可靠请求交付,有时候也实现为一系列网络代理。它简化了动态环境中的服务通信,如使用Kubernetes 编排的容器集群。

在原生云环境中,软件开发和交付可以从采用类似预生产测试、生产测试、有效监控、原始数据(如指标和日志事件)挖掘和动态检测这样的实践收益。

查看英文原文 Observability and the Monitoring of Cloud-Native Applications

2017-11-22 18:002696
用户头像

发布了 1008 篇内容, 共 443.0 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

GaussDB(for MySQL)如何快速创建索引?华为云数据库资深架构师为您揭秘

华为云开发者联盟

数据库 算法 索引 GaussDB(for MySQL) MySQL索引

DBA:介里有你没有用过的“CHUAN”新社区版本Redis6.0

华为云开发者联盟

redis 开源 多线程 Redis 6.0 华为云DCS

聊一聊芯片上电复位和掉电检测

不脱发的程序猿

嵌入式 硬件开发 芯片上电 上电复位 掉电检测

Supervisor 基础配置

耳东@Erdong

Supervisor 9月日更

【Flutter 专题】46 图解新的状态管理 Provider (一)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 9月日更

Python——绑定与方法调用

在即

9月日更

图计算的应用

6979阿强

命令行如何执行jar包里面的方法

FunTester

性能测试 反射 接口测试 测试框架 FunTester

MySQL事务学习笔记

风翱

MySQL 9月日更

在线JSON转sarcastic工具

入门小站

工具

枚举在 Golang 中的实现

baiyutang

Go 语言 9月日更

网络攻防学习笔记 Day136

穿过生命散发芬芳

vpn 9月日更 恶意代码

17. 关于超人工智能来临,霍金的忧虑

Databri_AI

人工智能

图遍历算法

6979阿强

图遍历 GraphScope

WEB全屏API简介及示例

devpoint

web api 9月日更

JavaScript 进阶(下)

Augus

JavaScript 9月日更

linux之iconv命令

入门小站

Linux

【LeetCode】寻找峰值Java题解

Albert

算法 LeetCode 9月日更

乘着汽车智能化的浪潮,“汽车人”的职业方向选择(二)

SOA开发者

程序员 软件 汽车 职业发展

深入剖析 | XLSX海量数据复杂填充解决方案

九叔(高翔龙)

中间件 EasyExcel Apache POI java核心

怎样才能写好前端页面,css书写顺序和布局真的有那么重要吗

你好bk

CSS html 大前端 结构

产品设计的几个原则

石云升

产品思维 产品思考 9月日更

手撸二叉树之翻转二叉树

HelloWorld杰少

9月日更

hutool如何实现数据导出到Excel

卢卡多多

hutool 数据导出 9月日更

雪花算法,什么情况下发生 ID 冲突?

马丁玩编程

Java lua redis 雪花算法

“妈我不想去上课!”“不行你是老师!”

梦想橡皮擦

9月日更

架构实战营模块三作业

michael

#架构实战营

Sentinel 常用流控算法

Z

sentinel 流控算法 服务监控 服务降级 流控

linux系列之:告诉他,他根本不懂kill

程序那些事

Linux 命令 程序那些事 kill

针对各种指标数据如何选择合适的算法?

云智慧AIOps社区

技术 算法 数据 智能运维 指标

还重构?就你那代码只能铲了重写!

小傅哥

Java 小傅哥 代码优化 代码重构 开发标准

可观测性与原生云监控_DevOps & 平台工程_Hrishikesh Barua_InfoQ精选文章