写点什么

可观测性与原生云监控

  • 2017-11-22
  • 本文字数:1299 字

    阅读完需:约 4 分钟

在近日发表的一篇文章中,Cindy Sridharan概括介绍了可观测性及其与原生云应用程序监控的关系。可观测性是一种理念,包括监控、日志聚合、指标和分布式跟踪,可以实时更深入地观察系统。

Sridharan 的文章基于她就同一个主题所做的 Velocity 演讲。随着微服务、云和容器化架构的出现,我们构建系统的方式变了。在后一种情况下,应用程序是分布式的,而且瞬息万变。底层的基础设施和网络服务愈加健壮,应用程序层需要跟上技术的发展步伐。将来,大多数的故障都将来自应用程序层或者是不同应用程序之间的复杂交互。

这种复杂性增加了把系统状态可视化的难度。虽然出现了新的工具,但尚处于发展阶段。Sridharan 探讨了可观测性的概念以及如何选择恰当的工具洞察现如今的系统。

可观测性是一个最近几年开始在监控社区流行的术语,然而,它并不是一个新事物,而且似乎和它真正的意思有些出入。据Sridharan之前的文章,可以将可观测性视为监控的超集。Twitter 工程团队的文章将可观测性总结为监控、预警/ 可视化、分布式系统跟踪、日志聚合和分析。谷歌致力于简化工具,降低数据聚合成本,标准化整个栈的格式和框架,从而便于跟踪。谷歌最上层的抽象是上下文传播,他们针对每一种语言提供了一个库,或者使用该语言的内置特性。上下文用于在整个栈中传播被称为标签的键- 值对,后续可以把它们用于过滤特定的请求。

预警和统一管理面板是监控的组成部分。按照Sridharan 的说法,可观测性是所有这些再加上(应用程序)性能分析、调试和依赖分析。与监控不同,可观测性和数据挖掘有关,是为了寻找问题的答案,简化信息的访问。监控和故障检测有关,有定义好的故障路径。随着故障模式的增加,确定真正的原因变得非常困难,这是由日益复杂的架构所导致的。而后者已成常态。定义可观测性有不同的方法。例如,白盒监控是指,有一个数据源,可观测性可以视为从数据中挖掘相关信息的能力。

日志、指标和请求跟踪是可观测性的基础。日志为数据(如指标)提供额外的上下文。不过,日志对性能的影响也很大。相比之下,指标的开销是不变的,而且有利于预警。总而言之,日志和指标可以为观察单独的系统提供方便,但是对于穿过多个系统的请求,很难提供其生命周期的信息。跟踪提供了跟踪在各个系统之间传递的请求的能力。后者很难实施,一个原因是应用程序使用的第三方库也需要检测。抽样被用于减少跟踪的开销和存储成本。这里的抽样是指减少收集的信息的数量。其中,磁盘配额及动态调整日志生成速度就是日志记录的一些最佳实践。

关于跟踪技术的发展近况。谷歌发布了 Dapper 论文, Open Zipkin 是以此为基础的开源实现,并导致 OpenTracing 标准的产生。如果应用程序使用了类似 Envoy 项目这样的网格技术,跟踪就简单些。服务网格是一个位于TCP/IP 层之上的网络基础设施层,可以处理可靠请求交付,有时候也实现为一系列网络代理。它简化了动态环境中的服务通信,如使用Kubernetes 编排的容器集群。

在原生云环境中,软件开发和交付可以从采用类似预生产测试、生产测试、有效监控、原始数据(如指标和日志事件)挖掘和动态检测这样的实践收益。

查看英文原文 Observability and the Monitoring of Cloud-Native Applications

2017-11-22 18:002450
用户头像

发布了 1008 篇内容, 共 419.4 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

大模型向量数据库去重的N种实现方案!

王磊

AI与智能能源管理:如何通过AI优化能源分配和消耗?

天津汇柏科技有限公司

人工智能 AI

政企产品经理AI工作流分享:需求->产品的敏捷实现(深度长文)

Ben的AI实验室

AI 产品经理 工作流 GPT DeepSeek

十几行代码实现 Manus,Spring AI Alibaba Graph 快速预览

阿里巴巴云原生

阿里云 云原生

AI智上 | 智能会计:某大型商业地产管理公司领先实践

用友智能财务

新闻速递丨Altair 与 Databricks 达成合作,加速数据驱动型创新

Altair RapidMiner

人工智能 机器学习 数据分析 RapidMiner 数据准备

得物业务参数配置中心架构综述

得物技术

业务架构 构架

Amazon Q 从入门到精通 – 集成企业代码库

亚马逊云科技 (Amazon Web Services)

PowerVerse:利用Web3激励机制实现算力去中心化

PowerVerse

NFT web3 去中心化云算力

Sentieon软件发布V2020503版本

INSVAST

版本更新 基因检测 Sentieon 变异检测 生物信息分析服务

月薪3K测试 vs 30K测开:差距在这3个技能​

测试人

软件测试

立马耀:通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统,驱动个性化推荐业务

阿里云大数据AI技术

大数据 spark 阿里云 Serverless EMR

CST表面等离子极化激元SPP --- 光脊波导与缝隙波导的转换

思茂信息

cst CST软件 CST Studio Suite

蚂蚁数科开源虚拟机DTVM 开启区块链AI开发时代

科技热闻

户外全彩LED广告屏安装的注意要点

Dylan

LED LED display LED显示屏 户外LED显示屏 LED屏幕

Full GC 频率优化实战

vivo互联网技术

Java 后端 垃圾回收 系统优化

浅谈国产数据库多租户方案:提升云计算与SaaS的资源管理效率

猫头虎

数据库

什么是安全密钥,它是如何工作的

运维有小邓

单点登录 多因素身份验证 安全密钥

OpenManus:开源版 Manus,无需邀请码,5 分钟极速体验!

阿里巴巴云原生

阿里云 云原生

CSSBuy 淘宝代购系统搭建攻略

tbapi

淘宝代购系统 反向海淘系统

观测云产品更新 | 用户访问、基础设施、监控和事件等

观测云

产品迭代

金仓数据库同城双中心灾备方案

金仓技术

KingBase 金仓数据库

12种API认证全场景解析:从Basic到OAuth2.0,哪个认证最适合你的业务?

数据追梦人

Apipost免费版、企业版和私有化部署详解

数据追梦人

征程 6 VIO Frame buffer管理

地平线开发者

自动驾驶; 算法工具链 地平线征程6

MES系统数据采集功能:自动化设备数据采集

万界星空科技

数据采集 mes 设备 设备管理 设备数据采集

KubeEdge边缘设备管理系列(六):Mapper-Framework开发示例

华为云原生团队

云计算 容器 云原生

《Operating System Concepts》阅读笔记:p777-p777

codists

操作系统

NocoBase 本周更新汇总:联动规则条件左侧支持变量

NocoBase

开源 低代码 零代码 无代码 版本更新

白鲸开源WhaleStudio与崖山数据库管理系统YashanDB完成产品兼容互认证

白鲸开源

数据库 认证 崖山数据库 白鲸开源 WhaleStudio

HCLSoftware推出解决方案

财见

可观测性与原生云监控_DevOps & 平台工程_Hrishikesh Barua_InfoQ精选文章