写点什么

Logz.io 和 Dynatrace 的创新将可观测性带入 AI 时代

作者:Matt Saunders

  • 2025-07-01
    北京
  • 本文字数:1547 字

    阅读完需:约 5 分钟

大小:762.90K时长:04:20
Logz.io和Dynatrace的创新将可观测性带入AI时代

主要的可观测性平台提供商正在将人工智能集成到他们的监控系统中,因为企业希望他们的供应商能够减少监控数字基础设施所涉及的手动工作。像 Logz.io、Dynatrace、Datadog 和 New Relic 这样的公司已经实现了旨在自动化日常运维任务和加速事件解决流程的 AI 功能。

 

Logz.io的一篇博文中,Jade Lassery 写到了他们的专用“AI 代理”。这些代理可以实现特定的运维功能。该公司的根因分析代理(Root Cause Analysis Agent)可以关联不同服务的遥测数据,生成事件时间线和补救步骤,而他们的告警分析代理(Alert Analysis Agent)则使用上下文指标和建议采取的行动来丰富通知内容。根据 Logz.io 的文档:

 

当有告警触发时,RCA 代理就会介入——不需要工单,不需要 Slack 话题。它会关联受影响的服务、环境和依赖项的日志、指标和追踪信息。

 

该平台还包括一个数据分析代理(Data Analysis Agent),可以通过处理自然语言查询来识别性能模式。一个值得注意的功能是,它允许用户将调查洞察转换为持久化的仪表板面板,Logz.io将其描述为连接“调查和监控工作流”的桥梁。早期用户提供了积极的反馈,beta 用户报告说,由于调查是自动的,分诊时间减少了 30-70%。



Dynatrace的 Davis AI 引擎采取了拓扑方法,关于这一点,本月早些时候的一篇新闻稿提到过Davis AI通过映射应用程序依赖来识别潜在的故障,从而实现故障的预防。与 Logz.io 特定于任务的代理不同,Davis 使用因果 AI 全面分析云架构,识别基础设施、应用程序和最终用户体验中的异常模式。在新闻稿中,Dynatrace 创始人兼首席技术官 Bernd Greifeneder 解释说:“我们构建了下一代的平台,为的是可以帮助客户利用先进的 AI 减轻工作负担并解锁全新的可能。”



与其他供应商相比,Datadog的方法以其Watchdog系统为核心。该系统使用统计学习进行跨指标、日志和追踪信息的异常检测。Logz.io 致力于于通过浅显易懂的摘要来做出解释,而 Datadog 强调相关性,可自动链接不同数据源中的相关事件。这种方法似乎适用于云规模的部署,但与 Logz.io 的模块化系统相比,对 AI 驱动工作流的细粒度控制比较少。

 

New Relic 优先考虑了 MLOps 的集成,并以此确立了其独特的地位;将机器学习应用于模型性能和漂移检测。New Relic 的方法有助于模型生命周期管理,但与其他平台提供的更广泛用途相比,它在通用基础设施监控方面的应用范围比较窄。

 

尽管它们的技术实现存在明显差异,但这些平台有几个核心能力是一样的。从 Logz.io 的语义搜索到 Dynatrace 基于意图的解析,所有平台都使用自然语言处理用户查询,尽管实现方式存在显著的差异。每个平台都提供自动化的根因分析,Logz.io 和 Dynatrace 会生成建议采取的具体补救步骤,而 Datadog 则专注于不同事件之间的相关性映射。另一个常见的功能是使用 AI 减少告警噪音,同样是通过不同的方法实现的。Logz.io 使用了上下文丰富,而 Dynatrace 有拓扑过滤,Datadog 则使用了统计抑制技术。不同的供应商以截然不同的方式从反应式监控转向了主动系统管理。

 

各个领域都有实际的应用出现。一个托管安全服务提供商测试了 Logz.io 的 AI 代理,并在博文中报告说,该系统的“与众不同之处在于,它能自动进行第一层调查,分析与告警相关的日志和指标,并在几秒钟内找出可能的原因。”Logz.io 报告说,有数百家公司正在使用他们的 AI 代理,每周通过 AI 驱动的分析功能处理的数据量达到千 T 字节。

 

这些近期发布的公告显示了从简单的基于仪表板的监控向 Datadog 所说的“代理 AI”功能的转变。这些功能可以自主操作,减少分析可观测性工具所涉及的人力劳动。像 Logz.io 这样的专门代理的实际应用,展示了这些先进的理论如何转化成了切实的运营效益。有早期采用者报告说,手动分诊工作显著减少。


声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:https://www.infoq.com/news/2025/06/logzio-dynatrace-observability/

2025-07-01 15:331

评论

发布
暂无评论

【Flutter 专题】99 初识 EventBus

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

流式基础设施--云基础设施的未来

俞凡

云计算 架构

crypto/md5

康家沟偶像天团王大锤

DevOps的未来

俞凡

DevOps

架构训练营模块6作业

Geek_649372

架构训练营

JavaScript学习(六)

空城机

JavaScript 大前端 6月日更

智能无线接入网的崛起

俞凡

AI OpenRAN

跨越式成长 - 高效的学习方法

Ryan Zheng

揭秘MySQL的主从同步实现方案

架构精进之路

MySQL 6月日更

【Vue2.x 源码学习】第十九篇 - 根据 vnode 创建真实节点

Brave

源码 vue2 6月日更

架构实战营模块六作业

竹林七贤

计算机系统性能评价

若尘

性能 计算机组成原理 6月日更

密码你真的了解吗

卢卡多多

密码学 6月日更

自媒体从业者如何选择合适的公司

石头IT视角

模块6作业6

wade

#架构实战营

大学生如何让更好的入门计算机?

Bob

入门 话题讨论 话题 大学生

如何使用EasyRecovery巧妙恢复被误删的办公文档?

淋雨

数据恢复 文件恢复 Easyrecovery破解 免费恢复软件

Google大规模监控系统--Monarch

俞凡

架构 分布式 大厂实践

JAVA面向对象(七)--类的属性和方法详讲

加百利

Java 6月日更

Python——计数器(Counter)

在即

6月日更

Angular管道PIPE介绍

devpoint

angular.js angular 6月日更

低代码开发简史

俞凡

架构

OnceAgain

一个向往理想的现实主义者

个人总结

kubelet分析-csi driver注册源码分析

良凯尔

源码 Kubernetes kubelet CSI Kubernetes Plugin

源码分析--golang读写锁

en

Angular模板简介

devpoint

angular.js angular 6月日更

《Software Engineering at Google》免费开放

俞凡

c++ 软件工程 Google 大厂实践

架构实战训练营 - 模块六课后作业

Johnny

架构实战营

架构实战营模块6作业

冬天的树

Golang生成随机字符串的八种方式与性能测试

张俭

Performance Go 语言

六、拆分电商系统为微服务

菠萝吹雪—Code

架构实战营

Logz.io和Dynatrace的创新将可观测性带入AI时代_云计算_InfoQ精选文章