Splunk IT 服务智能介绍

  • Jonathan Allen
  • 百占辉

2015 年 10 月 27 日

话题:DevOps大数据AI

任何操作团队的关键作用之一是应用和服务监控。然而,即使在今天,大多数的商店都无法理解他们的基础设施发生了什么。有大量的工具来寻找数据,但每个工具和它产生的数据和其他工具都是孤立的。而且没有跨层关联数据的能力,就很难理解一些事情为什么会发生。

Splunk 的本身就能很好地拉取任意数据源,允许分析师去关联数据,如实时销售数据与 Web 服务器的流量和数据库的健康。但仅这一点是不够的。分析师写的特设查询,由其性质来看是不可重复的。由于应用程序开发人员被分散在多个方向上,很难找到一个开发人员来建立和维护自定义的仪表板。

Splunk 的新产品称之为IT 服务智能(ITSI), 它的目的是让分析师创建自己的仪表板。Splunk 预计大多数公司将在安装之后的几天之内看到它的作用。

服务分析者

Splunk 的 ITSI 的目标是将人们从查看单个 KPI 值这件事中解脱出来。大部分时间,事实上,Web 服务器有几秒钟达到 95%的 CPU 利用率是很常见的。但是,如果相同的服务器 CPU 利用率保持在 95%并持续 20 分钟,这意味着一些重要的事情正发生在该服务器上。或者说,如果所有的服务器都以 80%的利用率运行,这就有可能是系统性的问题,尽管 80%对于单个服务器被认为是正常的。

这个服务分析者的功能,提供了一种方式来创建基于多个 KPI 的健康公式。用户可以为健康评分设置加权,以便它可以在不忽略其他 KPI 的情况下优先一些 KPIs。

反映表格

我们在我们的介绍幻灯片中提到了映射表格功能。我们没有提到的是,它们是可交互的。他们不仅可以用数字和图形数据显示重叠,也可以将它们与其他的反映表格和自定义动作相互连接。这样,操作人员可以在高级视图中直接显示问题,并快速进入到详细视图来显示到底发生了什么事情。

深度挖掘

反映表格也能作为一个通道前往深度挖掘功能。深度挖掘功能以相关柱状图的形式展现了 KPIs 背后的历史数据。通过这个,我们的意图是,当你在一个特定的时间点检测一个 KPI 时,UI 会自动显示之前其他的 KPI 在相同的时间内发生了什么。

查看英文原文:Introducing Splunk IT Service Intelligence


感谢张龙对本文的审校。

给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

DevOps大数据AI