AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

OpsRamp 推出以服务为中心的 AIOps 和云监控功能

  • 2019-02-14
  • 本文字数:1590 字

    阅读完需:约 5 分钟

OpsRamp推出以服务为中心的AIOps和云监控功能

OpsRamp是一个面向混合企业的以服务为中心的 AIOps 软件即服务(SaaS)平台,最近发布了新的拓扑图、增强的人工智能 IT 运维(AIOps)功能以及针对云原生工作负载的监控功能。


新版的 OpsRamp 平台为现代 IT 运营管理团队提供了 Kubernetes 监控、智能警报路由和拓扑图。它为混合基础设施监控和管理提供了更强大的以服务为中心的环境,让企业 IT 团队能够采用更智能的事件管理机制,并提供卓越的用户体验。


OpsRamp 产品管理副总裁 Mahesh Ramachandran 将“以服务为中心”定义为:


以服务为中心的观点将数字运营团队的重心从管理元素转移到管理业务服务。OpsRamp AIOps 解决方案旨在通过更快的补救和事件响应来满足服务可用性和性能需求。这样可以帮助 IT 组织将基础设施环境从一系列设备、资源和配置重新构建为一系列业务服务,我们认为这些服务更易于管理。它还将传统 IT、DevOps 和业务目标整合并统一为一个共同愿景。IT 像业务一样思考其所需的资源——以服务为核心。


新版本提供了影响可见性和服务上下文功能,可发现混合云和多云 IT 技术栈中多级资源之间的拓扑关系。拓扑图旨在帮助基础设施和运营团队了解 IT 资源对彼此以及面向最终用户的 IT 服务的影响。OpsRamp 的拓扑发现功能现在可用于应用程序和 hypervisor。应用程序拓扑功能可发现 40 多种流行的企业应用程序,并在应用程序组件和基础设施之间建立拓扑关系。hypervisor 拓扑功能可发现 VMware vSphere 和 KVM 环境中的虚拟机、hypervisor 服务器和集群以及它们之间的关系。


OpsRamp 还增强了服务地图功能,提供了新的用户界面,可以识别 IT 服务中断背后的底层资源,让运营团队制定正确的恢复服务行动方案。新版本引入了一些新功能,包括自动事件创建和路由、推理模型的增强训练和频率驱动的警报升级。


OpsRamp 的OpsQ现在可以使用警报升级策略进行自动事件创建和路由,根据之前的警报、事件和通知数据自动分配事件。机器学习驱动的警报升级使用特定的学习模式(受让人组、业务影响、紧急程度和优先级)为不同类型的警报路由事件分配。OpsRamp 的基于机器学习的推理模型使用历史警报数据关联由常见原因引起的警报。OpsQ 现在允许使用用户提供的训练数据来增强这些模型。通过这种增强训练,IT 运营团队可以引导 OpsQ 识别日常运营中不常见的警报序列,当发生警报时能够识别出来。要增强模型,用户可以构建电子表格(或使用示例模板),使用预定义的数据(解析器组、类别、子类别、优先级、紧急程度和业务影响)将事件升级到服务管理。然后将这些数据应用于 OpsRamp 的事件管理工具和第三方事件管理集成。


OpsQ 支持新的策略,比如根据最近发生警报的频率来升级警报。运营团队因此可以过滤掉只是偶尔会发生的警报,并升级反复发生的警报。OpsRamp 平台提供了多云事件监控功能,以及发现和监控支持现代微服务架构的容器基础设施的功能。


OpsRamp 现在可以在本地和云端(例如 Azure Kubernetes Services、Google Kubernetes Engine 和 Amazon Elastic Container Service for Kubernetes)发现和监控 Kubernetes 环境。DevOps 团队可以了解每个 Kubernetes 集群的总服务(每个集群的节点和容器、按命名空间划分的 pod)和资源趋势(CPU 和内存利用)。用户可以监控与集群、主机、NameSpaces、pod 和容器的可用性和性能相关的关键指标。在公共云中,事件是重要的运维问题通信媒介,而在多云环境中,事件是信号的主要来源。OpsRamp 现在可以从 AWS 服务(如 AWS Health、ECS、Redshift、数据迁移服务和 CloudWatch)收集、聚合、关联和升级事件。有了这个功能,OpsRamp 可以对跨多个云帐户的云事件进行单点监控、管理和修复。


新的 OpsRamp 版本还提供了包含补丁合规性验证的补丁管理功能、综合事务和 SSL 证书监控、用于监控开源应用程序的集成,以及简化分类和链接的知识库增强。


查看英文原文https://www.infoq.com/news/2019/02/opsramp-service-centricity-aiops


2019-02-14 08:008482
用户头像

发布了 731 篇内容, 共 462.8 次阅读, 收获喜欢 2005 次。

关注

评论

发布
暂无评论
发现更多内容

SpringBoot教程:MyBatis多数据源配置

Bruce Duan

mybatis SpringBoot 2 多数据源配置

charles断点使用方法

rainbow

Week 07 命题作业

Jeremy

Java 基础

Bruce Duan

java基础

第七周总结

晨光

lambda基本使用

Bruce Duan

Lambda

新站上线通知

Damon

压测工具

Acker飏

第七周总结

Acker飏

架构师 第七周总结

冯凯

爱币(LOVE COIN)全球同步耀世上线,掀起币圈追捧热潮

Geek_116789

第七周作业

晨光

系统性能优化总结

极客李

脑洞:基于DDD进行组织架构治理

冯文辉

组织转型 领域驱动设计 DDD

JVM系列之:Contend注解和false-sharing

程序那些事

Java JVM 性能调优 GC

性能压测的时候,随着并发压力的增加,系统响应时间和吞吐量如何变化,为什么?

极客李

SQL查找还在用count吗?

Bruce Duan

SQL查询是否存在

ChaosBlade:从零开始的混沌工程(四)

郭旭东

云原生 混沌工程 ChaosBlade

你在寻找本地部署的后台测试工具吗?

测试那些事儿

Summary

Kiroro

Week 07 学习总结

Jeremy

一文入门DNS?从访问GitHub开始

Kerwin

后端 DNS DNS服务器

k8s 上运行我们的 springboot 服务之——flume 读取kafka数据批量同步到clickhouse

柠檬

kafka Clickhouse

一文吃透时间复杂度和空间复杂度

书旅

数据结构 算法 时间复杂度 数据结构与算法

架构师训练营第 7 周学习总结

Season

作业一

Kiroro

go defer 的使用和陷阱

曲镇

Go 语言

web 性能压测工具

莫莫大人

第七周·命题作业·写 web 性能压测工具

刘璐

第七周·周总结

刘璐

架构师第七周 作业

冯凯

OpsRamp推出以服务为中心的AIOps和云监控功能_DevOps & 平台工程_Helen Beal_InfoQ精选文章