写点什么

OpsRamp 推出以服务为中心的 AIOps 和云监控功能

  • 2019-02-14
  • 本文字数:1590 字

    阅读完需:约 5 分钟

OpsRamp推出以服务为中心的AIOps和云监控功能

OpsRamp是一个面向混合企业的以服务为中心的 AIOps 软件即服务(SaaS)平台,最近发布了新的拓扑图、增强的人工智能 IT 运维(AIOps)功能以及针对云原生工作负载的监控功能。


新版的 OpsRamp 平台为现代 IT 运营管理团队提供了 Kubernetes 监控、智能警报路由和拓扑图。它为混合基础设施监控和管理提供了更强大的以服务为中心的环境,让企业 IT 团队能够采用更智能的事件管理机制,并提供卓越的用户体验。


OpsRamp 产品管理副总裁 Mahesh Ramachandran 将“以服务为中心”定义为:


以服务为中心的观点将数字运营团队的重心从管理元素转移到管理业务服务。OpsRamp AIOps 解决方案旨在通过更快的补救和事件响应来满足服务可用性和性能需求。这样可以帮助 IT 组织将基础设施环境从一系列设备、资源和配置重新构建为一系列业务服务,我们认为这些服务更易于管理。它还将传统 IT、DevOps 和业务目标整合并统一为一个共同愿景。IT 像业务一样思考其所需的资源——以服务为核心。


新版本提供了影响可见性和服务上下文功能,可发现混合云和多云 IT 技术栈中多级资源之间的拓扑关系。拓扑图旨在帮助基础设施和运营团队了解 IT 资源对彼此以及面向最终用户的 IT 服务的影响。OpsRamp 的拓扑发现功能现在可用于应用程序和 hypervisor。应用程序拓扑功能可发现 40 多种流行的企业应用程序,并在应用程序组件和基础设施之间建立拓扑关系。hypervisor 拓扑功能可发现 VMware vSphere 和 KVM 环境中的虚拟机、hypervisor 服务器和集群以及它们之间的关系。


OpsRamp 还增强了服务地图功能,提供了新的用户界面,可以识别 IT 服务中断背后的底层资源,让运营团队制定正确的恢复服务行动方案。新版本引入了一些新功能,包括自动事件创建和路由、推理模型的增强训练和频率驱动的警报升级。


OpsRamp 的OpsQ现在可以使用警报升级策略进行自动事件创建和路由,根据之前的警报、事件和通知数据自动分配事件。机器学习驱动的警报升级使用特定的学习模式(受让人组、业务影响、紧急程度和优先级)为不同类型的警报路由事件分配。OpsRamp 的基于机器学习的推理模型使用历史警报数据关联由常见原因引起的警报。OpsQ 现在允许使用用户提供的训练数据来增强这些模型。通过这种增强训练,IT 运营团队可以引导 OpsQ 识别日常运营中不常见的警报序列,当发生警报时能够识别出来。要增强模型,用户可以构建电子表格(或使用示例模板),使用预定义的数据(解析器组、类别、子类别、优先级、紧急程度和业务影响)将事件升级到服务管理。然后将这些数据应用于 OpsRamp 的事件管理工具和第三方事件管理集成。


OpsQ 支持新的策略,比如根据最近发生警报的频率来升级警报。运营团队因此可以过滤掉只是偶尔会发生的警报,并升级反复发生的警报。OpsRamp 平台提供了多云事件监控功能,以及发现和监控支持现代微服务架构的容器基础设施的功能。


OpsRamp 现在可以在本地和云端(例如 Azure Kubernetes Services、Google Kubernetes Engine 和 Amazon Elastic Container Service for Kubernetes)发现和监控 Kubernetes 环境。DevOps 团队可以了解每个 Kubernetes 集群的总服务(每个集群的节点和容器、按命名空间划分的 pod)和资源趋势(CPU 和内存利用)。用户可以监控与集群、主机、NameSpaces、pod 和容器的可用性和性能相关的关键指标。在公共云中,事件是重要的运维问题通信媒介,而在多云环境中,事件是信号的主要来源。OpsRamp 现在可以从 AWS 服务(如 AWS Health、ECS、Redshift、数据迁移服务和 CloudWatch)收集、聚合、关联和升级事件。有了这个功能,OpsRamp 可以对跨多个云帐户的云事件进行单点监控、管理和修复。


新的 OpsRamp 版本还提供了包含补丁合规性验证的补丁管理功能、综合事务和 SSL 证书监控、用于监控开源应用程序的集成,以及简化分类和链接的知识库增强。


查看英文原文https://www.infoq.com/news/2019/02/opsramp-service-centricity-aiops


2019-02-14 08:008612
用户头像

发布了 731 篇内容, 共 474.9 次阅读, 收获喜欢 2008 次。

关注

评论

发布
暂无评论
发现更多内容

云服务器干嘛的?带你掌握云计算的优势

一只扑棱蛾子

云服务器

5个为什么要做外贸网站推广的理由

九凌网络

BSN-DID研究--主题二:发证方函数

BSN研习社

区块链 BSN did

人工智能,应该如何测试?(八)企业级智能客服测试大模型 RAG

霍格沃兹测试开发学社

日志系统:一条SQL更新语句是如何执行的?

TimeFriends

提升团队工程交付能力,从“看见”工程活动和研发模式开始

阿里云云效

阿里云 云原生 云效

提升团队工程交付能力,从“看见”工程活动和研发模式开始

阿里巴巴云原生

阿里云 云原生 云效

企业智能体(Agent)来袭!拥有“无限可能”的数智化AI底座

行云创新

AI 智能体 agent

解锁ETLCloud中Kettle的用法

谷云科技RestCloud

kettle 数据同步 ETL 数据集成

数仓调优实战:GUC参数调优

华为云开发者联盟

数据库 华为云 华为云开发者联盟 华为云GaussDB(DWS) 企业号2024年4月PK榜

TCL实业盘古实验室发布全域光晕控制等多项创新显示技术

极客天地

行云防水堡-打造企业数据安全新防线

行云管家

网络安全 数据安全 防水堡

人工智能,应该如何测试?(四)模型全生命周期流程与测试图

霍格沃兹测试开发学社

人工智能,应该如何测试?(六)推荐系统拆解

霍格沃兹测试开发学社

天翼云超大规模高性能云基础底座、“息壤”获国资委权威认可!

编程猫

为什么中小企业普遍选择IT运维外包了?

Ogcloud

IT运维 IT外包 IT外包公司 IT外包服务 IT运维外包

亚马逊店铺引流:海外云手机的利用方法

Ogcloud

云手机 海外云手机 云手机海外版 国外云手机 美国云手机

【荣誉】第七在线出席ToB商业头条行业大会 斩获创新力产品奖

第七在线

我们是如何测试人工智能的(六)推荐系统拆解

测试人

人工智能 软件测试 自动化测试 测试开发

企业级依赖管理: 深入解读 Maven BOM

LightGao

maven 设计模式 架构设计 软件系统 java 架构

去哪儿完成鸿蒙原生应用Beta版本开发,带来一站式在线旅行体验

最新动态

DACI决策框架,给低效能企业一个机会

填空时光

项目管理 效能提升 效能工具 决策管理

Sam Altman 联手苹果前首席设计官打造 AI 设备;特斯拉将推出无人驾驶出租车丨 RTE 开发者日报 Vol.178

声网

一文读懂模块化赛道新的头部公链Meta Earth

加密眼界

【IoTDB 线上小课 01】我们聊聊“金三银四”下的开源

Apache IoTDB

和鲸科技入选 2023 年度中国高科技高成长企业系列榜单丨第一新声 & 天眼查

ModelWhale

大数据 #人工智能 人工智能公司

人工智能,应该如何测试?(七)大模型客服系统测试

霍格沃兹测试开发学社

教你如何使用Zig实现Cmpp协议

华为云开发者联盟

云计算 华为云 华为云开发者联盟 华为云短信服务 企业号2024年4月PK榜

IT外包服务助推企业产业融通

Ogcloud

IT IT外包 IT外包公司 IT外包服务 IT外包企业

KaiwuDB 成功入选《2023 ToB 行业影响力价值榜 · 创新力产品榜》

KaiwuDB

数据库

OpsRamp推出以服务为中心的AIOps和云监控功能_DevOps & 平台工程_Helen Beal_InfoQ精选文章