写点什么

AIOps 未来已来,博睿数据有哪些实践经验?

  • 2022-06-13
  • 本文字数:2656 字

    阅读完需:约 9 分钟

AIOps未来已来,博睿数据有哪些实践经验?

运维方式逐渐走向智能化


根据 IT 桔子的不完全统计,2021 年,IT 运维行业相关融资事件共有 24 起,融资金额约 54.7 亿元。


据艾瑞咨询的数据显示,2021 年中国 IT 服务突破万亿大关,其中 IT 运维市场规模达到 2941.2 亿元。预计 2023 年将达到 3236.4 亿元,2020-2023 年的年复合增长率为 11.7%。就智能运维赛道而言,全球智能运维的市场规模年复合成长率预计为 30.6%,2027 年达到 400 亿美元的规模。


毋庸置疑,IT 运维正在成为继 SaaS 之外又一个被送上风口的赛道。在这个巨大的角斗场中,资本、企业、技术正在塑造行业发展的新逻辑。


在过去的数十年间,运维发展经历了数个阶段。从早期的手工运维到标准化运维、自动化运维,再到 DevOps、AIOps,追溯整个历程不难发现,运维方式随着技术的不断发展,逐渐迈向智能化。


从 2016 年AIOps(智能运维)概念被提出,到 2017、2018 年全球市场出现商业化产品,在国内市场,2020 年是 AIOps 的元年。根据第三方评估机构预测,到 2022 年,40%的大中型企业将部署 AIOps 平台。不难猜测,智能运维将在很长一段时间成为 IT 运维的重点赛道。

AIOps 需要长期演进,不断创新发展


虽然 AI 技术给运维工作带来的价值显而易见,但需要明确的是 AIOps 不是一个一蹴而就的实践,而是一个长期演进的过程,需要不断创新发展。


就当前国内智能运维的环境而言,博睿数据首席架构师李骅宸认为 AIOps 还存在以下几方面的挑战:


  • 普适性:在不同的客户业务场景中,如何减少定制化和实施成本,又能更好的解决业务问题。

  • 可解释:AI 的结果如何自解释,如何验证。

  • 效率:高度自动化地减少人工干预。

  • 资源:在私有化或 POC 时,极致的技术应用到资源和性能优化中,以最小资源成就最大价值。

  • 稳定:AI 算法高度智能化和自动化。


要在智能运维方面持续发力,首先,要打破数据孤岛,做 DNA 数据的最大化融合,建立数据资产的统一管理仓库,产生联邦数据的次生价值


2021 年,博睿数据提出了“服务可达的数据链 DNA”技术理念,D 代表 DEM(数字体验管理),N 代表 NPM(网络性能管理),A 代表 APM(应用性能管理),从而打通从代码到用户访问的全过程,进一步释放企业 IT 运维监控管理所有分支领域 DEM、APM、ITIM、NPM 和智能运维管理的能力。以数据链 DNA 概念为例,AIOps 是 DNA 中重要的一环,可助力 APM 产品和数据实现端到端打通,让 DNA 更加自动化和智能化。同时,DNA 数据链也给 AI 提供场景和数据土壤,让 AI 通过信息整合、特征关联真正的跑出优质算法模型。


其次,要加强数据分析和数据挖掘,扩展 AI 产品能力,夯实算法基础能力,让 AI 支持轻量级的模块化和产品化。在算法可解释性和评价体系方面建立一套标准,引入不同的数据集进行数据加工分析,用真实故障注入的方式来不断锤炼 AIOps 能力,在商业化输出时能够以近乎开箱即用、极低适配成本的方式实现价值的最大化输出。


更为重要的是,AIOps 本就是基于已有的运维数据,并通过机器学习的方式来进一步解决自动化运维没办法解决的问题。企业实现 AIOps 的前提是建立起全面获取 IT 数据的能力,这里的数据主要包括但不限于日志、指标和事件等。将这些数据输送给 AIOps 平台,为 AIOps 提供数据资产,以进行整合的更高级别的分析和洞察。如果没有这些大数据的支持,AIOps 则是无源之水。所以对于企业来说,大数据采集工作至关重要。


总体而言,中国市场足够大,数据也足够丰富,而在国家战略和政策的支持下,传统制造业正向智能创造逐步发展,发展的过程中必然会涉及大量数据处理,而这也是 AI 技术的强项,当前在运维领域,AI 技术的应用还是刚刚起步,慢慢成熟,在未来的 3-5 年内,AI 技术会广泛应用到运维场景中,向自助式服务方向发展。

博睿数据的 AIOps 实践经验


2020 年,博睿数据开始重兵投入智能运维赛道。就博睿数据而言,博睿数据的 AIOps 的核心是“数据+AI+产品+场景”四合一的综合解决方案。在一体化运维、告警管理、故障定位、应急快恢等高频运维场景中帮助用户更高效、更准确的达成业务目标。


其特性主要有 5 个方面:


  1. 门槛低:博睿数据的 AI 接入简单,开箱即用,算法支持可视化和自解释;

  2. 性能高:同等性能条件下资源消耗较少,1 台 4C8G 机器可处理每分钟 6.6 万指标量,3 台 8C16G 机器可处理每分钟 48 万指标量;

  3. 数据全:APM 深耕多年,数据多而全,比如 Trace 核心基础能力,博睿数据支持多语言、多框架,也能和日志深度关联。这对 AIOps 做多模态数据联邦分析和挖掘有优势;

  4. 范围广:算法通用性强,适应范围广泛,针对不同行业进行了模型优化;

  5. 分析强:可观测数据、流程工单数据、配置管理数据汇总到数据中台,提供流批一体的在离线数据查询聚合能力,为任意指标、实体的关联分析提供独到见解支撑。


目前,博睿数据基于自研的大数据实时处理和分析平台 Zeus 做数据挖掘,在异常检测、趋势预测、告警收敛、事件分析等应用场景方面已实现产品化落地。


具体来说,异常检测,主要应用于运维数据的无监督异常发现环节,不需要运维人员手工设置阈值即可做到异常的自主发现,大幅节省了人力投入;


趋势预测,主要应用于业务特性运维数据的预测场景,比如容量预测、访问量预测、硬件缺陷预测等等,对于运维人员的预算编制、业务规划和提前介入处置起到很大的参考作用;


告警收敛,主要应用于统一告警平台的事件管理场景,运维人员不再需要面对大量的无效告警,只需要关注收敛后的少量故障,应急处置的效率和精准度有了大幅提升;


事件分析,主要应用于一体化运维平台的问题管理场景,AI 将指标、Trace、事件的异常信息汇聚到问题,从问题查找根因,从根因联动通知、自动化等处置步骤,问题分析的效率和精准度得到大幅改善。



目前,博睿数据算法中台 SwiftAI 已赋能到新一代 APM 的 Server 产品、新一代的智能运维大数据平台 DataView、“双模一体”智能应急中心 OneAlert 等,与博睿数据统一联邦数据中台 Zeus 相辅相成,不断落地智能异常检测、趋势预测、智能告警、事件分析等场景,助力云原生时代服务可达。


2022 年 5 月 20 日,博睿数据正式推出了一体化智能可观测平台ONE,该平台旨在建立一体化、智能化、面向业务与用户体验的统一运维平台,助力企业提高数字化体验,降低运维成本,提升工作效率,为数字化转型赋能升级。同时,这也是业界第一个将所有运维监控需求“All in ONE”的统一平台。博睿数据的 AI 能力,比如告警收敛、根因分析、多维分析、影响分析等,也将在 ONE 平台的观测洞察、应急管理等模块中逐步落地。 


谈及博睿数据 AIOps 未来的发展,博睿数据 AIOps 首席专家贺安辉表示:“未来,博睿数据在 AIOps 方面将在根因定位、影响分析、NLP、算法实验室四个方面发力。”同时,未来博睿数据也将继续发展多模态数据联邦“底座”和 AI 算法的广度和深度,支持全程服务可观测。

2022-06-13 11:273907

评论

发布
暂无评论
发现更多内容

Map-Reduce 思想在 ABAP 编程中的一个实际应用案例

汪子熙

mapreduce abap CRM系统 企业级应用 3月月更

Meetup预告| AIOps指标相关算法体系分享

云智慧AIOps社区

机器学习 大数据 算法 AIOPS 智能运维

企业帮助中心的搭建步骤

小炮

帮助中心

这门面向应用开发者的 TiDB 使用教程,TiDB SQL、Connector API、架构体系…你一定不能错过!

PingCAP

netty系列之:java中的base64编码器

程序那些事

Java 程序那些事 3月月更

电科申泰加入龙蜥社区并成为理事单位,共创基础软硬件生态新未来

OpenAnolis小助手

开源 理事单位 申威 软硬件

数字化时代,如何做好用户体验与应用性能管理

云智慧AIOps社区

监控宝 监控工具 自动化运维 数字化经济

【三级等保】三级等保服务费用一年大概要多少?一年需要测评一次嘛?

行云管家

网络安全 等保 等级保护 三级等保

恒源云(Gpushare)_【存储优化】/hy-tmp可以扩/缩容啦

恒源云

云计算 存储 tmp

征文丨TiDB 社区专栏第一届征文大赛,快来一次性集齐所有周边吧!

PingCAP

并发异步编程之争:协程(asyncio)到底需不需要加锁?(线程/协程安全/挂起/主动切换)Python3

刘悦的技术博客

多线程 协程 Python3 协程原理

资产管理系统开发解决方案

低代码小观

企业管理 资产管理 CRM系统 企业管理软件

如何使用 Checkmk 监控 SSL TLS 证书?

Ethereal

2022年济南正规等保测评公司名单(排名不分先后)

行云管家

等保 等保测评 等保2.0 济南

国内首届DataOps+MLOps meetup回顾

星策开源社区

人工智能 机器学习 DevOps Meetup MLOps

HSC推出「万物生长计划」 赋能虎符交易所HOO新应用场景

区块链前沿News

Hoo 虎符交易所 虎符智能链

鸿蒙开发必备书籍【收藏】

坚果

鸿蒙 3月月更

OceanBase 在线体验环境,现已上线!

OceanBase 数据库

ZEGO 自研客户端配置管理系统 —— 云控

ZEGO即构

后台开发 客户端配置 音视频架构

Web 键盘输入法应用开发指南(9)—— 标准与实现

天择

JavaScript 键盘 输入法 3月月更

数据对接 - 大屏云极简使用手册

shulinwu

可视化 数据可视化 大屏可视化 数据可视化控件 大屏

两小时,掌握四个数字化工具!

明道云

私有云与公有云,哪种云模型最适合企业的需求

Ethereal

Linux性能优化—内存实战篇

Linux服务器开发

性能优化 内存管理 Linux服务器开发 Linux内核 内核源码

【直播回顾】OpenHarmony知识赋能第四期第二课——GPIO驱动开发

OpenHarmony开发者

OpenHarmony GPIO 驱动开发

OceanBase 存储引擎详解

OceanBase 数据库

零基础学编程?从这本豆瓣评分9.2的入门级神作开始

图灵社区

Python 零基础

抓到Netty一个隐藏很深的内存泄露Bug | 详解Recycler对象池的精妙设计与实现

bin的技术小屋

中间件 池化技术 java netty 内存池

在 Manjaro 上安装 Chrome

信号量

chrome Linux

2022 年值得关注的 9 个最新 Java 趋势

Ethereal

一站式运维管理工具平台 OCP 到底有多好用,看这篇文章就够了!

OceanBase 数据库

AIOps未来已来,博睿数据有哪些实践经验?_软件工程_博睿数据_InfoQ精选文章