写点什么

AIOps 未来已来,博睿数据有哪些实践经验?

  • 2022-06-13
  • 本文字数:2656 字

    阅读完需:约 9 分钟

AIOps未来已来,博睿数据有哪些实践经验?

运维方式逐渐走向智能化


根据 IT 桔子的不完全统计,2021 年,IT 运维行业相关融资事件共有 24 起,融资金额约 54.7 亿元。


据艾瑞咨询的数据显示,2021 年中国 IT 服务突破万亿大关,其中 IT 运维市场规模达到 2941.2 亿元。预计 2023 年将达到 3236.4 亿元,2020-2023 年的年复合增长率为 11.7%。就智能运维赛道而言,全球智能运维的市场规模年复合成长率预计为 30.6%,2027 年达到 400 亿美元的规模。


毋庸置疑,IT 运维正在成为继 SaaS 之外又一个被送上风口的赛道。在这个巨大的角斗场中,资本、企业、技术正在塑造行业发展的新逻辑。


在过去的数十年间,运维发展经历了数个阶段。从早期的手工运维到标准化运维、自动化运维,再到 DevOps、AIOps,追溯整个历程不难发现,运维方式随着技术的不断发展,逐渐迈向智能化。


从 2016 年AIOps(智能运维)概念被提出,到 2017、2018 年全球市场出现商业化产品,在国内市场,2020 年是 AIOps 的元年。根据第三方评估机构预测,到 2022 年,40%的大中型企业将部署 AIOps 平台。不难猜测,智能运维将在很长一段时间成为 IT 运维的重点赛道。

AIOps 需要长期演进,不断创新发展


虽然 AI 技术给运维工作带来的价值显而易见,但需要明确的是 AIOps 不是一个一蹴而就的实践,而是一个长期演进的过程,需要不断创新发展。


就当前国内智能运维的环境而言,博睿数据首席架构师李骅宸认为 AIOps 还存在以下几方面的挑战:


  • 普适性:在不同的客户业务场景中,如何减少定制化和实施成本,又能更好的解决业务问题。

  • 可解释:AI 的结果如何自解释,如何验证。

  • 效率:高度自动化地减少人工干预。

  • 资源:在私有化或 POC 时,极致的技术应用到资源和性能优化中,以最小资源成就最大价值。

  • 稳定:AI 算法高度智能化和自动化。


要在智能运维方面持续发力,首先,要打破数据孤岛,做 DNA 数据的最大化融合,建立数据资产的统一管理仓库,产生联邦数据的次生价值


2021 年,博睿数据提出了“服务可达的数据链 DNA”技术理念,D 代表 DEM(数字体验管理),N 代表 NPM(网络性能管理),A 代表 APM(应用性能管理),从而打通从代码到用户访问的全过程,进一步释放企业 IT 运维监控管理所有分支领域 DEM、APM、ITIM、NPM 和智能运维管理的能力。以数据链 DNA 概念为例,AIOps 是 DNA 中重要的一环,可助力 APM 产品和数据实现端到端打通,让 DNA 更加自动化和智能化。同时,DNA 数据链也给 AI 提供场景和数据土壤,让 AI 通过信息整合、特征关联真正的跑出优质算法模型。


其次,要加强数据分析和数据挖掘,扩展 AI 产品能力,夯实算法基础能力,让 AI 支持轻量级的模块化和产品化。在算法可解释性和评价体系方面建立一套标准,引入不同的数据集进行数据加工分析,用真实故障注入的方式来不断锤炼 AIOps 能力,在商业化输出时能够以近乎开箱即用、极低适配成本的方式实现价值的最大化输出。


更为重要的是,AIOps 本就是基于已有的运维数据,并通过机器学习的方式来进一步解决自动化运维没办法解决的问题。企业实现 AIOps 的前提是建立起全面获取 IT 数据的能力,这里的数据主要包括但不限于日志、指标和事件等。将这些数据输送给 AIOps 平台,为 AIOps 提供数据资产,以进行整合的更高级别的分析和洞察。如果没有这些大数据的支持,AIOps 则是无源之水。所以对于企业来说,大数据采集工作至关重要。


总体而言,中国市场足够大,数据也足够丰富,而在国家战略和政策的支持下,传统制造业正向智能创造逐步发展,发展的过程中必然会涉及大量数据处理,而这也是 AI 技术的强项,当前在运维领域,AI 技术的应用还是刚刚起步,慢慢成熟,在未来的 3-5 年内,AI 技术会广泛应用到运维场景中,向自助式服务方向发展。

博睿数据的 AIOps 实践经验


2020 年,博睿数据开始重兵投入智能运维赛道。就博睿数据而言,博睿数据的 AIOps 的核心是“数据+AI+产品+场景”四合一的综合解决方案。在一体化运维、告警管理、故障定位、应急快恢等高频运维场景中帮助用户更高效、更准确的达成业务目标。


其特性主要有 5 个方面:


  1. 门槛低:博睿数据的 AI 接入简单,开箱即用,算法支持可视化和自解释;

  2. 性能高:同等性能条件下资源消耗较少,1 台 4C8G 机器可处理每分钟 6.6 万指标量,3 台 8C16G 机器可处理每分钟 48 万指标量;

  3. 数据全:APM 深耕多年,数据多而全,比如 Trace 核心基础能力,博睿数据支持多语言、多框架,也能和日志深度关联。这对 AIOps 做多模态数据联邦分析和挖掘有优势;

  4. 范围广:算法通用性强,适应范围广泛,针对不同行业进行了模型优化;

  5. 分析强:可观测数据、流程工单数据、配置管理数据汇总到数据中台,提供流批一体的在离线数据查询聚合能力,为任意指标、实体的关联分析提供独到见解支撑。


目前,博睿数据基于自研的大数据实时处理和分析平台 Zeus 做数据挖掘,在异常检测、趋势预测、告警收敛、事件分析等应用场景方面已实现产品化落地。


具体来说,异常检测,主要应用于运维数据的无监督异常发现环节,不需要运维人员手工设置阈值即可做到异常的自主发现,大幅节省了人力投入;


趋势预测,主要应用于业务特性运维数据的预测场景,比如容量预测、访问量预测、硬件缺陷预测等等,对于运维人员的预算编制、业务规划和提前介入处置起到很大的参考作用;


告警收敛,主要应用于统一告警平台的事件管理场景,运维人员不再需要面对大量的无效告警,只需要关注收敛后的少量故障,应急处置的效率和精准度有了大幅提升;


事件分析,主要应用于一体化运维平台的问题管理场景,AI 将指标、Trace、事件的异常信息汇聚到问题,从问题查找根因,从根因联动通知、自动化等处置步骤,问题分析的效率和精准度得到大幅改善。



目前,博睿数据算法中台 SwiftAI 已赋能到新一代 APM 的 Server 产品、新一代的智能运维大数据平台 DataView、“双模一体”智能应急中心 OneAlert 等,与博睿数据统一联邦数据中台 Zeus 相辅相成,不断落地智能异常检测、趋势预测、智能告警、事件分析等场景,助力云原生时代服务可达。


2022 年 5 月 20 日,博睿数据正式推出了一体化智能可观测平台ONE,该平台旨在建立一体化、智能化、面向业务与用户体验的统一运维平台,助力企业提高数字化体验,降低运维成本,提升工作效率,为数字化转型赋能升级。同时,这也是业界第一个将所有运维监控需求“All in ONE”的统一平台。博睿数据的 AI 能力,比如告警收敛、根因分析、多维分析、影响分析等,也将在 ONE 平台的观测洞察、应急管理等模块中逐步落地。 


谈及博睿数据 AIOps 未来的发展,博睿数据 AIOps 首席专家贺安辉表示:“未来,博睿数据在 AIOps 方面将在根因定位、影响分析、NLP、算法实验室四个方面发力。”同时,未来博睿数据也将继续发展多模态数据联邦“底座”和 AI 算法的广度和深度,支持全程服务可观测。

2022-06-13 11:273951

评论

发布
暂无评论
发现更多内容

微信朋友圈的复杂度分析

胡颖

架构实战营

北森CEO纪伟国:深耕HR SaaS,聚焦场景一体化

海比研究院

【浪潮云说】直播间第十期将于今晚19:30准时开播

云计算

作业:模块一

奔奔

使用 Spring Boot 和 @DataJpaTest 测试 JPA 查询

码语者

Java Spring Boot test

AISWare AntDB亚信科技数据库产品特性解读——平滑弹性扩展(一)

亚信AntDB数据库

亚信科技

CODING 助力江苏高速信息实现组织敏捷与研发敏捷,领跑智慧交通新基建

CODING DevOps

研发敏捷 组织敏捷 自动化发布流程 团队目标一致性 楼宇智能化

泛型原理解析(Review)

Puciu

泛型

科技赋能乡村振兴,农林牧渔如何“拥抱”区块链技术?

CECBC

第六届世界智能大会平行论坛提前揭晓

InfoQ 天津

Serverless 工程实践 | 自建 Apache OpenWhisk 平台

Serverless Devs

Android平台如何使用RSA算法进行加解密?

Changing Lin

10月月更

网易云信 6 周年|以梦为马,谱写融合通信新篇章

网易云信

云通信 通信云

架构实战营毕业总结

maybe

永不落幕的世界智能盛会:天津市工业和信息化局与工商银行天津分行举行对接交流活动

InfoQ 天津

OCR+NLP信息抽取在金融、物流行业的应用

百度大脑

人工智能 百度

Android 音视频 - MediaCodec 编解码音视频

声网

android 音视频 编解码

PaddlePaddle:在 Serverless 架构上十几行代码实现 OCR 能力

Serverless Devs

Python代码阅读(第47篇):从列表右边开始执行给定函数

Felix

Python 编程 Code Programing 阅读代码

OCR+NLP 提取信息并分析,这个开源项目火了!

百度开发者中心

最佳实践 开源技术

中国央行数字货币DCEP——有增值空间吗?

CECBC

云原生体系下 Serverless 弹性探索与实践

Serverless Devs

云原生 无服务器 弹性计算

浅谈如何实现自定义的 iterator

hedzr

stl Iterator c++17

虚拟人“觉醒”年,见证一场万物的进化

脑极体

少吃肉也能减碳排?

脑极体

阿里大牛首次公布Java10W字八股文面经,Github访问量破百万

Java 编程 程序员 架构 面试

如何成为一个更好的职业人?

石云升

学习笔记 职场经验 10月月更

万圣节也是节,准备好Trick or Treat了么?

气气

话题讨论

WorkPlus数字化办公解决方案,打造企业高效协同生态!

BeeWorks

公关CRM软件助你培养长期客户关系

低代码小观

CRM 管理系统 管理工具 管理软件 公关

Serverless 工程实践 | 零基础上手 Knative 应用

Serverless Devs

AIOps未来已来,博睿数据有哪些实践经验?_软件工程_博睿数据_InfoQ精选文章