NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

AIOps 未来已来,博睿数据有哪些实践经验?

  • 2022-06-13
  • 本文字数:2656 字

    阅读完需:约 9 分钟

AIOps未来已来,博睿数据有哪些实践经验?

运维方式逐渐走向智能化


根据 IT 桔子的不完全统计,2021 年,IT 运维行业相关融资事件共有 24 起,融资金额约 54.7 亿元。


据艾瑞咨询的数据显示,2021 年中国 IT 服务突破万亿大关,其中 IT 运维市场规模达到 2941.2 亿元。预计 2023 年将达到 3236.4 亿元,2020-2023 年的年复合增长率为 11.7%。就智能运维赛道而言,全球智能运维的市场规模年复合成长率预计为 30.6%,2027 年达到 400 亿美元的规模。


毋庸置疑,IT 运维正在成为继 SaaS 之外又一个被送上风口的赛道。在这个巨大的角斗场中,资本、企业、技术正在塑造行业发展的新逻辑。


在过去的数十年间,运维发展经历了数个阶段。从早期的手工运维到标准化运维、自动化运维,再到 DevOps、AIOps,追溯整个历程不难发现,运维方式随着技术的不断发展,逐渐迈向智能化。


从 2016 年AIOps(智能运维)概念被提出,到 2017、2018 年全球市场出现商业化产品,在国内市场,2020 年是 AIOps 的元年。根据第三方评估机构预测,到 2022 年,40%的大中型企业将部署 AIOps 平台。不难猜测,智能运维将在很长一段时间成为 IT 运维的重点赛道。

AIOps 需要长期演进,不断创新发展


虽然 AI 技术给运维工作带来的价值显而易见,但需要明确的是 AIOps 不是一个一蹴而就的实践,而是一个长期演进的过程,需要不断创新发展。


就当前国内智能运维的环境而言,博睿数据首席架构师李骅宸认为 AIOps 还存在以下几方面的挑战:


  • 普适性:在不同的客户业务场景中,如何减少定制化和实施成本,又能更好的解决业务问题。

  • 可解释:AI 的结果如何自解释,如何验证。

  • 效率:高度自动化地减少人工干预。

  • 资源:在私有化或 POC 时,极致的技术应用到资源和性能优化中,以最小资源成就最大价值。

  • 稳定:AI 算法高度智能化和自动化。


要在智能运维方面持续发力,首先,要打破数据孤岛,做 DNA 数据的最大化融合,建立数据资产的统一管理仓库,产生联邦数据的次生价值


2021 年,博睿数据提出了“服务可达的数据链 DNA”技术理念,D 代表 DEM(数字体验管理),N 代表 NPM(网络性能管理),A 代表 APM(应用性能管理),从而打通从代码到用户访问的全过程,进一步释放企业 IT 运维监控管理所有分支领域 DEM、APM、ITIM、NPM 和智能运维管理的能力。以数据链 DNA 概念为例,AIOps 是 DNA 中重要的一环,可助力 APM 产品和数据实现端到端打通,让 DNA 更加自动化和智能化。同时,DNA 数据链也给 AI 提供场景和数据土壤,让 AI 通过信息整合、特征关联真正的跑出优质算法模型。


其次,要加强数据分析和数据挖掘,扩展 AI 产品能力,夯实算法基础能力,让 AI 支持轻量级的模块化和产品化。在算法可解释性和评价体系方面建立一套标准,引入不同的数据集进行数据加工分析,用真实故障注入的方式来不断锤炼 AIOps 能力,在商业化输出时能够以近乎开箱即用、极低适配成本的方式实现价值的最大化输出。


更为重要的是,AIOps 本就是基于已有的运维数据,并通过机器学习的方式来进一步解决自动化运维没办法解决的问题。企业实现 AIOps 的前提是建立起全面获取 IT 数据的能力,这里的数据主要包括但不限于日志、指标和事件等。将这些数据输送给 AIOps 平台,为 AIOps 提供数据资产,以进行整合的更高级别的分析和洞察。如果没有这些大数据的支持,AIOps 则是无源之水。所以对于企业来说,大数据采集工作至关重要。


总体而言,中国市场足够大,数据也足够丰富,而在国家战略和政策的支持下,传统制造业正向智能创造逐步发展,发展的过程中必然会涉及大量数据处理,而这也是 AI 技术的强项,当前在运维领域,AI 技术的应用还是刚刚起步,慢慢成熟,在未来的 3-5 年内,AI 技术会广泛应用到运维场景中,向自助式服务方向发展。

博睿数据的 AIOps 实践经验


2020 年,博睿数据开始重兵投入智能运维赛道。就博睿数据而言,博睿数据的 AIOps 的核心是“数据+AI+产品+场景”四合一的综合解决方案。在一体化运维、告警管理、故障定位、应急快恢等高频运维场景中帮助用户更高效、更准确的达成业务目标。


其特性主要有 5 个方面:


  1. 门槛低:博睿数据的 AI 接入简单,开箱即用,算法支持可视化和自解释;

  2. 性能高:同等性能条件下资源消耗较少,1 台 4C8G 机器可处理每分钟 6.6 万指标量,3 台 8C16G 机器可处理每分钟 48 万指标量;

  3. 数据全:APM 深耕多年,数据多而全,比如 Trace 核心基础能力,博睿数据支持多语言、多框架,也能和日志深度关联。这对 AIOps 做多模态数据联邦分析和挖掘有优势;

  4. 范围广:算法通用性强,适应范围广泛,针对不同行业进行了模型优化;

  5. 分析强:可观测数据、流程工单数据、配置管理数据汇总到数据中台,提供流批一体的在离线数据查询聚合能力,为任意指标、实体的关联分析提供独到见解支撑。


目前,博睿数据基于自研的大数据实时处理和分析平台 Zeus 做数据挖掘,在异常检测、趋势预测、告警收敛、事件分析等应用场景方面已实现产品化落地。


具体来说,异常检测,主要应用于运维数据的无监督异常发现环节,不需要运维人员手工设置阈值即可做到异常的自主发现,大幅节省了人力投入;


趋势预测,主要应用于业务特性运维数据的预测场景,比如容量预测、访问量预测、硬件缺陷预测等等,对于运维人员的预算编制、业务规划和提前介入处置起到很大的参考作用;


告警收敛,主要应用于统一告警平台的事件管理场景,运维人员不再需要面对大量的无效告警,只需要关注收敛后的少量故障,应急处置的效率和精准度有了大幅提升;


事件分析,主要应用于一体化运维平台的问题管理场景,AI 将指标、Trace、事件的异常信息汇聚到问题,从问题查找根因,从根因联动通知、自动化等处置步骤,问题分析的效率和精准度得到大幅改善。



目前,博睿数据算法中台 SwiftAI 已赋能到新一代 APM 的 Server 产品、新一代的智能运维大数据平台 DataView、“双模一体”智能应急中心 OneAlert 等,与博睿数据统一联邦数据中台 Zeus 相辅相成,不断落地智能异常检测、趋势预测、智能告警、事件分析等场景,助力云原生时代服务可达。


2022 年 5 月 20 日,博睿数据正式推出了一体化智能可观测平台ONE,该平台旨在建立一体化、智能化、面向业务与用户体验的统一运维平台,助力企业提高数字化体验,降低运维成本,提升工作效率,为数字化转型赋能升级。同时,这也是业界第一个将所有运维监控需求“All in ONE”的统一平台。博睿数据的 AI 能力,比如告警收敛、根因分析、多维分析、影响分析等,也将在 ONE 平台的观测洞察、应急管理等模块中逐步落地。 


谈及博睿数据 AIOps 未来的发展,博睿数据 AIOps 首席专家贺安辉表示:“未来,博睿数据在 AIOps 方面将在根因定位、影响分析、NLP、算法实验室四个方面发力。”同时,未来博睿数据也将继续发展多模态数据联邦“底座”和 AI 算法的广度和深度,支持全程服务可观测。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-06-13 11:272980

评论

发布
暂无评论
发现更多内容

科勒携多款重磅产品惊艳亮相第27届中国国际厨卫展

科技热闻

以GaussDB举例,浅谈商业版数据库的断供风险以及国产数据库的重要性

轶天下事

第四课 设计千万级学生管理系统考试试卷存储方案

家有两宝

架构训练营

基于STM32的智能饮水机系统设计

DS小龙哥

6 月 优质更文活动

人生三借、成就伟业

科技热闻

Wallys/wifi 6 router ipq8072 enterprise wireless dual band /support wifi6e card

Cindy-wallys

IPQ8072

科勒亮相设计上海2023,全方位打造敢创艺术空间

科技热闻

开发者聚焦 | 不容错过的开发者新专栏就要来啦!

亚马逊云科技 (Amazon Web Services)

亚马逊云科技

谁是蔡崇信?|耶鲁大学QA

B Impact

在AIGC魔法世界里,你是麻瓜吗?

白洞计划

AIGC

ChatGPT在前,华为盘古Chat在后

这我可不懂

人工智能 华为 ChatGPT

2023-06-20:给定一个长度为N的数组arr,arr[i]表示宝石的价值 你在某天遇到X价值的宝石, X价值如果是所有剩余宝石价值中的最小值,你会将该宝石送人 X价值如果不是所有剩余宝石价值中的

福大大架构师每日一题

Go rust 算法、 福大大架构师每日一题

【TypeScript】TS条件类型

不叫猫先生

typescript 6 月 优质更文活动

SUFS: 存储资源使用量预测服务

KaiwuDB

KaiwuDB 存储资源使用量预测

聊聊 220V交流 过零检测

矜辰所致

电路设计 过零检测 6 月 优质更文活动

如何用手机在区块链上发行虚拟币?一键发币3分钟搞定

加密先生

发币教学 一键发币

用友BIP全球司库十问之大型企业如何管好资金预算?

用友BIP

全球司库

华为云数据库GaussDB,无惧“卡脖子”,给世界一个更优选择

轶天下事

以创新驱动增长,百度营销助力成人教育机构迎战金秋季

科技热闻

检测客户端访问设备的一种新方法

为自己带盐

.net core 设备检测

向量数据库的行业标准逐渐清晰!Vector DB Bench 正式开源!

Zilliz

非结构化数据 测试工具 Milvus 向量数据库 zillizcloud

Golden Gate’s (GGX) : 通过多方计算实现跨链一体化

股市老人

C语言编程语法—利用栈实现对后缀表达式的求解

智趣匠

C语言 6 月 优质更文活动

【SIGMOD 2023】深度学习弹性数据流水线系统GoldMiner,大幅提升任务和集群效率

阿里云大数据AI技术

人工智能 深度学习 数据库 企业号 6 月 PK 榜

实现10倍提升!昇思MindSpore SPONGE套件助力核磁共振蛋白质动态结构解析加速

彭飞

昇思 昇思MindSpore

科创西安:秦创原·信创人才培养暨鸿蒙生态产教融合发展论坛举行

坚果

OpenHarmony 6 月 优质更文活动

MySQL一个关于derived table的bug描述与规避

GreatSQL

商业版数据库断供风险愈发扩大,浅谈GaussDB与国内企业的应对方式

轶天下事

华为云GaussDB:为企业提供智能、高效、安全的数据库解决方案

轶天下事

SAP UI5 OData 谣言粉碎机:极短时间内发送两个 Odata 请求,前一个会自动被 cancel 掉吗

Jerry Wang

SAP OData ui5 思爱普 6 月 优质更文活动

在AIGC魔法世界里,你是麻瓜吗?

脑极体

AI

AIOps未来已来,博睿数据有哪些实践经验?_软件工程_博睿数据_InfoQ精选文章