写点什么

AIOps 九大发展趋势

  • 2020-03-16
  • 本文字数:2747 字

    阅读完需:约 9 分钟

AIOps九大发展趋势

大家知道,运维是数字世界的的基础设施级别的技术。随着支撑数字世界的软硬件系统越来越庞大、越来越复杂,运维对智能化的要求就会越来越高。所以我们说,AIOps(智能运维)是运维技术发展必然的趋势。


AIOps 在国内正式提出来到现在的实际落地有两三年了,也取得了初步的落地效果。那么下一步到底怎么做?做什么?未来几年内能进一步达到什么样的效果?今天我就分享下我最近总结出来的 AIOps 发展九大趋势。


做趋势预测是有很大挑战和风险的,好在我之前在 AIOps 领域还有过成功的预测。



我在 2018 年 1 月曾给出一个 AIOps 宏观预测:我说 2018 年将是 AIOps 在中国落地的元年,而据我所知在 2018 年的确有小几十个 AIOps 项目开始落地,也就是说我的这个预测的确成为了现实。2019 年 1 月我说 2019 年是 AIOps 快速发展的一年,而实际上截止 2019 年 8 月份在国内有大几十个 AIOps 项目开始推进;与此同时,我们看到 2019 年初的时候人行以及各大银行也发文阐述支持 AIOps 方向。


我在 AIOps 具体技术上也有个算是成功的预测。2018 年中的时候我已经在公开演讲中讲 AIOps 平台化这个概念了;之后在 2018 年底,Gartner 的报告也基于与世界范围内的客户和厂商的访谈正式提出了 AIOps 平台化这一方向。


下面这幅图的左下部分是我的团队给出的 AIOps 平台架构,该图的右下部分是 2009 年我在 AT&T 工作时做的智能运维平台的架构,可以看出两幅图在概念上是非常相似的。所以,从这个例子大家可以看出,我能够先于 Gartner 提出 AIOps 平台的概念,不是因为真有什么能看到未来的“水晶球”,而是因为我之前在其它场景下做过类似工作,并且在 AIOps 方向不断努力推进。当我看到需求到了,相关条件成熟了,自然而然就能判断应该做 AIOps 平台了。所以,所谓的预测能力无非是经验的积累、不断观察、思考,最重要的是不断的亲手实践,就像林肯和图灵奖得主 Alan Kay(面向对象编程语言的发明者)所言,预测未来最好的方法就是亲手创造/发明这个未来。



下面我总结一下基于经验、访谈、观察、思考和实践得出的 AIOps 发展九大趋势,即行业多样化、产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化、成熟度评估的标准化。



第一个趋势就是 AIOps 落地的多样化,这个结论是基于我通过多种渠道采集到的信息。我们自己有一个公众号“智能运维前沿”,马上要突破 10000 个用户了;我们还有一个超过千人 AIOps 群,已经成功举办了两届 AIOps 挑战赛,我一年中会到几十家各行各业机构去进行现场交流。从上述多种渠道采集到的信息清楚表明:现在开始落地 AIOps 的,除了互联网公司、银行以外,证券、保险,电力、运营商、工业制造、国家机关、自动驾驶公司也都在尝试 AIOps 落地。



第二个趋势是 AIOps 产业生态化。各个行业都在试图尝试落地 AIOps,给 AIOps 方向提供了一个很好的产业基础。“产、学、研、用”各方也都在积极跟进,形成了一个 AIOps 生态系统。在这个生态系统里,专业的人负责专业的事,有越来越多的学术机构从事 AIOps 原理研究;由机构用户负责提出实际需求,由有预研能力的厂商把 AIOps 原理上的突破变成实际落地效果;有负责数据采集、接入、存储等的厂商,还有负责集成、交付、维保等的厂商。也就是说,“学、研、产、用”几方专业分工,通力协作。AIOps 产业生态化在 AIOps 落地过程中是一个重要的里程碑,会大力推动 AIOps 的更快落地。



第三个趋势是 AIOps 数据多样化。数据中心的系统物理架构和软件架构都非常庞大复杂。因此我们必须采集、治理、融合多种运维数据源、从中提取对运维最有用的信息,帮助我们了解数据中心最新最全的运行状态, 从而为 AIOps 的众多场景服务。因此我们说 AIOps 数据多样化是必然趋势。



第四个趋势是 AIOps 场景多样化。下图罗列了一些我们与合作伙伴合作、交流时遇到的具体场景。我们分成几个大场景:即异常发现、事件发现、事件分析、系统画像、图谱丰富等。每一个大场景会包含很多的具体场景,比如“事件分析”大场景就包括“异常机器定位”、“交易链条定位”、“多维度异常定位”等多种类型的事件分析。也就是说,当用户认识到 AIOps 能实际帮助到运维的时候,会自发与生态系统中的伙伴共同找到越发多样化的 AIOps 场景。



第五个趋势是 AIOps 场景精细化。如下图所示,异常检测(也就是通过分析监控数据自动发现运维故障)就包含单指标异常检测、多指标异常检测、多维度异常检测、日志异常检测等等。而单指标异常检测在检测业务、机器、网络、数据库、存储系统、批处理的异常时,其场景和检测侧重点会有所不同,因此需要针对精细化的具体场景进行 AIOps 异常检测算法的适当调整或适配。



为了避免 AIOps 场景多样化和精细化导致的落地工作量增加,我们必须把各类场景用到的 AIOps 算法共性部分抽象提炼出来作为公用模块,为多个场景服务。如下图所示,从日志数据测量出的指标数据的异常检测,就可以复用单指标异常检测这一算法模块,并且这一算法模块已经服务化,即可以通过 API 直接调用。所以我们说的第六个趋势就是 AIOps 算法服务化,提升了效率,让整体服务得更好。



在 AIOps 场景多样化、场景精细化、算法服务化的前提下,第七个趋势,即 AIOps 技术平台化也就水到渠成了。AIOps 技术平台化打穿多个场景、多个数据源、多个算法。如下图所示,上面输入的是各种运维监控数据,输出的就是我们所需要的各种运维智能,中间是各种服务化的 AIOps 算法。不管具体的某个运维场景有什么样的特点,我们都可以通过整体平台进行自由组合和编排,从而高效落地该运维场景,避免传统方法的重复低效落地。



这也就引出了第八个趋势:AIOps 新算法落地加速化。以往一个新算法研制出来后,需要大量的工程工作配合才能让新算法产生实际效果。有了平台化之后,只需要通过编排把该新算法、新算法所需数据、已有工程工作“串”在一起,就能够快速落地。比如做了一个 0day 攻击检测算法 ZeroWall,我们在一家具体机构进行尝试的时候,一周内捕获 28 种 0day 攻击,每天捕获上万条 0day 攻击,每天误报数 0 到 6 个。如果按照以往方法,我们要花大量的时间去做 ZeroWall 的落地工作,而有了 AIOps 平台化, ZeroWall 的落地工作就快了很多。



在过去半年期间,各个行业的合作伙伴都提出了 AIOps 成熟度评估标准化的需求,而银保监会、证监会、人行、工信部相关领导也都表示会支持。这个事情我也已经着手联合各方开始做,预计一两年的时间才能做出一个切实可行的标准。



总结一下 AIOps 的九大趋势:行业多样化、产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化、成熟度评估标准化。这九大趋势将助力 AIOps 在今后的几年起飞、爆发。


本文转载自成哥的世界公众号。


原文链接:https://mp.weixin.qq.com/s/N3TqbcJvl6YhGvnLNg89AA


2020-03-16 20:332045

评论

发布
暂无评论
发现更多内容

基于YOLOv8的多目标风力涡轮机、天线、烟囱、电力线检测|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!

申公豹

yolov8

ACME协议

八苦-瞿昙

一文彻底搞懂javascript中的undefined

量贩潮汐·WholesaleTide

JavaScript 前端

暑期出境游用鸿蒙 5解锁新体验,海外自由行尽享“鸿蒙一夏”

最新动态

Flink Forward Asia 2025 城市巡回 · 上海站

Apache Flink

大数据 flink 实时计算

揭秘 Databend 向量索引,加速 AI 应⽤的数据引擎

Databend

远程访问Docker-Android模拟器

贝锐

android 内网穿透 Docker 镜像

神经符号一体化-打通数据驱动与规则推理的最后一公里

申公豹

人工智能、

物流KA商家业务监控能力建设与实践

京东科技开发者

低代码的技术的生态与未来,让代码自由呼吸

秃头小帅oi

如何通过重定向参数实现账户劫持并获取2500美元漏洞赏金

qife

漏洞挖掘 xss攻击

揭露利用Tor网络的Docker漏洞攻击链

qife

容器安全 网络攻击

大数据-52 Kafka 架构全解析:高吞吐、高可用分布式消息系统的核心奥秘

武子康

Java 大数据 kafka 分布式 消息队列

打印机安全漏洞:网络攻击的宽阔入口

qife

网络安全 漏洞管理

AI如何让企业 IT 做好审计准备?-ManageEngine卓豪

ServiceDesk_Plus

ManageEngine卓豪

3个月,上百家企业交流,和大家聊聊AI应用的落地实践(开篇)

阿里巴巴云原生

阿里云 AI 云原生

Undertow 可观测性最佳实践

观测云

Undertow

数据湖产品全解析:2025 年主流解决方案选型指南

镜舟科技

云计算 数据仓库 数据湖 StarRocks 湖仓一体

TapData 出席 TDBC 2025 可信数据库发展大会,分享“实时+信创”时代的数据基础设施演进路径

tapdata

实时数据平台 信创数据库 无代码CDC 增量物化视图 实时数据服务

Django集成Swagger全指南:两种实现方案详解

不在线第一只蜗牛

django

100%开源!行业首个企业级智能体

京东科技开发者

Coze 开源了!所有人都可以免费使用了

Immerse

coze Coze开源

spark-sql优化简述

天翼云开发者社区

sql 大数据

数据湖典型架构解析:2025 年湖仓一体化解决方案

镜舟科技

数据湖 数据分析 数据处理 StarRocks 湖仓一体

云上AI推理平台全掌握 (5):大模型异步推理服务

阿里云大数据AI技术

人工智能 大数据 大模型 推理服务 异步推理

今天凌晨,字节开源 Coze,如何白嫖?

程序员晚枫

开源 工作流 智能体 coze

巴克莱银行大规模部署Microsoft Copilot至10万员工,加速AI应用进程

qife

人工智能 微软365

一次线上生产库的全流程切换完整方案

京东科技开发者

本地(或自下载)浏览器插件 安装指南

京东科技开发者

Lakehouse x AI ,打造智能 BI 新体验

StarRocks

AI LakeHouse StarRocks 智能 BI 云原生·

EyeWitness工具:渗透测试中快速发现漏洞的利器

qife

渗透测试 EyeWitness

AIOps九大发展趋势_语言 & 开发_成哥的世界_InfoQ精选文章