AIOps九大发展趋势

2020 年 3 月 16 日

AIOps九大发展趋势

大家知道,运维是数字世界的的基础设施级别的技术。随着支撑数字世界的软硬件系统越来越庞大、越来越复杂,运维对智能化的要求就会越来越高。所以我们说,AIOps(智能运维)是运维技术发展必然的趋势。

AIOps 在国内正式提出来到现在的实际落地有两三年了,也取得了初步的落地效果。那么下一步到底怎么做?做什么?未来几年内能进一步达到什么样的效果?今天我就分享下我最近总结出来的 AIOps 发展九大趋势。

做趋势预测是有很大挑战和风险的,好在我之前在 AIOps 领域还有过成功的预测。

我在 2018 年 1 月曾给出一个 AIOps 宏观预测:我说 2018 年将是 AIOps 在中国落地的元年,而据我所知在 2018 年的确有小几十个 AIOps 项目开始落地,也就是说我的这个预测的确成为了现实。2019 年 1 月我说 2019 年是 AIOps 快速发展的一年,而实际上截止 2019 年 8 月份在国内有大几十个 AIOps 项目开始推进;与此同时,我们看到 2019 年初的时候人行以及各大银行也发文阐述支持 AIOps 方向。

我在 AIOps 具体技术上也有个算是成功的预测。2018 年中的时候我已经在公开演讲中讲 AIOps 平台化这个概念了;之后在 2018 年底,Gartner 的报告也基于与世界范围内的客户和厂商的访谈正式提出了 AIOps 平台化这一方向。

下面这幅图的左下部分是我的团队给出的 AIOps 平台架构,该图的右下部分是 2009 年我在 AT&T 工作时做的智能运维平台的架构,可以看出两幅图在概念上是非常相似的。所以,从这个例子大家可以看出,我能够先于 Gartner 提出 AIOps 平台的概念,不是因为真有什么能看到未来的“水晶球”,而是因为我之前在其它场景下做过类似工作,并且在 AIOps 方向不断努力推进。当我看到需求到了,相关条件成熟了,自然而然就能判断应该做 AIOps 平台了。所以,所谓的预测能力无非是经验的积累、不断观察、思考,最重要的是不断的亲手实践,就像林肯和图灵奖得主 Alan Kay(面向对象编程语言的发明者)所言,预测未来最好的方法就是亲手创造 / 发明这个未来。

下面我总结一下基于经验、访谈、观察、思考和实践得出的 AIOps 发展九大趋势,即行业多样化、产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化、成熟度评估的标准化。


第一个趋势就是 AIOps 落地的多样化,这个结论是基于我通过多种渠道采集到的信息。我们自己有一个公众号“智能运维前沿”,马上要突破 10000 个用户了;我们还有一个超过千人 AIOps 群,已经成功举办了两届 AIOps 挑战赛,我一年中会到几十家各行各业机构去进行现场交流。从上述多种渠道采集到的信息清楚表明:现在开始落地 AIOps 的,除了互联网公司、银行以外,证券、保险,电力、运营商、工业制造、国家机关、自动驾驶公司也都在尝试 AIOps 落地。

第二个趋势是 AIOps 产业生态化。各个行业都在试图尝试落地 AIOps,给 AIOps 方向提供了一个很好的产业基础。“产、学、研、用”各方也都在积极跟进,形成了一个 AIOps 生态系统。在这个生态系统里,专业的人负责专业的事,有越来越多的学术机构从事 AIOps 原理研究;由机构用户负责提出实际需求,由有预研能力的厂商把 AIOps 原理上的突破变成实际落地效果;有负责数据采集、接入、存储等的厂商,还有负责集成、交付、维保等的厂商。也就是说,“学、研、产、用”几方专业分工,通力协作。AIOps 产业生态化在 AIOps 落地过程中是一个重要的里程碑,会大力推动 AIOps 的更快落地。

第三个趋势是 AIOps 数据多样化。数据中心的系统物理架构和软件架构都非常庞大复杂。因此我们必须采集、治理、融合多种运维数据源、从中提取对运维最有用的信息,帮助我们了解数据中心最新最全的运行状态, 从而为 AIOps 的众多场景服务。因此我们说 AIOps 数据多样化是必然趋势。

第四个趋势是 AIOps 场景多样化。下图罗列了一些我们与合作伙伴合作、交流时遇到的具体场景。我们分成几个大场景:即异常发现、事件发现、事件分析、系统画像、图谱丰富等。每一个大场景会包含很多的具体场景,比如“事件分析”大场景就包括“异常机器定位”、“交易链条定位”、“多维度异常定位”等多种类型的事件分析。也就是说,当用户认识到 AIOps 能实际帮助到运维的时候,会自发与生态系统中的伙伴共同找到越发多样化的 AIOps 场景。

第五个趋势是 AIOps 场景精细化。如下图所示,异常检测(也就是通过分析监控数据自动发现运维故障)就包含单指标异常检测、多指标异常检测、多维度异常检测、日志异常检测等等。而单指标异常检测在检测业务、机器、网络、数据库、存储系统、批处理的异常时,其场景和检测侧重点会有所不同,因此需要针对精细化的具体场景进行 AIOps 异常检测算法的适当调整或适配。

为了避免 AIOps 场景多样化和精细化导致的落地工作量增加,我们必须把各类场景用到的 AIOps 算法共性部分抽象提炼出来作为公用模块,为多个场景服务。如下图所示,从日志数据测量出的指标数据的异常检测,就可以复用单指标异常检测这一算法模块,并且这一算法模块已经服务化,即可以通过 API 直接调用。所以我们说的第六个趋势就是 AIOps 算法服务化,提升了效率,让整体服务得更好。

在 AIOps 场景多样化、场景精细化、算法服务化的前提下,第七个趋势,即 AIOps 技术平台化也就水到渠成了。AIOps 技术平台化打穿多个场景、多个数据源、多个算法。如下图所示,上面输入的是各种运维监控数据,输出的就是我们所需要的各种运维智能,中间是各种服务化的 AIOps 算法。不管具体的某个运维场景有什么样的特点,我们都可以通过整体平台进行自由组合和编排,从而高效落地该运维场景,避免传统方法的重复低效落地。

这也就引出了第八个趋势:AIOps 新算法落地加速化。以往一个新算法研制出来后,需要大量的工程工作配合才能让新算法产生实际效果。有了平台化之后,只需要通过编排把该新算法、新算法所需数据、已有工程工作“串”在一起,就能够快速落地。比如做了一个 0day 攻击检测算法 ZeroWall,我们在一家具体机构进行尝试的时候,一周内捕获 28 种 0day 攻击,每天捕获上万条 0day 攻击,每天误报数 0 到 6 个。如果按照以往方法,我们要花大量的时间去做 ZeroWall 的落地工作,而有了 AIOps 平台化, ZeroWall 的落地工作就快了很多。

在过去半年期间,各个行业的合作伙伴都提出了 AIOps 成熟度评估标准化的需求,而银保监会、证监会、人行、工信部相关领导也都表示会支持。这个事情我也已经着手联合各方开始做,预计一两年的时间才能做出一个切实可行的标准。

总结一下 AIOps 的九大趋势:行业多样化、产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化、成熟度评估标准化。这九大趋势将助力 AIOps 在今后的几年起飞、爆发。

本文转载自成哥的世界公众号。

原文链接: https://mp.weixin.qq.com/s/N3TqbcJvl6YhGvnLNg89AA

2020 年 3 月 16 日 20:33 319

评论

发布
暂无评论
发现更多内容

Week11

丿淡忘

java安全编码指南之:基础篇

力软.net/java开发平台

高可用注意点

dony.zhang

高可用 高可用系统的架构 高可用系统的运维

USDT承兑商系统开发,USDT支付系统软件搭建

13530558032

合约跟单APP开发模式,合约跟单系统源码搭建

13530558032

java 是什么?作用是什么?

InfoQ_34a83d636158

解码微盟半年财报:同比增长59.9%,SaaS商业版图不断扩大

ToB行业头条

SaaS 微盟

架构训练营第十一周感悟

张锐

Grabana:使用 Golang 或 Yaml 生成 Grafana Dashboard

郭旭东

go golang Grafana

知乎李大海与阿里云贾扬清联合直播,AI大咖眼中的行业前景

InfoQ_967a83c6d0d7

XSKY S3 Console 为对象存储系统赋能

XSKY融合存储

Lambda架构已死,去ETL化的IOTA才是未来

易观大数据

力扣1514——概率最大的路径

健健

算法 最短路径

深圳数字货币交易所开发商,币币撮合交易软件开发

13530558032

30万奖金等你拿!Apache Flink 极客挑战赛入门指南(附Demo)

Apache Flink

flink

一个用户秘密加密验证功能

elfkingw

安全及高可用策略

Lane

极客大学架构师训练营

熔断、限流的一些理解

elfkingw

程序员不得不知的软技能

架构精进之路

软技能

作为程序员,推荐5种编程语言!

代码制造者

Python 编程语言 低代码 C语言 零代码

架构师0期Week11作业2

Nan Jiang

区块链钱包系统开发服务商,区块链钱包应用搭建

13530558032

《精益创业》续

孙苏勇

随笔杂谈 精益创业

OFD 版式技术解析系列(四):OFD文档解析流程

华宇法律科技

版式文档 OFD

账户经常被盗号怎么办?防盗“黑科技”了解一下

华为云开发者社区

华为云 云安全 主机安全 双因子认证 弱密码

架构训练营第十一周作业

张锐

IDEA插件之Mybatis Log plugin破解!!!

不才陈某

java hashcode idea插件

架构师0期Week11作业1

Nan Jiang

针对目前在线教育存在问题的解决方案

anyRTC开发者

WebRTC 在线教育 直播 安卓

一款JAVA快速开发平台,多项目整合,给开发提提速

力软.net/java开发平台

「Java 25周年」 工具软件 平台应用服务

源码解析 | 万字长文详解 Flink 中的 CopyOnWriteStateTable

Apache Flink

flink

AIOps九大发展趋势-InfoQ