写点什么

AIOps 九大发展趋势

  • 2020-03-16
  • 本文字数:2747 字

    阅读完需:约 9 分钟

AIOps九大发展趋势

大家知道,运维是数字世界的的基础设施级别的技术。随着支撑数字世界的软硬件系统越来越庞大、越来越复杂,运维对智能化的要求就会越来越高。所以我们说,AIOps(智能运维)是运维技术发展必然的趋势。


AIOps 在国内正式提出来到现在的实际落地有两三年了,也取得了初步的落地效果。那么下一步到底怎么做?做什么?未来几年内能进一步达到什么样的效果?今天我就分享下我最近总结出来的 AIOps 发展九大趋势。


做趋势预测是有很大挑战和风险的,好在我之前在 AIOps 领域还有过成功的预测。



我在 2018 年 1 月曾给出一个 AIOps 宏观预测:我说 2018 年将是 AIOps 在中国落地的元年,而据我所知在 2018 年的确有小几十个 AIOps 项目开始落地,也就是说我的这个预测的确成为了现实。2019 年 1 月我说 2019 年是 AIOps 快速发展的一年,而实际上截止 2019 年 8 月份在国内有大几十个 AIOps 项目开始推进;与此同时,我们看到 2019 年初的时候人行以及各大银行也发文阐述支持 AIOps 方向。


我在 AIOps 具体技术上也有个算是成功的预测。2018 年中的时候我已经在公开演讲中讲 AIOps 平台化这个概念了;之后在 2018 年底,Gartner 的报告也基于与世界范围内的客户和厂商的访谈正式提出了 AIOps 平台化这一方向。


下面这幅图的左下部分是我的团队给出的 AIOps 平台架构,该图的右下部分是 2009 年我在 AT&T 工作时做的智能运维平台的架构,可以看出两幅图在概念上是非常相似的。所以,从这个例子大家可以看出,我能够先于 Gartner 提出 AIOps 平台的概念,不是因为真有什么能看到未来的“水晶球”,而是因为我之前在其它场景下做过类似工作,并且在 AIOps 方向不断努力推进。当我看到需求到了,相关条件成熟了,自然而然就能判断应该做 AIOps 平台了。所以,所谓的预测能力无非是经验的积累、不断观察、思考,最重要的是不断的亲手实践,就像林肯和图灵奖得主 Alan Kay(面向对象编程语言的发明者)所言,预测未来最好的方法就是亲手创造/发明这个未来。



下面我总结一下基于经验、访谈、观察、思考和实践得出的 AIOps 发展九大趋势,即行业多样化、产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化、成熟度评估的标准化。



第一个趋势就是 AIOps 落地的多样化,这个结论是基于我通过多种渠道采集到的信息。我们自己有一个公众号“智能运维前沿”,马上要突破 10000 个用户了;我们还有一个超过千人 AIOps 群,已经成功举办了两届 AIOps 挑战赛,我一年中会到几十家各行各业机构去进行现场交流。从上述多种渠道采集到的信息清楚表明:现在开始落地 AIOps 的,除了互联网公司、银行以外,证券、保险,电力、运营商、工业制造、国家机关、自动驾驶公司也都在尝试 AIOps 落地。



第二个趋势是 AIOps 产业生态化。各个行业都在试图尝试落地 AIOps,给 AIOps 方向提供了一个很好的产业基础。“产、学、研、用”各方也都在积极跟进,形成了一个 AIOps 生态系统。在这个生态系统里,专业的人负责专业的事,有越来越多的学术机构从事 AIOps 原理研究;由机构用户负责提出实际需求,由有预研能力的厂商把 AIOps 原理上的突破变成实际落地效果;有负责数据采集、接入、存储等的厂商,还有负责集成、交付、维保等的厂商。也就是说,“学、研、产、用”几方专业分工,通力协作。AIOps 产业生态化在 AIOps 落地过程中是一个重要的里程碑,会大力推动 AIOps 的更快落地。



第三个趋势是 AIOps 数据多样化。数据中心的系统物理架构和软件架构都非常庞大复杂。因此我们必须采集、治理、融合多种运维数据源、从中提取对运维最有用的信息,帮助我们了解数据中心最新最全的运行状态, 从而为 AIOps 的众多场景服务。因此我们说 AIOps 数据多样化是必然趋势。



第四个趋势是 AIOps 场景多样化。下图罗列了一些我们与合作伙伴合作、交流时遇到的具体场景。我们分成几个大场景:即异常发现、事件发现、事件分析、系统画像、图谱丰富等。每一个大场景会包含很多的具体场景,比如“事件分析”大场景就包括“异常机器定位”、“交易链条定位”、“多维度异常定位”等多种类型的事件分析。也就是说,当用户认识到 AIOps 能实际帮助到运维的时候,会自发与生态系统中的伙伴共同找到越发多样化的 AIOps 场景。



第五个趋势是 AIOps 场景精细化。如下图所示,异常检测(也就是通过分析监控数据自动发现运维故障)就包含单指标异常检测、多指标异常检测、多维度异常检测、日志异常检测等等。而单指标异常检测在检测业务、机器、网络、数据库、存储系统、批处理的异常时,其场景和检测侧重点会有所不同,因此需要针对精细化的具体场景进行 AIOps 异常检测算法的适当调整或适配。



为了避免 AIOps 场景多样化和精细化导致的落地工作量增加,我们必须把各类场景用到的 AIOps 算法共性部分抽象提炼出来作为公用模块,为多个场景服务。如下图所示,从日志数据测量出的指标数据的异常检测,就可以复用单指标异常检测这一算法模块,并且这一算法模块已经服务化,即可以通过 API 直接调用。所以我们说的第六个趋势就是 AIOps 算法服务化,提升了效率,让整体服务得更好。



在 AIOps 场景多样化、场景精细化、算法服务化的前提下,第七个趋势,即 AIOps 技术平台化也就水到渠成了。AIOps 技术平台化打穿多个场景、多个数据源、多个算法。如下图所示,上面输入的是各种运维监控数据,输出的就是我们所需要的各种运维智能,中间是各种服务化的 AIOps 算法。不管具体的某个运维场景有什么样的特点,我们都可以通过整体平台进行自由组合和编排,从而高效落地该运维场景,避免传统方法的重复低效落地。



这也就引出了第八个趋势:AIOps 新算法落地加速化。以往一个新算法研制出来后,需要大量的工程工作配合才能让新算法产生实际效果。有了平台化之后,只需要通过编排把该新算法、新算法所需数据、已有工程工作“串”在一起,就能够快速落地。比如做了一个 0day 攻击检测算法 ZeroWall,我们在一家具体机构进行尝试的时候,一周内捕获 28 种 0day 攻击,每天捕获上万条 0day 攻击,每天误报数 0 到 6 个。如果按照以往方法,我们要花大量的时间去做 ZeroWall 的落地工作,而有了 AIOps 平台化, ZeroWall 的落地工作就快了很多。



在过去半年期间,各个行业的合作伙伴都提出了 AIOps 成熟度评估标准化的需求,而银保监会、证监会、人行、工信部相关领导也都表示会支持。这个事情我也已经着手联合各方开始做,预计一两年的时间才能做出一个切实可行的标准。



总结一下 AIOps 的九大趋势:行业多样化、产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化、成熟度评估标准化。这九大趋势将助力 AIOps 在今后的几年起飞、爆发。


本文转载自成哥的世界公众号。


原文链接:https://mp.weixin.qq.com/s/N3TqbcJvl6YhGvnLNg89AA


2020-03-16 20:332179

评论

发布
暂无评论
发现更多内容

NoahTenet诺亚信条软件系统APP开发

系统开发

为了搞清楚类加载,竟然手撸JVM!

小傅哥

JVM 小傅哥 类加载 生命周期 加载机制

IPFS云算力挖矿系统开发详解案例及源码

系统开发咨询1357O98O718

云算力挖矿系统开发详解 云算力APP系统软件开发 云算力模式系统开发源码 云算力软件系统开发定制

Java多线程编程核心技术

田维常

多线程

重新发现科技与人文的互动

脑极体

SpringCloudGateway(一) 概览

Java SpringcloudGateway

MySQL为Null会导致5个问题,个个致命!

王磊

MySQL MySQL使用

IPFS分布式存储矿机系统APP软件开发

系统开发

跨年巨作!13万字!腾讯高工纯手写“JDK源码笔记”直接带你飙向实战

比伯

Java 编程 架构 面试 计算机

如何使用mock应对测试所需随机数据

华为云开发者联盟

测试 数据 Mock

通达同城快递设计方案

garlic

架构师训练营第 1 期

送你一份迷你书,全面了解如何做好大促技术备战

京东科技开发者

DevOps

爆赞!P8架构师总结29篇多线程与高并发+设计模式核心笔记

Java架构追梦

Java 学习 架构 面试 多线程高并发

技术干货 | 六分钟学会使用 HBuilder 引入构建 mPaaS 小程序

蚂蚁集团移动开发平台 mPaaS

小程序 uni-app mPaaS

令数字起舞,让自然微笑:TECH4ALL的2020启示录

脑极体

IPFS挖矿矿机系统开发方案丨IPFS挖矿矿机源码案例

系统开发咨询1357O98O718

IPFS云算力挖矿系统开发 IPFS算力挖矿系统开发搭建

5G与4G的差别及应用

anyRTC开发者

人工智能 android AI 5G WebRTC

盘点2020 | YourBatman 2020年感悟关键词:科比、裁员、管理层、活着

YourBatman

裁员 盘点2020 科比 管理层 活着

Spring cloud Gateway(二) 一个Http请求的流程解析

Java 网关

阿里面试:Mybatis中方法和SQL是怎么关联起来的呢?

田维常

mybatis

LeetCode题解:239. 滑动窗口最大值,二叉堆,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

鸟枪换炮,利用python3对球员做大数据降维(因子分析得分),为C罗找到合格僚机

刘悦的技术博客

Python 数据分析 特征选择 降维

公安警务报警系统,二维码一键定位报警

t13823115967

二维码定位报警系统开发 微警务 二维码定位

智慧社区综合应用平台搭建,社区管理解决方案

t13823115967

智慧社区管理平台开发 智慧平安社区平台建设

AAAI 2021论文:利用深度元学习对城市销量进行预测(附论文下载)

京东科技开发者

数据库 大数据 时序预测

RPC Demo(二) 基于 Zookeeper 的服务发现

Java zookeeper RPC 服务发现

IPFS挖矿系统开发详情案例

系统开发咨询1357O98O718

IPFS云算力挖矿系统开发 IPFS算力挖矿软件系统开发

母鸡下蛋实例:多线程通信生产者和消费者wait/notify和condition/await/signal条件队列

叫练

多线程与高并发 Wait lock 线程互斥 await

CKLC挖矿矿机系统开发案例介绍

系统开发咨询1357O98O718

CKLC挖矿矿机系统软件开发 CKLC挖矿矿机系统开发 CKLC挖矿矿机APP系统开发

分享一个普通程序员的“沪漂”六年的历程以及感想

程序员老猫

回忆录 经历 年终总结 沪漂 上海买房

测开之函数进阶· 第6篇《闭包》

清菡软件测试

测试开发

AIOps九大发展趋势_语言 & 开发_成哥的世界_InfoQ精选文章