写点什么

LLM 和多 Agent 在运维领域的落地经验|QCon

邓艳琴

  • 2024-02-23
    北京
  • 本文字数:2567 字

    阅读完需:约 8 分钟

大小:1.30M时长:07:33
LLM 和多 Agent 在运维领域的落地经验|QCon

在数字化时代,企业和组织的 IT 系统变得越来越复杂,运维工作也变得越来越繁琐和困难。为了解决这些问题,AIOps 智能运维技术应运而生,而大模型的出现,为 AIOps 更强大的计算、决策与自学能力,极大地提升了 IT 运营的自动化和效率。在大模型的加持下,新时代的智能运维方案具有以下优点:

  • 学习与适应:大模型能从数据中学习并适应环境变化,及时识别并调整模型以应对 IT 运营数据中的微妙变动。

  • 预测性分析:通过对历史数据的深度分析,大模型能够预测未来 IT 运营趋势,提前预警潜在系统故障。

  • 自然语言处理:大模型能够理解人类语言,实现自然高效的互动,如解读用户对系统性能问题的反馈,并推测可能原因。

  • 自动决策:面对复杂的 IT 问题时,大模型能够综合考量多个变量,计算最佳解决方案并实时执行,实现问题自动解决。

  • 端到端自动化:大模型可实现从问题发现到解决方案确定再到实施的全流程自动化,从而提升生产力并减少人工干预需求。

  • 异常检测:通过深入分析历史趋势和性能指标,大模型能敏锐捕捉到不易被人类察觉的异常现象。


华为在 LLM 和 Multi-agent 在运维领域的实验探索有了不错的经验,即将与 4 月 11-13 日举办的 QCon 全球软件开发大会暨智能软件开发生态展邀请到华为集团 IT 平台服务部算法科学家张曦博士前来分享。她是犹他州立大学统计学博士,研究方向为 AI for Data、AI for BI、AIOps,时间序列分析等;具有丰富的人工智能在企业场景落地应用的成功经验,应用场景覆盖营、销、服、供、采、制、研发等多领域,支撑华为集团 600+ 业务应用 +AI,带领团队成功攻克 5+ 企业技术难题,并主导发布多个 AI 服务。


她将从智能运维面临的挑战和痛点出发,介绍在企业运维领域应用 AIGC 的实践案例,提出以 LLM 为中心,基于多 Agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。



该方案亮点突出,可实现多 Agent 协同完成运维主流程,异常检测->根因定位->故障分析->修复建议,且框架与算法不依赖具体特定应用场景,结合大模型实现较强的泛化能力


并且,如果你也对运维领域如何有效抑制大模型幻觉,提升问题处理的准确率,如何将传统运维积累和沉淀的海量知识快速激活,结合大模型相关能力有效解决运维问题等相关话题感兴趣,欢迎听取张曦博士的分享。


围绕着“效能”,本届大会策划了多个相关分论坛,邀请了多位业界知名大咖前来交流。


柯旻,「智能运维大模型」分论坛出品人,字节跳动基础架构 SRE 负责人,负责整体字节跳动基础架构全球相关基础组件产品的稳定性、成本优化、运维产品开发、智能运维等相关工作。


王宁,「智能运维大模型」分论坛演讲嘉宾,北京大学统计硕士,字节跳动基础架构 SRE 数据化方向技术专家,关注稳定性,成本与效率。在智能运维 aiops 和机器学习领域有多年工作经验,包括异常检测,根因定位,大语言模型等。在去年的 Aiops 智能运维挑战赛 2023 上,以“SRE-Copliot:基于大语言模型的智能运维架构”方案获得冠军,在本次会议中,他将介绍最新的实践经验。


陈鑫(神秀),「下一代生产力工具」分论坛出品人 &演讲嘉宾,阿里云云效、通义灵码产品技术负责人,致力于企业研发效率、产品质量、DevOps 方向研究和探索。2011 年加入阿里,带领过大数据测试团队、测试工具研发团队、研发平台团队。对研发协同、测试、交付、运维领域都有很深的见解。目前正在带领团队向云原生、极致效率、智能化等领域进行持续演进。


吴玮琦,「下一代生产力工具」分论坛演讲嘉宾,百度工程效能部高级研发工程师 负责智能代码助手 Comate 客户端、云开发平台 iCoding 等代码服务研发工作,参与文心一言代码相关能力数据建设。他将分享的题目是《智能研发经验及 Comate 开放平台》。


茹炳晟,「效能工程新时代」分论坛出品人,腾讯 Tech Lead,腾讯研究院特约研究员,中国计算机学会 (CCF)TF 研发效能 SIG 主席,中国通信标准化协会 TC608 云计算标准和开源推进委员会云上软件工程工作组副组长,“软件研发效能度量规范“标准核心编写专家,中国商业联合会互联网应用技术委员会智库专家,多本技术畅销书作者,著作有《测试工程师全栈技术进阶与实践》《软件研发效能提升之美》《多模态大模型技术原理与实战》《高效自动化测试平台: 设计与开发实战》《软件研发效能提升实践》和《软件研发效能权威指南》等,译作有《持续架构实践》和《现代软件工程》等。公众号“茹炳晟聊软件研发”主理人。


张宇辰,「效能工程新时代」分论坛演讲嘉宾,毕业于上海交通大学,毕业后一直在互联网研发领域工作。曾经在网易有道任职,自 2012 年开始在猿辅导,担任过前端工程师、服务端工程师、业务研发经理、基础架构负责人等多种不同职能角色。对于前后端软件开发、技术管理有着丰富经验。他将分享《If It Hurts, Do It More Often ——Motiff 的主干开发实践》。


唐辉,「效能工程新时代」分论坛演讲嘉宾,百度资深工程师,2017 年加入百度,2019 年带领 10+ 同学从 0 到 1 建设云上百度,完成统一账户权限、统一 Console、预算管理、透明账单等混合云能力建设,达成公司三年上云的战略目标。2023 年随着大模型的发展,开始负责 DevOps 产品的智能化建设,目前百度内周渗透用户超过 60%。此外,在微前端、性能优化、体验优化、To B 多版本管理等方向有深入探索和落地。他将分享《大模型赋能 DevOps,研发全环节提速》。


朱宏宝,「效能工程新时代」分论坛演讲嘉宾,字节跳动客户端测试技术专家,十余年软件测试与技术管理工作经验,有服务端、移动端业务测试,近几年主要从事效能平台工具开发,负责过多个公司级效能平台从 0-1 建设。曾就职于贝壳找房、滴滴出行、京东等公司。目前就职于字节跳动,负责移动端智能化测试建设。他将分享《字节移动端智能化测试实践》。


【活动推荐】

 为了提供更丰富多元的交流平台,QCon 全球软件开发大会将不再局限于传统的分享与研讨模式,而是全面整合为集技术分享、深度研讨和前沿展览于一体的综合性会展活动,并正式更名为【QCon 全球软件开发大会暨智能软件开发生态展】。

同时,会议正式改期为:2024 年 4 月 11-13 日,地点:北京·国测国际会议会展中心。


会议现已进入 8 折早鸟购票阶段,错失 7 折特惠的朋友们,可以联系票务经理 17310043226 。点击此处了解大会更多详情,期待与各位开发者现场交流。

2024-02-23 17:557851

评论 1 条评论

发布
用户头像
在讨论LLM和多Agent在运维领域的实践时, 我们很容易忽视了一点:技术的进步和运用并非一蹴而就。从历史的角度来看,人工智能的发展正像莱布尼茨概念记号的提出,初始不被理解,却为后来逻辑编程奠定基石。运维领域利用AI来提高效率和预测性维护,本是技术发展过程中自然而然的进步。而大模型的运用更是提出了新的解决方案。如同任何技术革新,其真正价值和潜能往往需要时间来验证并优化。
2024-02-27 10:50 · 北京
回复
没有更多了

模块六作业 微服务拆分

库尔斯

架构实战营

在线HTML转JSON工具

入门小站

工具

flask框架【入门学习笔记一】

恒山其若陋兮

5月月更

Linux 入门及常见Shell命令

宇宙之一粟

Linux Shell 5月月更

SAP OData V4 模型支持的一些数据绑定模式

Jerry Wang

JavaScript 前端开发 SAP ui5 5月月更

【C 语言】指针 Five 之 ["⚔ 野指针,🗡 如何规避野指针,💣 指针的未初始化,💣指针越界访问"]

謓泽

C语言 5月月更

电商系统微服务拆分

Trent

架构 微服务拆分 电商 训练营

PostgreSQL出现死锁怎么办?

慕枫技术笔记

数据库 5月月更

数学建模学习资料

乌龟哥哥

5月月更

[ CloudWeGo 社区动态 ] Kitex 电商项目案例

baiyutang

Go 微服务 5月月更

Kubernetes 节点弹性扩展实践组件 Amazon Karpenter:部署 GPU 推理应用

亚马逊云科技 (Amazon Web Services)

Kubernetes 部署

密码学系列之:在线证书状态协议OCSP详解

程序那些事

密码学 程序那些事 5月月更

VS Code配置markdown代码片段

空城机

前端 vscode 5月月更

小公司里面的 Python 后端,数据库(MySQL)到底要学习到什么程度?

梦想橡皮擦

5月月更

在线蚂蚁文,菊花文生成工具

入门小站

工具

python小知识-python 函数二三事

AIWeker

Python 5月月更

Amazon CodePipeline 与 GitHub 集成

亚马逊云科技 (Amazon Web Services)

GitHub Code

模块6作业提交

KennyQ

Java Core「1」JUC-线程基础

Samson

学习笔记 5月月更 Java core

Sentinel介绍与使用 收藏起来

牧小农

sentinel

架构学习(一)

爱晒太阳的大白

5月月更

拆分电商系统为微服务

Dean.Zhang

八、浅谈云原生监控

穿过生命散发芬芳

云原生 5月月更

谷歌三件套 - Bigtable

懒时小窝

bigtable 谷歌 谷歌三件套

Flutter 使用 Provider 实现嵌套状态管理

岛上码农

flutter ios 安卓开发 跨平台开发 5月月更

linux之crontab使用技巧

入门小站

Linux

数据结构-复杂度计算经典案例

芒果酱

数据结构 算法 5月月更

LinkedList 源码分析-迭代器

zarmnosaj

5月月更

react-router原理分析

正经工程师

React React-Router

SpringMVC源码分析:POST请求中的文件处理

程序员欣宸

Java spring 5月月更

【刷题第16天】数组中出现次数超过一半的数字

白日梦

5月月更

LLM 和多 Agent 在运维领域的落地经验|QCon_研发效能_InfoQ精选文章