写点什么

LLM 和多 Agent 在运维领域的落地经验|QCon

邓艳琴

  • 2024-02-23
    北京
  • 本文字数:2567 字

    阅读完需:约 8 分钟

大小:1.30M时长:07:33
LLM 和多 Agent 在运维领域的落地经验|QCon

在数字化时代,企业和组织的 IT 系统变得越来越复杂,运维工作也变得越来越繁琐和困难。为了解决这些问题,AIOps 智能运维技术应运而生,而大模型的出现,为 AIOps 更强大的计算、决策与自学能力,极大地提升了 IT 运营的自动化和效率。在大模型的加持下,新时代的智能运维方案具有以下优点:

  • 学习与适应:大模型能从数据中学习并适应环境变化,及时识别并调整模型以应对 IT 运营数据中的微妙变动。

  • 预测性分析:通过对历史数据的深度分析,大模型能够预测未来 IT 运营趋势,提前预警潜在系统故障。

  • 自然语言处理:大模型能够理解人类语言,实现自然高效的互动,如解读用户对系统性能问题的反馈,并推测可能原因。

  • 自动决策:面对复杂的 IT 问题时,大模型能够综合考量多个变量,计算最佳解决方案并实时执行,实现问题自动解决。

  • 端到端自动化:大模型可实现从问题发现到解决方案确定再到实施的全流程自动化,从而提升生产力并减少人工干预需求。

  • 异常检测:通过深入分析历史趋势和性能指标,大模型能敏锐捕捉到不易被人类察觉的异常现象。


华为在 LLM 和 Multi-agent 在运维领域的实验探索有了不错的经验,即将与 4 月 11-13 日举办的 QCon 全球软件开发大会暨智能软件开发生态展邀请到华为集团 IT 平台服务部算法科学家张曦博士前来分享。她是犹他州立大学统计学博士,研究方向为 AI for Data、AI for BI、AIOps,时间序列分析等;具有丰富的人工智能在企业场景落地应用的成功经验,应用场景覆盖营、销、服、供、采、制、研发等多领域,支撑华为集团 600+ 业务应用 +AI,带领团队成功攻克 5+ 企业技术难题,并主导发布多个 AI 服务。


她将从智能运维面临的挑战和痛点出发,介绍在企业运维领域应用 AIGC 的实践案例,提出以 LLM 为中心,基于多 Agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。



该方案亮点突出,可实现多 Agent 协同完成运维主流程,异常检测->根因定位->故障分析->修复建议,且框架与算法不依赖具体特定应用场景,结合大模型实现较强的泛化能力


并且,如果你也对运维领域如何有效抑制大模型幻觉,提升问题处理的准确率,如何将传统运维积累和沉淀的海量知识快速激活,结合大模型相关能力有效解决运维问题等相关话题感兴趣,欢迎听取张曦博士的分享。


围绕着“效能”,本届大会策划了多个相关分论坛,邀请了多位业界知名大咖前来交流。


柯旻,「智能运维大模型」分论坛出品人,字节跳动基础架构 SRE 负责人,负责整体字节跳动基础架构全球相关基础组件产品的稳定性、成本优化、运维产品开发、智能运维等相关工作。


王宁,「智能运维大模型」分论坛演讲嘉宾,北京大学统计硕士,字节跳动基础架构 SRE 数据化方向技术专家,关注稳定性,成本与效率。在智能运维 aiops 和机器学习领域有多年工作经验,包括异常检测,根因定位,大语言模型等。在去年的 Aiops 智能运维挑战赛 2023 上,以“SRE-Copliot:基于大语言模型的智能运维架构”方案获得冠军,在本次会议中,他将介绍最新的实践经验。


陈鑫(神秀),「下一代生产力工具」分论坛出品人 &演讲嘉宾,阿里云云效、通义灵码产品技术负责人,致力于企业研发效率、产品质量、DevOps 方向研究和探索。2011 年加入阿里,带领过大数据测试团队、测试工具研发团队、研发平台团队。对研发协同、测试、交付、运维领域都有很深的见解。目前正在带领团队向云原生、极致效率、智能化等领域进行持续演进。


吴玮琦,「下一代生产力工具」分论坛演讲嘉宾,百度工程效能部高级研发工程师 负责智能代码助手 Comate 客户端、云开发平台 iCoding 等代码服务研发工作,参与文心一言代码相关能力数据建设。他将分享的题目是《智能研发经验及 Comate 开放平台》。


茹炳晟,「效能工程新时代」分论坛出品人,腾讯 Tech Lead,腾讯研究院特约研究员,中国计算机学会 (CCF)TF 研发效能 SIG 主席,中国通信标准化协会 TC608 云计算标准和开源推进委员会云上软件工程工作组副组长,“软件研发效能度量规范“标准核心编写专家,中国商业联合会互联网应用技术委员会智库专家,多本技术畅销书作者,著作有《测试工程师全栈技术进阶与实践》《软件研发效能提升之美》《多模态大模型技术原理与实战》《高效自动化测试平台: 设计与开发实战》《软件研发效能提升实践》和《软件研发效能权威指南》等,译作有《持续架构实践》和《现代软件工程》等。公众号“茹炳晟聊软件研发”主理人。


张宇辰,「效能工程新时代」分论坛演讲嘉宾,毕业于上海交通大学,毕业后一直在互联网研发领域工作。曾经在网易有道任职,自 2012 年开始在猿辅导,担任过前端工程师、服务端工程师、业务研发经理、基础架构负责人等多种不同职能角色。对于前后端软件开发、技术管理有着丰富经验。他将分享《If It Hurts, Do It More Often ——Motiff 的主干开发实践》。


唐辉,「效能工程新时代」分论坛演讲嘉宾,百度资深工程师,2017 年加入百度,2019 年带领 10+ 同学从 0 到 1 建设云上百度,完成统一账户权限、统一 Console、预算管理、透明账单等混合云能力建设,达成公司三年上云的战略目标。2023 年随着大模型的发展,开始负责 DevOps 产品的智能化建设,目前百度内周渗透用户超过 60%。此外,在微前端、性能优化、体验优化、To B 多版本管理等方向有深入探索和落地。他将分享《大模型赋能 DevOps,研发全环节提速》。


朱宏宝,「效能工程新时代」分论坛演讲嘉宾,字节跳动客户端测试技术专家,十余年软件测试与技术管理工作经验,有服务端、移动端业务测试,近几年主要从事效能平台工具开发,负责过多个公司级效能平台从 0-1 建设。曾就职于贝壳找房、滴滴出行、京东等公司。目前就职于字节跳动,负责移动端智能化测试建设。他将分享《字节移动端智能化测试实践》。


【活动推荐】

 为了提供更丰富多元的交流平台,QCon 全球软件开发大会将不再局限于传统的分享与研讨模式,而是全面整合为集技术分享、深度研讨和前沿展览于一体的综合性会展活动,并正式更名为【QCon 全球软件开发大会暨智能软件开发生态展】。

同时,会议正式改期为:2024 年 4 月 11-13 日,地点:北京·国测国际会议会展中心。


会议现已进入 8 折早鸟购票阶段,错失 7 折特惠的朋友们,可以联系票务经理 17310043226 。点击此处了解大会更多详情,期待与各位开发者现场交流。

2024-02-23 17:559169

评论 1 条评论

发布
用户头像
在讨论LLM和多Agent在运维领域的实践时, 我们很容易忽视了一点:技术的进步和运用并非一蹴而就。从历史的角度来看,人工智能的发展正像莱布尼茨概念记号的提出,初始不被理解,却为后来逻辑编程奠定基石。运维领域利用AI来提高效率和预测性维护,本是技术发展过程中自然而然的进步。而大模型的运用更是提出了新的解决方案。如同任何技术革新,其真正价值和潜能往往需要时间来验证并优化。
2024-02-27 10:50 · 北京
回复
没有更多了
发现更多内容

一文读懂责任分配矩阵,解决你80%的项目难题

敏捷开发

项目管理 Scrum 敏捷开发 责任分配矩阵 RACI矩阵

手把手实践丨基于STM32+华为云设计的智慧烟感系统

华为云开发者联盟

云计算 华为云 华为云开发者联盟 企业号 6 月 PK 榜

CodeWhisperer 初体验

天黑黑

AI 亚马逊云 CodeWhisperer

复杂Flink任务Task均衡调度和优化措施

Openlab_cosmoplat

大数据

【5.26-6.02】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

人工智能工程总体介绍

紫晖

人工智能 软件工程 数据开发

一文回顾 Boundless Hackathon at Stanford 首期 Workshop

鳄鱼视界

让AI无处不在!Intel拿出全新VPU:超高能效碾压GPU

E科讯

TiDB集群数据库灾难恢复手册

TiDB 社区干货传送门

管理与运维 备份 & 恢复

堡垒机重要吗?为什么?求解!

行云管家

堡垒机 安全运维 录像审计

一次网络请求中的流量分发过程 | 京东云技术团队

京东科技开发者

数据传输 企业号 6 月 PK 榜 流量分发 网络请求

强化学习基础篇[2]:SARSA、Q-learning算法简介、应用举例、优缺点

汀丶人工智能

人工智能 深度学习 强化学习

含有CPU芯片的PCB设计需要考虑的五个主要方面

华秋电子

秒验 iOS端集成指南

MobTech袤博科技

重新思考流处理与流数据库

吴英骏

开源 云原生 流处理 ​Rust 实时数据库

BFF层聚合查询服务异步改造及治理实践 | 京东云技术团队

京东科技开发者

优化技巧 企业号 6 月 PK 榜 BFF层 异步优化

简洁实用的文本编辑器:FSNotes中文版

真大的脸盆

Mac Mac 软件 文本编辑器 文本管理 文本处理工具

单点登录的三种实现方式

Authing

SSO 单点登录

玩转服务器之应用篇:从零开始构建小型高可用环境

京东科技开发者

高可用 云主机 云服务器 企业号 6 月 PK 榜

rocketmq4 docker安装 阿里云linux2(centos7)

folo

Docker centos RocketMQ部署

TiDB 落地SAS机器实践

TiDB 社区干货传送门

实践案例 应用适配 HTAP 场景实践

TiDB数据迁移实践DM工具

TiDB 社区干货传送门

迁移 实践案例

我又和redis超时杠上了

蓝胖子的编程梦

redis 性能分析 云服务器 线上事故 接口超时

强化学习基础篇【1】:基础知识点、马尔科夫决策过程、蒙特卡洛策略梯度定理、REINFORCE 算法

汀丶人工智能

人工智能 深度学习 强化学习

行云堡垒V7亮点有哪些?具体看这里!

行云管家

IT运维 行云堡垒

世界500强开滦集团的财务共享建设路径

用友BIP

财务共享

客服都要下岗了? 当ChatGPT遇见私有数据,秒变AI智能客服!

BeeWorks

大型 3D 互动开发和优化实践 | 京东云技术团队

京东科技开发者

游戏 3D 企业号 6 月 PK 榜 互动游戏

这本数智平台白皮书讲透了大型企业数智化升级业务痛点

用友BIP

白皮书 数智底座 数智平台 平台白皮书 数智化转型白皮书

LLM 和多 Agent 在运维领域的落地经验|QCon_研发效能_InfoQ精选文章