2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

LLM 和多 Agent 在运维领域的落地经验|QCon

邓艳琴

  • 2024-02-23
    北京
  • 本文字数:2567 字

    阅读完需:约 8 分钟

大小:1.30M时长:07:33
LLM 和多 Agent 在运维领域的落地经验|QCon

在数字化时代,企业和组织的 IT 系统变得越来越复杂,运维工作也变得越来越繁琐和困难。为了解决这些问题,AIOps 智能运维技术应运而生,而大模型的出现,为 AIOps 更强大的计算、决策与自学能力,极大地提升了 IT 运营的自动化和效率。在大模型的加持下,新时代的智能运维方案具有以下优点:

  • 学习与适应:大模型能从数据中学习并适应环境变化,及时识别并调整模型以应对 IT 运营数据中的微妙变动。

  • 预测性分析:通过对历史数据的深度分析,大模型能够预测未来 IT 运营趋势,提前预警潜在系统故障。

  • 自然语言处理:大模型能够理解人类语言,实现自然高效的互动,如解读用户对系统性能问题的反馈,并推测可能原因。

  • 自动决策:面对复杂的 IT 问题时,大模型能够综合考量多个变量,计算最佳解决方案并实时执行,实现问题自动解决。

  • 端到端自动化:大模型可实现从问题发现到解决方案确定再到实施的全流程自动化,从而提升生产力并减少人工干预需求。

  • 异常检测:通过深入分析历史趋势和性能指标,大模型能敏锐捕捉到不易被人类察觉的异常现象。


华为在 LLM 和 Multi-agent 在运维领域的实验探索有了不错的经验,即将与 4 月 11-13 日举办的 QCon 全球软件开发大会暨智能软件开发生态展邀请到华为集团 IT 平台服务部算法科学家张曦博士前来分享。她是犹他州立大学统计学博士,研究方向为 AI for Data、AI for BI、AIOps,时间序列分析等;具有丰富的人工智能在企业场景落地应用的成功经验,应用场景覆盖营、销、服、供、采、制、研发等多领域,支撑华为集团 600+ 业务应用 +AI,带领团队成功攻克 5+ 企业技术难题,并主导发布多个 AI 服务。


她将从智能运维面临的挑战和痛点出发,介绍在企业运维领域应用 AIGC 的实践案例,提出以 LLM 为中心,基于多 Agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。



该方案亮点突出,可实现多 Agent 协同完成运维主流程,异常检测->根因定位->故障分析->修复建议,且框架与算法不依赖具体特定应用场景,结合大模型实现较强的泛化能力


并且,如果你也对运维领域如何有效抑制大模型幻觉,提升问题处理的准确率,如何将传统运维积累和沉淀的海量知识快速激活,结合大模型相关能力有效解决运维问题等相关话题感兴趣,欢迎听取张曦博士的分享。


围绕着“效能”,本届大会策划了多个相关分论坛,邀请了多位业界知名大咖前来交流。


柯旻,「智能运维大模型」分论坛出品人,字节跳动基础架构 SRE 负责人,负责整体字节跳动基础架构全球相关基础组件产品的稳定性、成本优化、运维产品开发、智能运维等相关工作。


王宁,「智能运维大模型」分论坛演讲嘉宾,北京大学统计硕士,字节跳动基础架构 SRE 数据化方向技术专家,关注稳定性,成本与效率。在智能运维 aiops 和机器学习领域有多年工作经验,包括异常检测,根因定位,大语言模型等。在去年的 Aiops 智能运维挑战赛 2023 上,以“SRE-Copliot:基于大语言模型的智能运维架构”方案获得冠军,在本次会议中,他将介绍最新的实践经验。


陈鑫(神秀),「下一代生产力工具」分论坛出品人 &演讲嘉宾,阿里云云效、通义灵码产品技术负责人,致力于企业研发效率、产品质量、DevOps 方向研究和探索。2011 年加入阿里,带领过大数据测试团队、测试工具研发团队、研发平台团队。对研发协同、测试、交付、运维领域都有很深的见解。目前正在带领团队向云原生、极致效率、智能化等领域进行持续演进。


吴玮琦,「下一代生产力工具」分论坛演讲嘉宾,百度工程效能部高级研发工程师 负责智能代码助手 Comate 客户端、云开发平台 iCoding 等代码服务研发工作,参与文心一言代码相关能力数据建设。他将分享的题目是《智能研发经验及 Comate 开放平台》。


茹炳晟,「效能工程新时代」分论坛出品人,腾讯 Tech Lead,腾讯研究院特约研究员,中国计算机学会 (CCF)TF 研发效能 SIG 主席,中国通信标准化协会 TC608 云计算标准和开源推进委员会云上软件工程工作组副组长,“软件研发效能度量规范“标准核心编写专家,中国商业联合会互联网应用技术委员会智库专家,多本技术畅销书作者,著作有《测试工程师全栈技术进阶与实践》《软件研发效能提升之美》《多模态大模型技术原理与实战》《高效自动化测试平台: 设计与开发实战》《软件研发效能提升实践》和《软件研发效能权威指南》等,译作有《持续架构实践》和《现代软件工程》等。公众号“茹炳晟聊软件研发”主理人。


张宇辰,「效能工程新时代」分论坛演讲嘉宾,毕业于上海交通大学,毕业后一直在互联网研发领域工作。曾经在网易有道任职,自 2012 年开始在猿辅导,担任过前端工程师、服务端工程师、业务研发经理、基础架构负责人等多种不同职能角色。对于前后端软件开发、技术管理有着丰富经验。他将分享《If It Hurts, Do It More Often ——Motiff 的主干开发实践》。


唐辉,「效能工程新时代」分论坛演讲嘉宾,百度资深工程师,2017 年加入百度,2019 年带领 10+ 同学从 0 到 1 建设云上百度,完成统一账户权限、统一 Console、预算管理、透明账单等混合云能力建设,达成公司三年上云的战略目标。2023 年随着大模型的发展,开始负责 DevOps 产品的智能化建设,目前百度内周渗透用户超过 60%。此外,在微前端、性能优化、体验优化、To B 多版本管理等方向有深入探索和落地。他将分享《大模型赋能 DevOps,研发全环节提速》。


朱宏宝,「效能工程新时代」分论坛演讲嘉宾,字节跳动客户端测试技术专家,十余年软件测试与技术管理工作经验,有服务端、移动端业务测试,近几年主要从事效能平台工具开发,负责过多个公司级效能平台从 0-1 建设。曾就职于贝壳找房、滴滴出行、京东等公司。目前就职于字节跳动,负责移动端智能化测试建设。他将分享《字节移动端智能化测试实践》。


【活动推荐】

 为了提供更丰富多元的交流平台,QCon 全球软件开发大会将不再局限于传统的分享与研讨模式,而是全面整合为集技术分享、深度研讨和前沿展览于一体的综合性会展活动,并正式更名为【QCon 全球软件开发大会暨智能软件开发生态展】。

同时,会议正式改期为:2024 年 4 月 11-13 日,地点:北京·国测国际会议会展中心。


会议现已进入 8 折早鸟购票阶段,错失 7 折特惠的朋友们,可以联系票务经理 17310043226 。点击此处了解大会更多详情,期待与各位开发者现场交流。

2024-02-23 17:559961

评论 1 条评论

发布
用户头像
在讨论LLM和多Agent在运维领域的实践时, 我们很容易忽视了一点:技术的进步和运用并非一蹴而就。从历史的角度来看,人工智能的发展正像莱布尼茨概念记号的提出,初始不被理解,却为后来逻辑编程奠定基石。运维领域利用AI来提高效率和预测性维护,本是技术发展过程中自然而然的进步。而大模型的运用更是提出了新的解决方案。如同任何技术革新,其真正价值和潜能往往需要时间来验证并优化。
2024-02-27 10:50 · 北京
回复
没有更多了
发现更多内容

2025 中国算力大会精彩回顾: 算力驱动未来,液冷引领革新

GPU算力

英伟达 GPU算力 AI算力 中国算力大会 国产GPU

开源能源管理系统:能源转型时代的民主化革命

开源能源管理系统

开源 开源能源管理系统

AI界的“超能力”MCP,到底是个啥?

Comate编码助手

#AI编程 MCP 文心快码 文心快码Zulu

一文看清:各类机器人在不同领域的应用与发展

Techinsight

MyEMS:开源技术驱动下的能源管理智能化革新者

开源能源管理系统

开源 开源能源管理系统

全栈AI驱动!华为云云容器引擎CCE智能助手焕新升级

华为云原生团队

云计算 容器 云原生 CCE

如何提升项目并发性能?

秃头小帅oi

两周开发量,两小时完成!飞算JavaA电商微服务极速开发实战

飞算JavaAI开发助手

小猪考试系统详细介绍

微擎应用市场

自研 OR 外采低代码,软件厂商如何选择?

星云低代码中间件

低代码 企业管理 系统开发 采购

某头部能源集团“数据治理”到“数智应用”跃迁案例剖析

袋鼠云数栈

解决方案 指标建设 数智应用 能源企业 能源转型

编排工具升级、组织功能更新,持续优化体验|ModelWhale 版本更新

ModelWhale

智能体 和鲸 智能体编排工具

为什么说“精准理解开发者意图”是下一代AI编程工具的核心?

飞算JavaAI开发助手

🚀全新发布!CodeBuddy 插件升级 3.3,立即更新获取新功能!

CodeBuddy

告别开一堆新窗口!ChatGPT 这个「对话分支」功能,终于来了

hepingfly【gzh:和平本记】

ChatGPT

档案管理系统(源码+文档+讲解+演示)

深圳亥时科技

#开源

网上绘本馆多门店小程序系统介绍

微擎应用市场

25 万/秒写入 + 70% 硬件节省,TDengine 在首自信工业时序数据平台中的落地

TDengine

tdengine 时序数据库

AI Compass前沿速览:Kimi K2、InfinityHuman-AI数字人、3D-AI桌面伴侣、叠叠社–AI虚拟陪伴

汀丶人工智能

Karmada v1.15 版本发布!多模板工作负载资源感知能力增强

华为云原生团队

云计算 容器 云原生 Karmada

技术人必看:RPA、工业机器人与人形机器人对比

Techinsight

飞算JavaAI新功能解析:自动生成规则文件,规范与效率兼得

飞算JavaAI开发助手

NineData发布 Oracle 到 MySQL 双向实时复制,助力去 O 战略与数据回流

NineData

MySQL oracle NineData Oracle 数据同步工具 双向实时复制

KubeBlocks for MSSQL Always On AG 揭秘

小猿姐

云原生 k8s 容器化 mssql

企业级开发重构成本高?试试这款AI驱动的Java开发工具

飞算JavaAI开发助手

快递地址信息自动识别如何实现?快递鸟智能地址解析API实战解析

快递鸟

为什么传统开发工具无法解决老旧系统重构?AI给出了答案

飞算JavaAI开发助手

谙流 ASK 技术解析(一):秒级扩容

AscentStream

消息队列 消息队列架构

一笔成形,秒绘标准图!Pen Kit重构“自然书写”体验

HarmonyOS SDK

HarmonyOS NEXT HarmonyOS SDK应用服务

LLM 和多 Agent 在运维领域的落地经验|QCon_研发效能_InfoQ精选文章