写点什么

LLM 和多 Agent 在运维领域的落地经验|QCon

邓艳琴

  • 2024-02-23
    北京
  • 本文字数:2567 字

    阅读完需:约 8 分钟

大小:1.30M时长:07:33
LLM 和多 Agent 在运维领域的落地经验|QCon

在数字化时代,企业和组织的 IT 系统变得越来越复杂,运维工作也变得越来越繁琐和困难。为了解决这些问题,AIOps 智能运维技术应运而生,而大模型的出现,为 AIOps 更强大的计算、决策与自学能力,极大地提升了 IT 运营的自动化和效率。在大模型的加持下,新时代的智能运维方案具有以下优点:

  • 学习与适应:大模型能从数据中学习并适应环境变化,及时识别并调整模型以应对 IT 运营数据中的微妙变动。

  • 预测性分析:通过对历史数据的深度分析,大模型能够预测未来 IT 运营趋势,提前预警潜在系统故障。

  • 自然语言处理:大模型能够理解人类语言,实现自然高效的互动,如解读用户对系统性能问题的反馈,并推测可能原因。

  • 自动决策:面对复杂的 IT 问题时,大模型能够综合考量多个变量,计算最佳解决方案并实时执行,实现问题自动解决。

  • 端到端自动化:大模型可实现从问题发现到解决方案确定再到实施的全流程自动化,从而提升生产力并减少人工干预需求。

  • 异常检测:通过深入分析历史趋势和性能指标,大模型能敏锐捕捉到不易被人类察觉的异常现象。


华为在 LLM 和 Multi-agent 在运维领域的实验探索有了不错的经验,即将与 4 月 11-13 日举办的 QCon 全球软件开发大会暨智能软件开发生态展邀请到华为集团 IT 平台服务部算法科学家张曦博士前来分享。她是犹他州立大学统计学博士,研究方向为 AI for Data、AI for BI、AIOps,时间序列分析等;具有丰富的人工智能在企业场景落地应用的成功经验,应用场景覆盖营、销、服、供、采、制、研发等多领域,支撑华为集团 600+ 业务应用 +AI,带领团队成功攻克 5+ 企业技术难题,并主导发布多个 AI 服务。


她将从智能运维面临的挑战和痛点出发,介绍在企业运维领域应用 AIGC 的实践案例,提出以 LLM 为中心,基于多 Agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。



该方案亮点突出,可实现多 Agent 协同完成运维主流程,异常检测->根因定位->故障分析->修复建议,且框架与算法不依赖具体特定应用场景,结合大模型实现较强的泛化能力


并且,如果你也对运维领域如何有效抑制大模型幻觉,提升问题处理的准确率,如何将传统运维积累和沉淀的海量知识快速激活,结合大模型相关能力有效解决运维问题等相关话题感兴趣,欢迎听取张曦博士的分享。


围绕着“效能”,本届大会策划了多个相关分论坛,邀请了多位业界知名大咖前来交流。


柯旻,「智能运维大模型」分论坛出品人,字节跳动基础架构 SRE 负责人,负责整体字节跳动基础架构全球相关基础组件产品的稳定性、成本优化、运维产品开发、智能运维等相关工作。


王宁,「智能运维大模型」分论坛演讲嘉宾,北京大学统计硕士,字节跳动基础架构 SRE 数据化方向技术专家,关注稳定性,成本与效率。在智能运维 aiops 和机器学习领域有多年工作经验,包括异常检测,根因定位,大语言模型等。在去年的 Aiops 智能运维挑战赛 2023 上,以“SRE-Copliot:基于大语言模型的智能运维架构”方案获得冠军,在本次会议中,他将介绍最新的实践经验。


陈鑫(神秀),「下一代生产力工具」分论坛出品人 &演讲嘉宾,阿里云云效、通义灵码产品技术负责人,致力于企业研发效率、产品质量、DevOps 方向研究和探索。2011 年加入阿里,带领过大数据测试团队、测试工具研发团队、研发平台团队。对研发协同、测试、交付、运维领域都有很深的见解。目前正在带领团队向云原生、极致效率、智能化等领域进行持续演进。


吴玮琦,「下一代生产力工具」分论坛演讲嘉宾,百度工程效能部高级研发工程师 负责智能代码助手 Comate 客户端、云开发平台 iCoding 等代码服务研发工作,参与文心一言代码相关能力数据建设。他将分享的题目是《智能研发经验及 Comate 开放平台》。


茹炳晟,「效能工程新时代」分论坛出品人,腾讯 Tech Lead,腾讯研究院特约研究员,中国计算机学会 (CCF)TF 研发效能 SIG 主席,中国通信标准化协会 TC608 云计算标准和开源推进委员会云上软件工程工作组副组长,“软件研发效能度量规范“标准核心编写专家,中国商业联合会互联网应用技术委员会智库专家,多本技术畅销书作者,著作有《测试工程师全栈技术进阶与实践》《软件研发效能提升之美》《多模态大模型技术原理与实战》《高效自动化测试平台: 设计与开发实战》《软件研发效能提升实践》和《软件研发效能权威指南》等,译作有《持续架构实践》和《现代软件工程》等。公众号“茹炳晟聊软件研发”主理人。


张宇辰,「效能工程新时代」分论坛演讲嘉宾,毕业于上海交通大学,毕业后一直在互联网研发领域工作。曾经在网易有道任职,自 2012 年开始在猿辅导,担任过前端工程师、服务端工程师、业务研发经理、基础架构负责人等多种不同职能角色。对于前后端软件开发、技术管理有着丰富经验。他将分享《If It Hurts, Do It More Often ——Motiff 的主干开发实践》。


唐辉,「效能工程新时代」分论坛演讲嘉宾,百度资深工程师,2017 年加入百度,2019 年带领 10+ 同学从 0 到 1 建设云上百度,完成统一账户权限、统一 Console、预算管理、透明账单等混合云能力建设,达成公司三年上云的战略目标。2023 年随着大模型的发展,开始负责 DevOps 产品的智能化建设,目前百度内周渗透用户超过 60%。此外,在微前端、性能优化、体验优化、To B 多版本管理等方向有深入探索和落地。他将分享《大模型赋能 DevOps,研发全环节提速》。


朱宏宝,「效能工程新时代」分论坛演讲嘉宾,字节跳动客户端测试技术专家,十余年软件测试与技术管理工作经验,有服务端、移动端业务测试,近几年主要从事效能平台工具开发,负责过多个公司级效能平台从 0-1 建设。曾就职于贝壳找房、滴滴出行、京东等公司。目前就职于字节跳动,负责移动端智能化测试建设。他将分享《字节移动端智能化测试实践》。


【活动推荐】

 为了提供更丰富多元的交流平台,QCon 全球软件开发大会将不再局限于传统的分享与研讨模式,而是全面整合为集技术分享、深度研讨和前沿展览于一体的综合性会展活动,并正式更名为【QCon 全球软件开发大会暨智能软件开发生态展】。

同时,会议正式改期为:2024 年 4 月 11-13 日,地点:北京·国测国际会议会展中心。


会议现已进入 8 折早鸟购票阶段,错失 7 折特惠的朋友们,可以联系票务经理 17310043226 。点击此处了解大会更多详情,期待与各位开发者现场交流。

2024-02-23 17:559487

评论 1 条评论

发布
用户头像
在讨论LLM和多Agent在运维领域的实践时, 我们很容易忽视了一点:技术的进步和运用并非一蹴而就。从历史的角度来看,人工智能的发展正像莱布尼茨概念记号的提出,初始不被理解,却为后来逻辑编程奠定基石。运维领域利用AI来提高效率和预测性维护,本是技术发展过程中自然而然的进步。而大模型的运用更是提出了新的解决方案。如同任何技术革新,其真正价值和潜能往往需要时间来验证并优化。
2024-02-27 10:50 · 北京
回复
没有更多了
发现更多内容

HarmonyOS—UI开发性能提升的推荐方法

HarmonyOS开发者

HarmonyOS

HarmonyOS—使用Web组件加载页面

HarmonyOS开发者

HarmonyOS

HarmonyOS扫码服务,应用服务一扫直达打造系统级流量新入口

HarmonyOS SDK

HarmonyOS HMS Core

数智融合 升级底座,用友iuap助力大型企业驾驭数智未来

用友BIP

数智化底座 2023全球商业创新大会

企服大模型,加速AI场景落地

用友BIP

YonGPT 企服大模型

存储方案作为产品——Midgard探索

百度Geek说

数据治理 数据编排 储存 企业号 8 月 PK 榜

开放同飞,华为云发布盘古大模型全域协同生态

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 8 月 PK 榜 华为云盘古大模型

MES在人工智能方面的应用

万界星空科技

人工智能 MES系统

谁家面试往死里问 Swagger 啊?

程序员小富

Java springboot

直播程式源码平台细讲HTTP协议:超文本传输

山东布谷科技

软件开发 HTTP 数据传输 直播程式源码 超文本传输协议

火山引擎ByteHouse:ClickHouse如何保证海量数据一致性

字节跳动数据平台

数据库 大数据 云原生 数仓 企业号 8 月 PK 榜

祝贺!Databend Cloud 和阿里云 PolarDB 达成认证

Databend

百度文心一率先言向全社会开放 应用商店搜“文心一言”可直接下载

飞桨PaddlePaddle

人工智能 文心一言

Microsoft Remote Desktop for Mac 远程连接工具推荐

胖墩儿不胖y

远程连接 微软远程桌面连接工具 Mac软件推荐 远程连接工具

Java单元测试及常用语句

java易二三

Java 编程 程序员 计算机

独家首发!openEuler 主线集成 LuaJIT RISC-V JIT 技术

openEuler

lua Linux 操作系统 openEuler risc-v

软件测试/测试开发丨文件上传与弹窗处理 学习笔记

测试人

Python 程序员 软件测试 自动化测试 测试开发

NFT 数据基础设施 NFTScan 为万向区块链周黑客松开发者提供多链 NFT API 数据支持!

NFT Research

谭中意 | 百模大战方酣,AI 开源亮剑

开源雨林

人工智能 开源 开放原子开源基金会 多模态

深度 | 突破AI大模型工业化开发,生成式AI迎来全链条服务商

澳鹏Appen

人工智能 数据标注 大模型 生成式AI LLM

LLM 和多 Agent 在运维领域的落地经验|QCon_研发效能_InfoQ精选文章