亮网络解锁器,解锁网络数据的无限可能 了解详情
写点什么

确定性运维受邀出席 QCon2024 分享 LLM 和 Multi-agent 在运维领域的创新实践

SRE确定性运维

  • 2024-04-13
    北京
  • 本文字数:1503 字

    阅读完需:约 5 分钟

大小:838.42K时长:04:46
确定性运维受邀出席QCon2024 分享LLM和Multi-agent在运维领域的创新实践

【摘要】 2024 年 4 月 13 日,由 InfoQ 主办的行业技术盛会——QCon 全球软件开发大会 2024 北京站正式开启,华为云 SRE AI 使能专家张曦博士受邀出席智能运维大模型专题大会,和技术爱好者分享确定性运维在 LLM 和 Multi-agent 在运维领域的实验探索经验。


2024 年 4 月 13 日,由 InfoQ 主办的行业技术盛会——QCon 全球软件开发大会 2024 北京站正式开启,华为云 SRE AI 使能专家张曦博士受邀出席智能运维大模型专题大会,和技术爱好者分享确定性运维在 LLM 和 Multi-agent 在运维领域的实验探索经验。


在数字化时代,企业和组织的 IT 系统变得越来越复杂,运维工作也变得越来越繁琐和困难。为了解决这些问题,AIOps 智能运维技术应运而生,而大模型的出现,为 AIOps 更强大的计算、决策与自学能力,极大地提升了 IT 运营的自动化和效率。


华为云SRE AI使能专家张曦博士在QCon现场分享


张曦博士从智能运维面临的挑战和痛点出发,介绍在企业运维领域应用 AIGC 的实践案例,基于确定性运维的实践经验,提出以 LLM 为中心,基于多 Agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。


大模型给企业运维带来新挑战。大模型时代,传统智能运维方案面临着很多痛点,包括扩展性有限、手动维护自动运维规则、无法有效利用专家经验和领域知识、人机交互不友好等。异常检测是智能运维的关键起点,构建面向多模态多源运维数据的异常检测基础模型,针对 Metric 数据,通过分组聚合、多维度时序特征提取、时序融合、时序聚类等技术实现高效异常检测。


基于大模型和多 Agent 相结合的运维方案。基于多 Agent 协同的编排调度,实现更全能的多模态数据异常检测基础模型, 结合多 Agent 协同完成运维主流程,异常检测->根因定位->故障分析->修复建议,且框架与算法不依赖具体特定应用场景。结合大模型实现较强的泛化能力,我们通过多个子领域 agent 协同工作,实现运维故障自动诊断和多个任务模型的编排,提升运维效率。


 大模型时代下智能运维演讲趋势展望。多 Agent 协同给智能运维带来的变化,实现真正的模块可插拔,由 Agent 自主讨论决策运维动作,选择对应运维工具,参与聊天或者代替主管 Agent 发布指令,通过大模型的强大能力,实现更高效、更主动、更直观的运维工作。


QCon现场

 确定性运维与大模型 构建稳定可靠的数字化场景


稳定可靠是企业的“生命线”,基于内部实践的“确定性运维”能力体系,华为云与业界同行积极开展互动,吸取各家云上客户意见,梳理出一套能力成熟度模型,给更多处于数字化转型期的企业参考,梳理和识别痛点/短板,制定自身的运维变革目标和转型措施。面向企业构建运维体系和能力,帮助企业持续提升系统可用性,协助客户完成运维变革,实现从“基本运维”能力迈向“确定性运维”能力的转变。


面对大模型等技术的发展,推动企业共建开放生态的合作。华为云构筑开面向全球客户,推出华为云维享会(确定性运维经验交流分享会),未来维享会将举行多种形式的交流活动,与会员共论业务上云后的管理之道,联合会员共创,编写专刊、白皮书和案例集等内容,碰撞行业前沿资讯,加快业务创新。


在未来,面对运维大模型,未来趋势将是以自动化、智能化、可视化和平台化为核心,通过确定性运维体系及实践经验,结合大模型提供智能化的决策,支持和自动化的执行能力,助力提升系统的稳定性、可用性和性能,为企业的业务发展提供有力保障,推动企业运维组织变革,加速数字化转型。


张曦博士简介:犹他州立大学统计学博士,研究方向为 AI for Data、AI for BI、AIOps,时间序列分析等;具有丰富的人工智能在企业场景落地应用的成功经验,应用场景覆盖营、销、服、供、采、制、研发等多领域,支撑华为集团多个业务应用 +AI,带领团队成功攻克 5+ 企业技术难题,并主导发布多个 AI 服务。


原文链接:https://bbs.huaweicloud.com/blogs/425612


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-04-13 14:564764

评论

发布
暂无评论

2021 年网易云音乐实时计算平台发展和挑战

Apache Flink

大数据 flink

代码覆盖率在敏捷式软件开发过程中的实践

爱奇艺技术产品团队

“我985毕业生,凭什么和你专科生在一起,android工程师面试题目和答案

android 程序员 移动开发

“新常态”下的Android程序员要面对哪些压力,app架构图怎么做

android 程序员 移动开发

“你们程序员不就是修电脑的吗,你牛什么牛,成功跳槽百度工资从15K涨到28K

android 程序员 移动开发

腾讯看点基于 Flink 构建万亿数据量下的实时数仓及实时查询系统

Apache Flink

大数据 flink

「正确」的使用Kotlin Flow进行搜索优化,安卓软件开发

android 程序员 移动开发

【 Flutter 手势探索】我的第二本小册来了,看完我工资从12K变成了20K

android 程序员 移动开发

[译]使用 MODEL-VIEW-INTENT 第四部分 — 独立 UI 组件

android 程序员 移动开发

Apache Flink 在汽车之家的应用与实践

Apache Flink

大数据 flink

架构实战营 - 毕业总结

Julian Chu

英国顶级电影调色公司FilmLight发布爱奇艺定制母版渲染标准模版

爱奇艺技术产品团队

“离开公司,你什么都不是,2021Android目前最稳定和高效的UI适配方案

android 程序员 移动开发

薪水被应届生倒挂,四年Java老鸟,28岁的我裸辞了,在闭关三个后拿到阿里Offer

收到请回复

程序员 java面试 Java后端

爱奇艺自研QAV1编码器,将在4K高清画质为用户节省36.6%的流量

爱奇艺技术产品团队

鸿蒙应用开发:如何与组件库(Glide)衔接?

ZEGO即构

鸿蒙 组件库

“你们Android的程序员不就是敲点代码吗,凭啥工资这么高

android 程序员 移动开发

GaussDB的技术发展以及在金融核心数据库国产化的最佳实践丨DAMS峰会

华为云数据库小助手

GaussDB 大会 华为云数据库

【Android Jetpack高手日志】ViewModel 从入门到精通,kotlin中文文档

android 程序员 移动开发

数字化工具是数字化转型很好的切入点,但是千万不要只见树木不见森林|DBT How

三少爷的见

数字化转型 数字化

[译]内存泄露的八种花样(1),音视频开发工程师前景

android 程序员 移动开发

_带你了解腾讯开源的多渠道打包技术 VasDolly源码解析,2021移动开发者未来的出路在哪里

android 程序员 移动开发

[译]内存泄露的八种花样,app优化的内容及策略

android 程序员 移动开发

顺丰科技 Hudi on Flink 实时数仓实践

Apache Flink

大数据 flink

10倍加速!爱奇艺超分辨模型加速实践

爱奇艺技术产品团队

借助 Flink 与 Pulsar,BIGO 打造实时消息处理系统

Apache Flink

大数据 flink

『Android 技能篇』优雅的转场动画之 Transition,kotlin安卓开发教程视频

android 程序员 移动开发

官宣|Apache Flink 1.14.0 发布公告

Apache Flink

大数据 flink

“终于懂了“系列,android直播面试题

android 程序员 移动开发

【9月Android面经分享】惜挂阿里三面,Android最新实习面试经验总结

android 程序员 移动开发

“主动离职公司还给n+1,android学生管理系统项目视频

android 程序员 移动开发

确定性运维受邀出席QCon2024 分享LLM和Multi-agent在运维领域的创新实践_AI&大模型_InfoQ精选文章