NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

确定性运维受邀出席 QCon2024 分享 LLM 和 Multi-agent 在运维领域的创新实践

SRE确定性运维

  • 2024-04-13
    北京
  • 本文字数:1503 字

    阅读完需:约 5 分钟

大小:838.42K时长:04:46
确定性运维受邀出席QCon2024 分享LLM和Multi-agent在运维领域的创新实践

【摘要】 2024 年 4 月 13 日,由 InfoQ 主办的行业技术盛会——QCon 全球软件开发大会 2024 北京站正式开启,华为云 SRE AI 使能专家张曦博士受邀出席智能运维大模型专题大会,和技术爱好者分享确定性运维在 LLM 和 Multi-agent 在运维领域的实验探索经验。


2024 年 4 月 13 日,由 InfoQ 主办的行业技术盛会——QCon 全球软件开发大会 2024 北京站正式开启,华为云 SRE AI 使能专家张曦博士受邀出席智能运维大模型专题大会,和技术爱好者分享确定性运维在 LLM 和 Multi-agent 在运维领域的实验探索经验。


在数字化时代,企业和组织的 IT 系统变得越来越复杂,运维工作也变得越来越繁琐和困难。为了解决这些问题,AIOps 智能运维技术应运而生,而大模型的出现,为 AIOps 更强大的计算、决策与自学能力,极大地提升了 IT 运营的自动化和效率。


华为云SRE AI使能专家张曦博士在QCon现场分享


张曦博士从智能运维面临的挑战和痛点出发,介绍在企业运维领域应用 AIGC 的实践案例,基于确定性运维的实践经验,提出以 LLM 为中心,基于多 Agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。


大模型给企业运维带来新挑战。大模型时代,传统智能运维方案面临着很多痛点,包括扩展性有限、手动维护自动运维规则、无法有效利用专家经验和领域知识、人机交互不友好等。异常检测是智能运维的关键起点,构建面向多模态多源运维数据的异常检测基础模型,针对 Metric 数据,通过分组聚合、多维度时序特征提取、时序融合、时序聚类等技术实现高效异常检测。


基于大模型和多 Agent 相结合的运维方案。基于多 Agent 协同的编排调度,实现更全能的多模态数据异常检测基础模型, 结合多 Agent 协同完成运维主流程,异常检测->根因定位->故障分析->修复建议,且框架与算法不依赖具体特定应用场景。结合大模型实现较强的泛化能力,我们通过多个子领域 agent 协同工作,实现运维故障自动诊断和多个任务模型的编排,提升运维效率。


 大模型时代下智能运维演讲趋势展望。多 Agent 协同给智能运维带来的变化,实现真正的模块可插拔,由 Agent 自主讨论决策运维动作,选择对应运维工具,参与聊天或者代替主管 Agent 发布指令,通过大模型的强大能力,实现更高效、更主动、更直观的运维工作。


QCon现场

 确定性运维与大模型 构建稳定可靠的数字化场景


稳定可靠是企业的“生命线”,基于内部实践的“确定性运维”能力体系,华为云与业界同行积极开展互动,吸取各家云上客户意见,梳理出一套能力成熟度模型,给更多处于数字化转型期的企业参考,梳理和识别痛点/短板,制定自身的运维变革目标和转型措施。面向企业构建运维体系和能力,帮助企业持续提升系统可用性,协助客户完成运维变革,实现从“基本运维”能力迈向“确定性运维”能力的转变。


面对大模型等技术的发展,推动企业共建开放生态的合作。华为云构筑开面向全球客户,推出华为云维享会(确定性运维经验交流分享会),未来维享会将举行多种形式的交流活动,与会员共论业务上云后的管理之道,联合会员共创,编写专刊、白皮书和案例集等内容,碰撞行业前沿资讯,加快业务创新。


在未来,面对运维大模型,未来趋势将是以自动化、智能化、可视化和平台化为核心,通过确定性运维体系及实践经验,结合大模型提供智能化的决策,支持和自动化的执行能力,助力提升系统的稳定性、可用性和性能,为企业的业务发展提供有力保障,推动企业运维组织变革,加速数字化转型。


张曦博士简介:犹他州立大学统计学博士,研究方向为 AI for Data、AI for BI、AIOps,时间序列分析等;具有丰富的人工智能在企业场景落地应用的成功经验,应用场景覆盖营、销、服、供、采、制、研发等多领域,支撑华为集团多个业务应用 +AI,带领团队成功攻克 5+ 企业技术难题,并主导发布多个 AI 服务。


原文链接:https://bbs.huaweicloud.com/blogs/425612


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-04-13 14:564712

评论

发布
暂无评论

自动化,怎么能少了性能测试

SoFlu软件机器人

受信通院之邀出席全球信息系统稳定性峰会,数列技术实力再获认可

TakinTalks稳定性社区

架构训练营毕业总结

Geek_16d2b8

架构训练营

如何用 Serverless 低成本打造个人专属网盘?

阿里巴巴云原生

阿里云 Serverless 云原生 网盘 低成本

精巧的Boyer-Moore投票算法

皓月

算法

关于一家企业的成长性评价,其评价维度都有哪些?

企评家

企业 分析 成长性 评价 企业成长性分析

nginx配置系列(一)nginx配置语法解读

乌龟哥哥

4月月更

堪称完美的SQL调优笔记居然是百万年薪阿里P8大佬熬肝纯手打,内容简直太香

Java架构追梦

Java 程序员 java面试 后端开发

恒源云(Gpushare)_模块化oss数据上传小技巧

恒源云

深度学习 GPU服务器

被裁后半月面试8家公司无果,凭借这份Java面试指南成功入职阿里

Java全栈架构师

程序员 JVM 高并发 架构师 java面试

企业团队协同软件,SaaS模式产品快速增长

小炮

SaaS 企业团队协同

架构训练营模块九作业

Geek_16d2b8

架构训练营

知乎疯传3W次,堪称最强Java面试题,顺利拿下京东T5的35K*16 薪 Offer...

Java架构追梦

程序员 java面试 offer 后端开发

字节”再次起跳!内部651页剖析HotSpot 源码手册,GitHub开源

Java架构追梦

Java 程序员 后端开发 字节

2022年短视频电商品牌营销专题—手机品牌抖音营销分析报告

Geek_2d6073

宜搭小技巧|巧用审批按钮,流程随心流转

一只大光圈

低代码 数字化 钉钉宜搭

热烈欢迎金蝶云·苍穹正式入驻 InfoQ 写作社区!

金蝶云·苍穹

易观分析发布:证券类APP用户体验指数评测框架

易观分析

证券app

张文骁:游戏开发的“零件人”梦碎之后|OneFlow U

OneFlow

利器解读!Linux 内核调测中最最让开发者头疼的 bug 有解了|龙蜥技术

OpenAnolis小助手

开源 内存 技术分享 内核 龙蜥大讲堂

KMRE 再升级!你们想要的功能它来了~

优麒麟

开源 软件 安卓 优麒麟 KMRE

腾讯云百万容器镜像安全治理运营实践

腾讯安全云鼎实验室

安全服务

聚焦新基建,企业如何实现供应链管理再升级?

数商云

产业互联网 新基建 供应链

恒源云(Gpushare)_社区小伙伴的技术小闲谈

恒源云

深度学习 算法

区块链合约安全系列(一)公链合约权限校验引发的严重安全问题

BSN研习社

区块链

编程好习惯

源字节1号

软件开发

【今晚19点】关于论文复现赛,你想知道的都在这里啦!

OpenI启智社区

PaddlePaddle 论文复现

华为云持续快速增长 践行“深耕数字化,一切皆服务”

科技热闻

阿里云EMAS旗下低代码平台Mobi开放定向内测

移动研发平台EMAS

阿里云 低代码 公有云 研发工具 全端

云原生小课堂 | 一文入门性能凶悍的开源分析数据库ClickHouse

York

数据库 开源 容器 云原生 Clickhouse

企评家|上海星光电影股份有限公司成长性报告简述文章

企评家

大数据 企业 企业评价 企业大数据 企业成长性

确定性运维受邀出席QCon2024 分享LLM和Multi-agent在运维领域的创新实践_AI&大模型_InfoQ精选文章